OpenAI известна как разработчик ChatGPT. Компания задумывалась как некоммерческий проект и привлекла около 10 млрд долларов инвестиций только от Microsoft и прошла интересный путь от открытого исходного кода к почти полной секретности и скандалам. В 2023 году ее объявили компанией года (включая нас самих), а ее глава Сэм Альтман стал гендиректором года. Благодаря вложениям в OpenAI ее ключевой инвестор-Microsoft обогнал Apple по капитализации.
OpenAI заявляет своей миссией создание искусственного интеллекта для общего блага, ограничивает доходность своих инвесторов и продолжает активно проводить исследования и разработки. Разбираемся в интеллектуальной собственности этой во всех смыслах примечательной компании.
История: некоммерческий проекта и сотрудничество с Microsoft
OpenAI была основана в 2015 году выходцами из Силиконовой долины, в том числе Илоном Маском. Учредители проекта инвестировали в него миллиард долларов на первом этапе, но выбрали организационно-правовую форму некоммерческой компании. Миссией было заявлено создавать искусственный интеллект, который мог бы принести пользу всему миру.
В 2016 году OpenAI запустили платформу Gym, которая позволяла разрабатывать системы обучения ИИ с подкреплением и сравнивать их. В том же году была выпущена платформа для обучения интеллектуальных агентов (программы, выполняющие задачи пользователя длительное время) при помощи игровых платформ и веб-сайтов.
В 2018 году из организации ушел Илон Маск. Официальной причиной стала попытка предотвратить конфликт интересов в будущем, связанный с высокой заинтересованностью Tesla в ИИ. При этом в самой OpenAI заявили, что Маск продолжил финансировать проект. Сам Илон тогда заявил о несогласии с рядом решений и критиковал компанию в дальнейшем. Он обвинил OpenAI в чрезмерной секретности и том, что организация перестала соответствовать заявленной при создании концепции некоммерческого проекта с открытым исходным кодом.
Уже в следующем году статус некоммерческой организации был утрачен официально — тогда OpenAI выпустили GPT-3. Создатели стали применять название «компания с ограниченной прибылью». Идея в том, что инвесторы при вложениях в компанию могут получить обратно не больше суммы, в 100 раз превышающей первоначальные инвестиции. Остальные деньги по идее полагающиеся инвесторам деньги должны уйти на инновации.
Для примера. Акции Amazon размещались на бирже по цене 18 долларов, а с поправкой на последующее дробление — по 1,5 доллара. В 2021 году их цена с поправкой на дробление превышала 160 долларов. Прирост получился более, чем 100-кратным. При этом это инвестиции уже на этапе IPO, в то время как инвестиции в стартапы вроде AI теоретически могут приносить прибыль в тысячи раз больше вложений.
Одним из самых значимых инвесторов стала Microsoft. Корпорация в 2019 году инвестировала в OpenAI. Считается, что инвестиции связаны с желанием техногиганта конкурировать с Google в сфере ИИ-разработок.
В 2021 году OpenAI запустили ИИ для генерации изображений и рисунков по запросу под названием Dall-E. Со временем продукты и разработки компании стали вызывать опасения из-за своего потенциала.
После запуска в 2022 году новой версии ChatGPT платформа поставила рекорд по скорости набора пользователей — миллион за пять дней. Спустя три месяца число пользователей достигло 100 миллионов.
Финансы
В конце 2023 года сообщалось, что OpenAI намерена провести новый раунд финансирования и собрать уже от 100 млрд долларов. Если идею получится реализовать, то это будет второй по стоимости стартап США после SpaceX. В январе 2023 года предприятие оценивали в 30 млрд долларов, но уже в октябре сама компания оценила в 86 млрд. Это было связано с намерением OpenAI вместо выпуска новых акций разрешить продавать имеющиеся акции сотрудников.
В августе 2023 года Reuters сообщали, что OpenAI собираются получить более миллиарда долларов выручки за счет продажи программного обеспечения для искусственного интеллекта и обеспечивающих его вычислительных мощностей. Также сообщалось, что если в 2022 году компания получила 28 млн выручки в целом, то в 2023 её выручка составляла около 80 млн долларов в месяц.
Сейчас основным акционером остается Microsoft, которой принадлежит 49% всего предприятия. Техногигант внедряет в свою поисковую систему Bing ИИ от OpenAI, чтобы конкурировать с системами Google. Если же говорить о главных бенефициарах среди бизнесменов, то это, безусловно, Билл Гейтс.
Разработки
Штат OpenAI насчитывает начало 2024 года более 450 человек, распределенных по трем основным подразделениям:
Продвижение возможностей ИИ;
Обеспечение безопасности использования и развития ИИ;
Обеспечение корректного управления системами.
К появлению GPT привели исследования компании в области использования неконтролируемого обучения для понимания искусственным интеллектом языка. В основе разработок клежит расширяемый интерфейс прикладного программирования (API), через который производится доступ ко всем отдельным продуктам и моделям. Условно основными двумя продуктами OpenAI являются GPT и DALL-E.
GPT
GPT — неконтролируемая языковая модель, которой достаточно небольшого текстового запроса для генерации большого объема текста. Система генерации при этом похожа на нейросеть человеческого мозга. Когда в 2019 году была выпущена первая модель GPT-2, в ней уже было более полутора миллиарда параметров. Для достижения высокого уровня точности оказалось достаточно обучения на 8 млн документов в интернете.
В сентябре 2020 года специально для исследовательского сообщества запустили GPT-3. Широкой общественности он был представлен только в марте 2021 года. В этой модели было уже 175 млрд параметров. Такой значимый прорыв в разработках произошёл менее чем за 9 месяцев. Для широкой аудитории GPT-3 стал удобен тем, что не требовал для взаимодействия введения какого-либо кода.
Новой моделью стал уже построенный поверх GPT-3 в 2021 году ChatGPT, обученный сочетанию текста и кода. Это довольно дорогостоящий проект, ежедневное использование которого по разным оценкам составляет 1-3 млн долларов в день. У модели много недостатков, и в конце концов OpenAI заявили, что это более консервативная модель, созданная для получения пользовательских откликов.
На основе GPT-3 также был создан OpenAI Codex, предназначенный конкретно для генерирования кода. Модель обучена на 54 репозиториях GitHub и 159 ГБ файлов Python. Компания заявляет, что эта модель более продвинута, чем GPT-3, решает чуть меньше 30% из сборника задач HumanEval и имеет 12 млрд параметров.
Другие продукты
Модель DALL-E разработана для создания изображений и впервые запущена в 2021 году. Чтобы интерпретировать запрос пользователя, DALL-E использует модель GPT-3. Сама нейросеть обучена на 400 млн пар изображений и текста.
У OpenAI есть много других продуктов, но не все из них сейчас являются ключевыми. Среди них:
Англоязычная модель распознавания речи с открытым исходным кодом Whisper, которую можно использовать для создания приложений;
Обученная на GPT-2 нейронная сеть MuseNet. Она может предсказывать последующие ноты в музыкальных произведениях и генерировать собственные композиции, включающие до 10 инструментов;
Среда для программирования OpenAI Gym. Среда для программирования на Python, которую можно использовать для совершенствования моделей обучения с подкреплением;
Имитирующая действия человека робототехника RoboSumo, которая может адаптироваться к меняющимся условиям;
Человекоподобная роботизированная рука Dactyl, которая смогла собрать кубик Рубика на 40% быстрее среднестатистического человека.
Роботизированная рука, обученная ловкости при помощи ИИ. На сайте OpenAI можно найти видео с её обучением.
OpenAI также намерена открыть свой цифровой магазин, через который будет распространять различные варианты своих продуктов.
Защита интеллектуальной собственности в OpenAI
Пока что компания не проявляет интереса к патентованию и, похоже, не имеет опубликованных патентов. Когда организация еще создавалась, её сотрудникам и разработчикам было посоветовано публиковать свои работы в качестве статей, кода, в блоге и т. д. Было заявлено, что патенты так или иначе будут открыты для всех, если и будут оформлены. Летом 2023 года организация подала заявку на регистрацию торговой марки «GPT-5».
Противоречащее идее компании решение было принято в отношении модели GPT-4. Компания продемонстрировала новую модель и её тестирование, но не раскрыла подробностей об устройстве, методах обучения и используемых для этого данных.
Организация только в декабре 2022 года подала заявку на регистрацию товарного знака GPT. К тому моменту заявки на товарные знаки ThreatGPT, MedicalGPT, DateGPT и DirtyGPT, не имеющие никакого отношения к OpenAI, были поданы другими фирмами. Компания подала заявку на ускоренную регистрацию из-за появления множества поддельных приложений, но ей было в этом отказано.
OpenAI используют для своих продуктов лицензию с открытым исходным кодом. У нее множество репозиториев с разными видами лицензий для разных моделей ИИ. Например, GPT-2 лицензируется по «модифицированной лицензии MIT», а GPT 3 — нет и по сути лицензирован исключительно для Microsoft. При этом компания видоизменяет лицензию с открытым исходным кодом таким образом, чтобы отказаться от притязаний на права на контент, созданный при помощи ИИ.
Конфликт возник из-за авторских прав на контент, который компания использовала для обучения ИИ. Например, в суд на OpenAI Microsoft на этом основании подали The New York Times, а также Маргарет Этвуд и Джордж Р.Р. Мартин. В качестве реакции организация заявила, что оплатит судебные издержки всех своих бизнес-клиентов, которые столкнуться с исками по поводу авторских прав на результаты работы ИИ. Однако это будет касаться только тех, кто использует платную версию GPT.
Позже компания обратилась в Парламент Великобритании с просьбой разрешить использовать защищенные авторским правом произведения для обучения ИИ. Также она решает конфликт об авторских правах, начав заключать соглашения с производителями контента — такие уже подписаны с Associated Press и Axel Springer. Некоторые пользователи и исследователи заметили, что изменилось и поведение ИИ-бота. Если раньше он мог выполнить просьбу продолжить текст книги, если пользователь вводил небольшой отрывок, то теперь сделать это с защищенными авторскими правами текстами не получается.
Итоги
Многие стартапы сильно изменились на пути от своей первоначальной идеи к её воплощению в жизнь. OpenAI не стала исключением, так как уже значительно противоречит замыслам своих основателей. Компания не смогла существовать в качестве некоммерческой, а теперь, похоже, будет отказываться от идей с открытым исходным кодом и, возможно, начнет активнее использовать патентную систему для защиты своих разработок. Пока что в ее портфеле только заявки на товарные знаки и лицензии. Но это пока.
Также большой удар по деятельности организации может нанести иск от The New York Times. Необходимость заключать соглашения об авторских правах с источниками данных для обучения и без того повысит стоимость и так дорогого проекта. В итоге OpenAI может потребоваться еще сильнее изменить свою структуру, подход к раскрытию данных и защите интеллектуальной собственности. Не за горами и потенциальное IPO, которое может стать самым дорогим в XXI веке.
Полезное от Онлайн Патент:
→ Что такое Реестр отечественного ПО?
→ Может ли иностранная компания внести свою программу в Реестр отечественного ПО?
→ Как IT-компаниям сохранить нулевой НДС и попасть в Реестр отечественного ПО