Pull to refresh

Google инвестировала $23 млн в аналог GitHub Copilot под названием Magic

Reading time 4 min
Views 1.8K
Google инвестировала $23 млн в стартап Magic, занимающийся созданием аналога инструмента для помощи программистам GitHub Copilot.

Проектом по созданию ИИ для программистов в Magic занимаются шесть разработчиков. Предполагается, что с помощью этого сервиса пользователи смогут писать и проверять код, искать и устранять в нём ошибки, планировать будущие изменения.

Основной упор в проекте сделан на то, что Magic общается с пользователем на простом и естественном языке, помогая вносить правки в код и разбираться в легаси коде с пояснениями и необходимыми отсылками.

В рамках пилотной версии Magic, благодаря новой архитектуре нейронных сетей, может читать и анализировать в 100 раз больше строк кода, чем сейчас умеет проект Transformer от Google Brain.

В Magic пояснили, что над проектом работает децентрализованная команда из шести разработчиков. В планах стартапа нанять ещё 19 программистов и сосредоточиться на выпуске тестовой версии продукта.

Согласно представителям отрасли, кто видел и пробовал прототип Magic, этот инструмент оказался удобным. По их словам, сервис не предлагает вставлять или использовать код, закрытый лицензиями, или указывает на источник кода и его автора при заимствовании.

В настоящее время GitHub Copilot при генерации кода использует миллиарды строк кода из общедоступных репозиториев GitHub и может преобразовывать естественный язык в фрагменты кода на десятках языков программирования. Copilot выполняет работу автоматически без должного анализа и отработки правил в лицензировании Open Source проектов, включая понимание типов лицензий GPL, Apache и MIT, которые требуют указания имени автора и определения конкретных авторских прав при использовании кода проекта.

Причём Microsoft, GitHub и OpenAI подстраховались при разработке Copilot. Нейросетевой инструмент обучен удалять любое упоминание лицензий Open Source в выдаваемом коде. Это происходит и в том случае, когда он копирует чужой код сниппетами длиннее 150 символов непосредственно из определённого репозитория. Система специально не указывает авторство исходного фрагмента кода.

Некоторые разработчики называют такой способ работы Copilot отмыванием открытого исходного кода. Они считают, что юридические последствия такого подхода должны быть определены и приняты сообществом, прежде чем использовать Copilot в коммерческих целях на постоянной основе.



  • 29 июня 2021 года Microsoft и GitHub представили инструмент для помощи программистам Copilot, работающий на базе OpenAI Codex. Решение OpenAI Codex генерирует код значительно более эффективно, чем GPT-3. Алгоритм обучали на датасете из терабайтов общедоступного кода. Copilot вышел в виде плагина редактора Microsoft Visual Studio Code и функции браузерного редактора кода GitHub Codespaces после регистрации в программе тестирования технического превью сервиса. Microsoft пояснила, что целью Copilot является упрощение жизни и повышение эффективности работы авторов программ.
  • В начале июля 2021 года разработчики стали жаловаться, что Copilot вместо нескольких строк нужного кода генерирует десятки строк с цитатами и комментариями из проектов с открытым исходным кодом. GitHub уточнила, что Copilot обычно не воспроизводит точные фрагменты кода, а создает производные работы из ранее полученных входных данных. Компания привела статистику, что это происходит лишь в 0,1% случаев.
  • После этого GitHub призналась, что при обучении Copilot разработчики использовали весь доступный в репозиториях сервиса публичный код без учёта типа лицензии.
  • В начале августе 2021 года Фонд свободного программного обеспечения (FSF) объявил о проведении исследований этических и законных вопросов работы нейросетевого помощника программиста Copilot от GitHub и Microsoft. С точки зрения FSF, сервис Copilot в его нынешнем виде неприемлем и несправедлив, так как для его использования нужна Microsoft Visual Studio или ее части кода, а этот проект не является открытым и бесплатным. Фонд СПО не знает, какой лицензией была защищена нейросеть, обученная Copilot и не понимает до конца, кому принадлежат авторские права на новый код, написанный с помощью помощника программиста, используя код из открытых репозиториев.
  • Специалисты инженерной школы Тандона Нью-Йоркского университета проверили работу Copilot на GitHub с точки зрения безопасности. Они обнаружили, что примерно в 40% случаев код, сгенерированный этим сервисом, содержит ошибки или уязвимости.
  • В сентябре 2021 года разработчики обнаружили в базе GitHub Copilot 1170 стоп-слов, которые он блокирует при формировании кода. Среди них присутствуют такие слова, как «коммунист», «либерал», «Палестина», «Израиль» и «социалист».
  • В конце октября GitHub Copilot стал доступен для работы с JetBrains (в IDE IntelliJ и PyCharm) и в редакторе кода Neovim. Ранее данный инструмент вышел в виде плагина редактора Microsoft Visual Studio Code и функции браузерного редактора кода GitHub Codespaces.
  • Также GitHub объявил о поддержке Copilot многострочного дополнения кода на таких языках, как Java, C, C++ и C#. Многострочная поддержка означает, что этот инструмент может генерировать сразу несколько строк кода самостоятельно. Copilot стал поддерживать такие языки программирования, как Python, JavaScript, TypeScript, Ruby и Go.
  • В конце марта 2022 года GitHub Copilot стал доступен в виде дополнения для Visual Studio 2022.
  • В июне GitHub сообщила, что Copilot стал доступен всем разработчикам по подписке. Бесплатно сервисом могут пользоваться только студенты и разработчики популярных проектов с открытым исходным кодом. Компания предлагает два варианта подписки: 10 долларов в месяц или 100 долларов в год. При этом можно протестировать сервис, оформив пробный период на два месяца. Студенты могут получить доступ к Copilot в виде части пакета GitHub Student Pack, а разработчикам популярных проектов с открытым исходным кодом требуется отправить запрос и GitHub предоставит инструмент бесплатно.
  • В начале июля некоммерческая организация Software Freedom Conservancy, предоставляющая поддержку и юридические услуги для разработчиков ПО с открытым исходным кодом, призвала сообщество отказаться от GitHub после запуска коммерческой версии Copilot. Для обучения разработчики использовали весь доступный в репозиториях сервиса публичный код без учёта типа лицензии. Если инструмент взял код одного проекта и предложил его автору другого проекта, суд может оценить это как нарушение авторских прав, особенно в случае получения дохода при помощи чужого кода.
  • В начале ноября 2022 года программист-юрист Мэтью Баттерик подал иск в окружной суд Калифорнии на Microsoft, GitHub и OpenAI за то, что нейросетевой помощник программиста GitHub Copilot нарушает условия лицензий Open Source проектов и ущемляет права программистов. Разработчик требует $9 млрд компенсации от американских компаний.
  • Конце января 2023 года Microsoft, GitHub и OpenAI попросили суд в США отклонить иск за нарушение лицензий Open Source и компенсации в $9 млрд за GitHub Copilot.
Tags:
Hubs:
If this publication inspired you and you want to support the author, do not hesitate to click on the button
+1
Comments 3
Comments Comments 3

Other news