Комментарии 3
Я понимаю еще copilot, его хоть как то можно обосновать тем, что у мелкомягких есть (почти) весь код мира и если получат доступ к коду, то утечек не будет, но тут вот прям мутная схема с выдачей всей кодовой базы, документации в обмен на возможный профит от генератора кода. И все это в сторону noname компании.
Я, пожалуй, подожду нормального selfhosted чат-бота для генерации кода, благо программисты уже готовы работать с чат ботами, а начальство готово к вложениям, если я смогу продемонстрировать что-то внятное. Но пока, увы, трудозатраты велики, а современные нейронки все еще достаточно глупы...
Как раз вот недавно, ради забавы, запускал у себя локально StarCoder2, у него размер контекста 16384 токена, это ~64Кб кода. Тестировал на C/C++. Результат.. ну не особо впечатляет. Может, просто квантизированная модель "15b_Q8_0" не так хороша, как я думал, а может я что-то делаю не так. Короче, я как-то скептически смотрю на этот хайп вокруг "генераторов кода".
Состоялся релиз Supermaven — нейросети для генерации кода с контекстным окном 300 тыс. токенов