Pull to refresh

Comments 21

Эволюционный вариант перехода - заморозка существующих питоновских сервисов и замещение их новыми нодовскими не рассматривали?

Рассматривали, где-то именно так и делали, но процесс шел недостаточно быстро.

Странный выбор модели, берете Qwen3-Coder-30B-A3B, если на пк норм памяти(32 или 64 гб), запускаете на ночь промт и качество для такой простой задачи может дать неплохое, или GPT-OSS-20B(побыстрее будет)

Во время моих экспериментов еще не вышли Qwen3-Coder-30B-A3B и GPT-OSS-20B. Память расходуется и на контекст, большая модель ограничивает размер доступного контекста. Целая ночь на один запуск - это достаточно долго, хотелось более оперативно проверять результат.

Стоило-бы тогда заголовок статьи переписать: "На что способны мизерные прошлогодние модели". А то статья вводит в заблуждение, во-первых, для кодинга надо все-таки бОльшие модели использовать, а во-вторых, за этот год локальные модели для программирования сильно эволюционировали и недавно вышедшие модели уже на уровне лидеров середины лета. Правда и параметров там сильно больше чем 7b, надо 128Гб памяти чтоб запустить что-то действительно достойное, на уровне проприетарных моделей весны/начала лета. А для вменяемой скорости надо столько не обычной памяти, а видеопамяти.

Просто цифры для сравнения, насколько локальные модели для кодинга эволюционировали за год. Вы использовали модель Qwen2.5 7B Instruct вообще не предназначенную для кодинга. Для кодинга у 2.5 была линейка моделей Qwen2.5-Coder, в бенчмарке по кодингу SWE Bench Verified, где модель используется с какой-то агентской программой, Qwen2.5-Coder 32B Instruct набирает 9 баллов. То есть модель того-же года, что и ваша, но в 4 раза больше размером и в отличии от вашей заточенная для кодинга выполнила только 9% задач по кодингу.

Более современная модель меньшего размера Devstral-Small-2-24B-Instruct-2512 вышедшая пару недель назад в этом-же бенчмарке набрала 56.4 балла.

Попробовал запустить с моделью Devstral-Small-2-24B-Instruct-2512 и она значительно лучше справилась с Python-проектом на ~24000 токенов. Работала почти 1,5 часа, но результат получился значительно более качественный. На данный момент, для подобных экспериментов, я бы рекомендовал эту модель или мощнее, если есть подходящая видеокарта.

Я бы начал с проверки теоретической возможности переноса и демонстрации на левом проекте и внешнем провайдере нормальных токенов а потом уже попробовал бы выбить под задачу бюджет на связку из пары серьезных но всё ещё бытовых gpu.

Ps То что ваши коллеги получили bad experience на кванте изначально слабой модели - логично

я читал статью об исследовании, что включение в промт фраз типа "Вы эксперт по переводу Python → Node.js. Действуйте как старший инженер." никакого реального преимущества в качестве ответа не даёт.

Вангую, что этот переход не имеет смысла. А то получится типа python-node-go-rust. Для нормального и качественного перевода нужны очень большие модели. Те тут больше интересно почему последний питонист сбежал :)

А по делу, питон поточность развивается сейчас активно, лупы тоже можно менять, система потоков обновилась в последней версии. Jit полноценный думаю тоже скоро добавят. Плюс для особых придирчивых добавили типизацию в py - хотя на мой взгляд это такое себе , можно было делать аннотацию через доки те py пошел по пути php(ну тайпинг давно завезли просто это усложняет читаемость языка на мой взгляд , если шо видел питон версии 2.2).

Сервисы должны быть в докерах и с мультиланг обвязкой. Тогда запустил и пусть фурычит. Плюс на мой взгляд, для конторы важна безопасность а нода тащит кучи пакетов. Есть даже пакеты из двух строчек. Если кто то случайно или намеренно обновит его как это уже было ) то можно лишиться минимум рабочего ПК а максимум сервера или поднять какую фигню в фоне).

Верно. Куда катиться мир с этим вайб кодингом, скоро будет очень просто хакать все это добро.

Уязвимости тоже можно автоматизировано искать. Для этого можно использовать LLM-агента с промптом на поиск уязвимостей в коде плюс классические SAST-инструменты.

LLM агент уязвимости в коде может и придумать, исправив то, что уже и так хорошо работало на то, что работает значительно хуже (или если повезёт - работает хотя бы так же).

Curl уже на такое наткнулись, когда им начали баг репортами спамить, которые LLM составила. Причем репорты имели отношение к актуальной и действительной кодовой базе Curl-а достаточно опосредованное

Лучшие, платные модели периодически тупят, ожидать что-то путное от 7B было очень оптимистично 8)

Попробуйте залить слепок питоновского проекта (все файлы в одном, с комментариями что это за файл) и ваш промпт в aistudio от гугла. У гемини огромный контекст, куда ваши микросервисы влезут целиком все сразу. Да и работу по конверсии он сделает качественно.

Ради эксперимента поднимать локальную LLM наверное стоит (типа смотри как могу), но если речь о реальных вещах, то эта сова на глобусе не нужна.

Вам же сразу написали, из-за чего сыр бор! Код приложений не должен уплывать за пределы организации. Потому то и используется локальная LLM.

Промнт - как понимать такие ошибки - специально против анти-иисистем или случайно?

Забавно, что на КДПВ мост ведет в никуда… символично

Очень странный выбор языка, почему не на что то более быстрое и структурированное? Зачем вообще бэк писать на JS? ( я понимаю хочется fullstack видимо, но вот верный ли это путь большой вопрос ).

Гарантируете ли полное соответствие проведённого, тому что было на питоне? Я так понимаю 100% code coverage не было же?

Сколько потребуется времени для перевода тестирования всего переведенного?

МММ, пайтоновское легаси, разработчики которого сбежали.. сейчас джаваскриптеры закинут это в ИИ агент и получится ПРОДУКТ

Sign up to leave a comment.

Information

Website
www.company.rt.ru
Registered
Founded
Employees
over 10,000 employees
Location
Россия