Comments 9
У меня такое ощущение, что я недавно это читал
Upd: А... Это самоцитирование вашей статьи о chatgpt 5.0
Ставить ссылку на тг-канал в начале предложения — даже для меня перебор. Можно скромненько в конце статьи хотя бы)
Представьте флоу читателя. Он открывает статью, чтобы начать её читать. А вы его сразу в тг отправляете
Да и минусов нахватаете за такое, даже если контент полезный
Llama оскандалился с накруткой рейтинга и вначале был забанен на lmarena (был в списках как deprecated) а затем рейтинг его был кастрирован свежими настройками системы оценки.
O3 pro у меня никак не получается протестировать. Говорят, он хорош для большого исходного контекста, лучше дать ему весь репозиторий.
Но в целом я всё больше разочарован. Максимум стабильно получается задача строк на 200. Пробовал задачу на 1-2 тысячи строк (парсинг со сложной логикой) - приходится самому определять типы (20 типов) и сигнатуры функций (20-30). Ну а дальше реализовать я и сам могу. Тем более, что LLM слишком часто воображают несуществующие методы в библиотеках.
Первая — рейтинг ИИ от ресурса LMArena.
Не вижу в рейтинге наших главных импортозаменителей, Сбер и Яндекс. Как их ИИ выглядят на фоне тех, что в рейтинге? Только без мата, плиз)
Как чатботы для экосистем Яндекса и Сбера они вполне годятся. Как конкуренты ведущим LLM от мировых производителей - нет. Для тренировки передовых моделей требуются кластеры, официальная стоимость которых перевалила за миллиарды долларов, плюс мы попадаем под санкции и карты ввозятся серыми каналами, а это еще надбавка к цене.
Здесь я бы ждал китайцев, которые под санкциями нас не держат. Huawei уже создал вполне рабочий Ascend 910, а на заводе компании проходит обкатку прототип EUV-сканера, который позволит достичь техпроцессов ниже 7нм. Ну а параллельно развивал энергетику - по прогнозам Альтмана и Маска, в какой-то момент возникнет ситуация, когда мощность ИИ будет эквивалентна энергии, которую мы готовы ему выделить.
Опеай давно не пользуюсь, но вот гемени 2.5 это вещь. И в кодинге на голову лучше клауда 4. И канвас аналог артефактов в клауда. И генерация речи и имеджген и видео.
Это устаревший формат. У вас цены компании нет и какой прирост капитала и народа. Нет информации о новых библиотеках и или устранения количества ошибок. В целом такую стряпню читать на таком хорошем сайте не имеет смысла.
А если нет обзора о стоимости ( падение стоимости или в случае нко - получение грантов или объём спонсорской помощи ) , то и "достижения" сомнительные ( мягко сказано ), вот.
ChatGPT все еще не догнать: что происходит на ИИ-рынке к середине 2025 года?