Pull to refresh

Comments 9

У меня такое ощущение, что я недавно это читал

Upd: А... Это самоцитирование вашей статьи о chatgpt 5.0

Ставить ссылку на тг-канал в начале предложения — даже для меня перебор. Можно скромненько в конце статьи хотя бы)

Представьте флоу читателя. Он открывает статью, чтобы начать её читать. А вы его сразу в тг отправляете

Да и минусов нахватаете за такое, даже если контент полезный

Llama оскандалился с накруткой рейтинга и вначале был забанен на lmarena (был в списках как deprecated) а затем рейтинг его был кастрирован свежими настройками системы оценки.

O3 pro у меня никак не получается протестировать. Говорят, он хорош для большого исходного контекста, лучше дать ему весь репозиторий.

Но в целом я всё больше разочарован. Максимум стабильно получается задача строк на 200. Пробовал задачу на 1-2 тысячи строк (парсинг со сложной логикой) - приходится самому определять типы (20 типов) и сигнатуры функций (20-30). Ну а дальше реализовать я и сам могу. Тем более, что LLM слишком часто воображают несуществующие методы в библиотеках.

Первая — рейтинг ИИ от ресурса LMArena.

Не вижу в рейтинге наших главных импортозаменителей, Сбер и Яндекс. Как их ИИ выглядят на фоне тех, что в рейтинге? Только без мата, плиз)

Как чатботы для экосистем Яндекса и Сбера они вполне годятся. Как конкуренты ведущим LLM от мировых производителей - нет. Для тренировки передовых моделей требуются кластеры, официальная стоимость которых перевалила за миллиарды долларов, плюс мы попадаем под санкции и карты ввозятся серыми каналами, а это еще надбавка к цене.

Здесь я бы ждал китайцев, которые под санкциями нас не держат. Huawei уже создал вполне рабочий Ascend 910, а на заводе компании проходит обкатку прототип EUV-сканера, который позволит достичь техпроцессов ниже 7нм. Ну а параллельно развивал энергетику - по прогнозам Альтмана и Маска, в какой-то момент возникнет ситуация, когда мощность ИИ будет эквивалентна энергии, которую мы готовы ему выделить.

А вроде как DeepSeek гораздо меньше ест ресурсов, нет?

Опеай давно не пользуюсь, но вот гемени 2.5 это вещь. И в кодинге на голову лучше клауда 4. И канвас аналог артефактов в клауда. И генерация речи и имеджген и видео.

Это устаревший формат. У вас цены компании нет и какой прирост капитала и народа. Нет информации о новых библиотеках и или устранения количества ошибок. В целом такую стряпню читать на таком хорошем сайте не имеет смысла.

А если нет обзора о стоимости ( падение стоимости или в случае нко - получение грантов или объём спонсорской помощи ) , то и "достижения" сомнительные ( мягко сказано ), вот.

Sign up to leave a comment.

Articles