Comments / Profile of runaway

Андрей Пешков @runaway_llm

User

Представлена обновленная Gemini 2.5 Pro — новый топ среди языковых моделей

Гемини однозначно скучнее в простом диалоге, но если попросить написать рассказ, стихи или сценарий - выдает очень достойный результат.

Look

Представлена обновленная Gemini 2.5 Pro — новый топ среди языковых моделей

runaway_llm Jun 5 at 17:47

Я сам активно пользуюсь Gemini и как минимум галлюционирует она сильно меньше гпт (с клодом работал совсем мало).

Look

Галлюцинации LLM. А если посмотреть с точки зрения детского психолога?

runaway_llm May 19 at 14:56

Если будет свободное время и еще не читали, то обязательно почитайте блог на сайте Anthropic - они в последнее время изучают нейросети не как программы, а так, как нейробиологи и психологи изучают человеческий мозг. Тема галлюцинаций и откровенного вранья LLM у них размазана по нескольким статьям, что вспомнил сейчас:
1. У ИИ есть защитный механизм не отвечать на вопросы, на которые они не знают ответа, но иногда они проходят этот фильтр, если видят какой-то кусочек информации, который им известен (даже если это просто знакомое имя)
2. Рассуждающие модели настолько натренированы на то, чтобы быть полезными, что иногда просто не могут остановиться и генерят ответ даже в том случае, когда его не знают.
3. Те же рассуждающие модели настолько стремятся к достижению результата, что могут привирать в своей цепочке рассуждений, лишь бы результат "засчитали".

Look

Что ждать от Google I/O любителям ИИ

runaway_llm May 17 at 11:43

Раскатал уже - бесплатные лимиты у них намного выше, чем у ChatGPT (слышал о 500 запросах в день к 2.5 Flash и 25 запросах к Pro), а 20-долларовая Advanced-подписка практически безлимитная. И в целом активно работают над привлечением - предлагают бесплатный месяц, на днях вот запустили акцию с четырьмя бесплатными месяцами по реферальной ссылке от существующего пользователя.

Хитрость скорее в том, что ChatGPT еще долго будет чем-то вроде Xerox для AI - я постоянно интересуюсь у совершенно разных людей, как они используют ИИ, и вижу, что в 80% случаев пользуются именно ChatGPT и даже не представляют, что есть другие модели. Полагаю, Google здесь нужно привлекать аудиторию через другие свои сервисы, вроде поиска (AI-поиск уже тестово запущен в США) или тех же документов. xAI от Илона Маска очень успешно интегрировала Grok как сервис для быстрых справок ответов в X. В OpenAI кстати тоже поговаривают о своей соцсети, понимая, что одним ИИ-сервисом не ограничишься.

Look

1 2 3 4

Information

Specialization