All streams
Search
Write a publication
Pull to refresh
24
105.7
Андрей Пешков @runaway_llm

User

Send message

Гемини однозначно скучнее в простом диалоге, но если попросить написать рассказ, стихи или сценарий - выдает очень достойный результат.

Я сам активно пользуюсь Gemini и как минимум галлюционирует она сильно меньше гпт (с клодом работал совсем мало).

Если будет свободное время и еще не читали, то обязательно почитайте блог на сайте Anthropic - они в последнее время изучают нейросети не как программы, а так, как нейробиологи и психологи изучают человеческий мозг. Тема галлюцинаций и откровенного вранья LLM у них размазана по нескольким статьям, что вспомнил сейчас:
1. У ИИ есть защитный механизм не отвечать на вопросы, на которые они не знают ответа, но иногда они проходят этот фильтр, если видят какой-то кусочек информации, который им известен (даже если это просто знакомое имя)
2. Рассуждающие модели настолько натренированы на то, чтобы быть полезными, что иногда просто не могут остановиться и генерят ответ даже в том случае, когда его не знают.
3. Те же рассуждающие модели настолько стремятся к достижению результата, что могут привирать в своей цепочке рассуждений, лишь бы результат "засчитали".

Раскатал уже - бесплатные лимиты у них намного выше, чем у ChatGPT (слышал о 500 запросах в день к 2.5 Flash и 25 запросах к Pro), а 20-долларовая Advanced-подписка практически безлимитная. И в целом активно работают над привлечением - предлагают бесплатный месяц, на днях вот запустили акцию с четырьмя бесплатными месяцами по реферальной ссылке от существующего пользователя.

Хитрость скорее в том, что ChatGPT еще долго будет чем-то вроде Xerox для AI - я постоянно интересуюсь у совершенно разных людей, как они используют ИИ, и вижу, что в 80% случаев пользуются именно ChatGPT и даже не представляют, что есть другие модели. Полагаю, Google здесь нужно привлекать аудиторию через другие свои сервисы, вроде поиска (AI-поиск уже тестово запущен в США) или тех же документов. xAI от Илона Маска очень успешно интегрировала Grok как сервис для быстрых справок ответов в X. В OpenAI кстати тоже поговаривают о своей соцсети, понимая, что одним ИИ-сервисом не ограничишься.

Information

Rating
69-th
Registered
Activity

Specialization

Content Director
Lead
Project management
Planning
Strategic planning
Building a team
Budgeting projects
Organization of business processes