Все потоки
Поиск
Написать публикацию
Обновить
127.58

Natural Language Processing *

Компьютерный анализ и синтез естественных языков

Сначала показывать
Порог рейтинга

Копирование текста из ChatGPT нашли в рецензируемых научных журналах

Время на прочтение3 мин
Количество просмотров16K

PubPeer

Признаки копирования из ChatGPT часты не только в школьных сочинениях, но и в серьёзных научных изданиях. Речь не про недобросовестные журналы, готовые опубликовать что угодно за деньги. Как обнаружил Гийом Кабанак, такие проколы часты даже в журналах издательства Elsevier.
Читать дальше →

xAI открыл веса и архитектуру языковой модели Grok-1

Время на прочтение3 мин
Количество просмотров15K

Иллюстрация от Midjourney

Стартап Илона Маска xAI открыл исходники языковой модели Grok-1 под лицензией Apache 2.0. В виде торрента предлагают скачать 300 ГиБ файлов с весами MoE-модели c 314 млрд параметров.
Читать дальше →

Что нового в AI за неделю?

Время на прочтение2 мин
Количество просмотров4K

Что произошло за эту неделю на рынке AI?

Маск объявил, что на этой неделе он выпустит открытый исходный код Grok

OpenAI представляет внутренний отладчик-трансформер

Cohere AI выпустила Command R для использования RAG в производственных масштабах

Читать далее

Anthropic выпустила Claude 3

Время на прочтение7 мин
Количество просмотров25K

Anthropic

Компания Anthropic представила семейство больших языковых моделей Claude 3. Три модели покрывают различные ценовые сегменты и направления:

  • Дорогая и мощная Opus предлагается для автоматизации задач, помощи в исследованиях и анализе данных.
  • Более доступную Sonnet рекомендуют для обработки данных, рекомендаций, предсказаний и парсинга текста с изображений.
  • Дешёвая модель Haiku предназначена для точного перевода, модерации контента и обработки неструктурированных данных.

Заявлены исправления недостатков предыдущих версий Claude и превосходство над GPT-4 в бенчмарках.
Читать дальше →

Юристы попросили ChatGPT обосновать их гонорар, судья срезал им выплаты вдвое

Время на прочтение1 мин
Количество просмотров19K

Юридическая компания Cuddy Law из Нью-Йорка использовала ChatGPT в попытке обосновать гонорар за выигранный процесс. Юристы запросили шестизначную сумму, сославшись на данные чат-бота, однако судья раскритиковал фирму и уменьшил выплаты вдвое.

Читать далее

Google принесла извинения за «промах» в работе Gemini по генерации изображений людей в разные исторические периоды

Время на прочтение2 мин
Количество просмотров6.2K

Google извинилась за «неточности» в генерации изображений людей в разные исторические периоды, включая расово разнообразных немецких солдат в 40-х годах и темнокожих американских президентов в XIX веке. Компания заявила, что её попытки создать «широкий диапазон» результатов не увенчались успехом. 

Читать далее

Пользователи обратили внимание, что Gemini не любит рисовать европеоидов

Время на прочтение5 мин
Количество просмотров30K

@IMAO_

Мультимодальная языковая модель Gemini как отказывается рисовать просто исторических личностей, так и избегает изображений некоторых рас людей. Как обнаружили пользователи продукта, Gemini намеренно включает некоторые этносы даже в те контексты, в которых их встретить было тяжело или невозможно.
Читать дальше →

В рамках реструктуризации платформа Grammarly увольняет 230 сотрудников

Время на прочтение1 мин
Количество просмотров1.7K

Платформа для помощи в общении на английском языке на базе искусственного интеллекта Grammarly объявила о сокращении 230 сотрудников в рамках реструктуризации. В компании объяснили, что увольнения станут частью инициативы по увеличению внимания «к созданию рабочих мест с поддержкой ИИ».

Читать далее

Чат-бот Google Bard теперь работает на Gemini Pro и поддерживает Imagen 2

Время на прочтение2 мин
Количество просмотров6K

Google обновила чат-бота Bard. Он получил поддержку большой языковой модели Gemini Pro, а также модели Imagen 2 для генерации изображений.

Читать далее

Новый запуск курса Natural Language Processing

Время на прочтение2 мин
Количество просмотров1.6K

Этой весной сообщество Open Data Science и компания MTS AI делают новый запуск курса по обработке естественного языка. Вот страница нашего курса. Для того, чтобы его пройти, нужно зарегистрироваться.

Читать далее

Автор диплома от ChatGPT рассказал, как языковая модель нашла ему жену

Время на прочтение5 мин
Количество просмотров49K

@biblikz

Год назад Александр Жадан рассказал, как написал дипломную работу с помощью ChatGPT и защитил её. Последовавший за этим конфликт урегулировали на высшем уровне министерства образования. В итоге студента всё же не лишили диплома.

Это не отпугнуло Александра от экспериментов с большими языковыми моделями. Он разработал бота на моделях OpenAI, который общался с девушками и назначал свидания. Постепенно бот эволюционировал в помощника в отношениях, круг девушек сузился до одной, и дело дошло до предложения вступить в брак.

Опытом Жадан поделился у себя в микроблоге.
Читать дальше →

OpenAI добавила забытую ссылку на научную работу, на которой построен продукт компании

Время на прочтение3 мин
Количество просмотров8.3K


25 января 2023 года OpenAI опубликовала пост в блоге компании. 28 января текст обновили: добавили 3 буквы MRL и гиперссылку. За этим с виду мелким изменением скрывается ещё один виток спора о природе организации OpenAI.
Читать дальше →

А пруф есть? GigaSearch научился указывать ссылки на источники информации

Время на прочтение2 мин
Количество просмотров2.8K

Сегодня для всех пользователей GigaChat Web мы выпустили новую фичу — ссылки на источник. Самым сложным при реализации этой функции было обучить GigaChat генерировать специальные маркеры, указывая таким образом, на основе какого источника сгенерирована та или другая часть ответа.

Кому интересно, как мы это сделали, добро пожаловать под кат.

Читать дальше

Ближайшие события

OpenAI снова открыла регистрацию новых пользователей ChatGPT Plus

Время на прочтение1 мин
Количество просмотров9.1K

OpenAI возобновила регистрацию новых пользователей ChatGPT Plus. Подписка за $20 даёт доступ к ChatGPT даже в часы высокой загрузки, больше ответов за сутки и раннюю демонстрацию новых функций и улучшений. 

В конце ноября генеральный директор OpenAI Сэм Альтман объявил, что компания приостанавливает регистрацию новых подписчиков ChatGPT Plus, поскольку «рост пользователей превысил технические возможности OpenAI». После этого некоторые пользователи начали сдавать в аренду свои аккаунты ChatGPT Plus на eBay минимум за $10 в месяц.

Читать далее

ChatGPT не любит работать в декабре

Время на прочтение3 мин
Количество просмотров7.9K


Энтузиасты заметили, что ответ ChatGPT немного короче, если в системном промпте указан декабрь, а не май. Эффект пронаблюдали два человека (1, 2), ещё один сообщает об отсутствии разницы.
Читать дальше →

Энтузиаст повторил на GPT-4V три примера из видео про Google Gemini

Время на прочтение3 мин
Количество просмотров8K

6 декабря Google опубликовала видеоролик про мультимодальность модели Gemini Ultra. Позднее выяснилось, что видео — лишь демка возможной производительности, а не реальный продукт. Грег Садецкий опубликовал простую демку, которая воссоздаёт 3 примера из видео. Для этих целей он задействовал доступную с конца сентября GPT-4V.
Читать дальше →

Google призналась, что демонстрация мультимодальности Gemini — это постановка

Время на прочтение6 мин
Количество просмотров16K


6 декабря вместе с семейством моделей Gemini компания Google показала видеоролик, где человек взаимодействует с мультимодальной языковой моделью. На видео пользователь общается голосом, рисует и показывает жесты, а Gemini распознаёт увиденное и всячески развлекает. Как заметили наблюдатели и как позже признала Google, видеоролик преувеличивает технические способности ИИ.
Читать дальше →

Даже если случайно переставить буквы в словах, GPT-4 понимает текст

Время на прочтение7 мин
Количество просмотров4.8K

Цветом выделена токенизация

Для представления внутри трансформеров слова или их небольшие части преобразуются в токены. Кажется, что если перемешать в каждом слове буквы, то языковая модель на трансформерах потеряет всякую способность понимать текст. Авторы научной работы «Unnatural Error Correction: GPT-4 Can Almost Perfectly Handle Unnatural Scrambled Text» (arXiv:2311.18805) показали, что это не так. Как выяснилось, GPT-4 без проблем оперирует текстом, где в каждом слове все буквы случайно переставлены.
Читать дальше →

Контекстное окно в 200 тыс. токенов Claude 2.1 подвергли проверке

Время на прочтение6 мин
Количество просмотров5.6K

Anthropic

Компания Anthropic представила Claude 2.1, следующую версию своей языковой модели. В 2.1 заявлены разнообразные улучшения точности и 50-процентное сокращение частоты галлюцинаций. Новая модель удваивает размер контекстного окна со 100 тыс. токенов до 200 тыс.

Грег Камрадт протестировал эффективность памяти Claude 2.1 в зависимости от длины контекста и выдал несколько рекомендаций.
Читать дальше →

Трёхмодальный вызов — ещё один шаг к сильному AI

Время на прочтение3 мин
Количество просмотров1.6K

Диалог — самая распространённая форма общения. В основном мы общаемся текстом (да здравствуют мессенджеры), но также регулярно пользуемся фотографиями или аудиосообщениями для детализации и придания окраски диалогу. Понимать текст, изображения и аудио в диалоге с человеком, одновременно сохраняя предыдущий контекст беседы, — настоящий вызов для современных AI-моделей. Приглашаем присоединиться к решению этой сложной, но увлекательной задачи на соревновании AI Journey Contest!

Подробнее о соревновании