Обновить
122.98

Natural Language Processing *

Компьютерный анализ и синтез естественных языков

Сначала показывать
Порог рейтинга

Что нового в AI за неделю?

Время на прочтение2 мин
Количество просмотров4K

Что произошло за эту неделю на рынке AI?

Маск объявил, что на этой неделе он выпустит открытый исходный код Grok

OpenAI представляет внутренний отладчик-трансформер

Cohere AI выпустила Command R для использования RAG в производственных масштабах

Читать далее

Anthropic выпустила Claude 3

Время на прочтение7 мин
Количество просмотров25K

Anthropic

Компания Anthropic представила семейство больших языковых моделей Claude 3. Три модели покрывают различные ценовые сегменты и направления:

  • Дорогая и мощная Opus предлагается для автоматизации задач, помощи в исследованиях и анализе данных.
  • Более доступную Sonnet рекомендуют для обработки данных, рекомендаций, предсказаний и парсинга текста с изображений.
  • Дешёвая модель Haiku предназначена для точного перевода, модерации контента и обработки неструктурированных данных.

Заявлены исправления недостатков предыдущих версий Claude и превосходство над GPT-4 в бенчмарках.
Читать дальше →

Юристы попросили ChatGPT обосновать их гонорар, судья срезал им выплаты вдвое

Время на прочтение1 мин
Количество просмотров19K

Юридическая компания Cuddy Law из Нью-Йорка использовала ChatGPT в попытке обосновать гонорар за выигранный процесс. Юристы запросили шестизначную сумму, сославшись на данные чат-бота, однако судья раскритиковал фирму и уменьшил выплаты вдвое.

Читать далее

Google принесла извинения за «промах» в работе Gemini по генерации изображений людей в разные исторические периоды

Время на прочтение2 мин
Количество просмотров6.2K

Google извинилась за «неточности» в генерации изображений людей в разные исторические периоды, включая расово разнообразных немецких солдат в 40-х годах и темнокожих американских президентов в XIX веке. Компания заявила, что её попытки создать «широкий диапазон» результатов не увенчались успехом. 

Читать далее

Пользователи обратили внимание, что Gemini не любит рисовать европеоидов

Время на прочтение5 мин
Количество просмотров30K

@IMAO_

Мультимодальная языковая модель Gemini как отказывается рисовать просто исторических личностей, так и избегает изображений некоторых рас людей. Как обнаружили пользователи продукта, Gemini намеренно включает некоторые этносы даже в те контексты, в которых их встретить было тяжело или невозможно.
Читать дальше →

В рамках реструктуризации платформа Grammarly увольняет 230 сотрудников

Время на прочтение1 мин
Количество просмотров1.7K

Платформа для помощи в общении на английском языке на базе искусственного интеллекта Grammarly объявила о сокращении 230 сотрудников в рамках реструктуризации. В компании объяснили, что увольнения станут частью инициативы по увеличению внимания «к созданию рабочих мест с поддержкой ИИ».

Читать далее

Чат-бот Google Bard теперь работает на Gemini Pro и поддерживает Imagen 2

Время на прочтение2 мин
Количество просмотров6K

Google обновила чат-бота Bard. Он получил поддержку большой языковой модели Gemini Pro, а также модели Imagen 2 для генерации изображений.

Читать далее

Новый запуск курса Natural Language Processing

Время на прочтение2 мин
Количество просмотров1.6K

Этой весной сообщество Open Data Science и компания MTS AI делают новый запуск курса по обработке естественного языка. Вот страница нашего курса. Для того, чтобы его пройти, нужно зарегистрироваться.

Читать далее

Автор диплома от ChatGPT рассказал, как языковая модель нашла ему жену

Время на прочтение5 мин
Количество просмотров49K

@biblikz

Год назад Александр Жадан рассказал, как написал дипломную работу с помощью ChatGPT и защитил её. Последовавший за этим конфликт урегулировали на высшем уровне министерства образования. В итоге студента всё же не лишили диплома.

Это не отпугнуло Александра от экспериментов с большими языковыми моделями. Он разработал бота на моделях OpenAI, который общался с девушками и назначал свидания. Постепенно бот эволюционировал в помощника в отношениях, круг девушек сузился до одной, и дело дошло до предложения вступить в брак.

Опытом Жадан поделился у себя в микроблоге.
Читать дальше →

OpenAI добавила забытую ссылку на научную работу, на которой построен продукт компании

Время на прочтение3 мин
Количество просмотров8.3K


25 января 2023 года OpenAI опубликовала пост в блоге компании. 28 января текст обновили: добавили 3 буквы MRL и гиперссылку. За этим с виду мелким изменением скрывается ещё один виток спора о природе организации OpenAI.
Читать дальше →

А пруф есть? GigaSearch научился указывать ссылки на источники информации

Время на прочтение2 мин
Количество просмотров2.8K

Сегодня для всех пользователей GigaChat Web мы выпустили новую фичу — ссылки на источник. Самым сложным при реализации этой функции было обучить GigaChat генерировать специальные маркеры, указывая таким образом, на основе какого источника сгенерирована та или другая часть ответа.

Кому интересно, как мы это сделали, добро пожаловать под кат.

Читать дальше

OpenAI снова открыла регистрацию новых пользователей ChatGPT Plus

Время на прочтение1 мин
Количество просмотров9.1K

OpenAI возобновила регистрацию новых пользователей ChatGPT Plus. Подписка за $20 даёт доступ к ChatGPT даже в часы высокой загрузки, больше ответов за сутки и раннюю демонстрацию новых функций и улучшений. 

В конце ноября генеральный директор OpenAI Сэм Альтман объявил, что компания приостанавливает регистрацию новых подписчиков ChatGPT Plus, поскольку «рост пользователей превысил технические возможности OpenAI». После этого некоторые пользователи начали сдавать в аренду свои аккаунты ChatGPT Plus на eBay минимум за $10 в месяц.

Читать далее

ChatGPT не любит работать в декабре

Время на прочтение3 мин
Количество просмотров7.9K


Энтузиасты заметили, что ответ ChatGPT немного короче, если в системном промпте указан декабрь, а не май. Эффект пронаблюдали два человека (1, 2), ещё один сообщает об отсутствии разницы.
Читать дальше →

Ближайшие события

Энтузиаст повторил на GPT-4V три примера из видео про Google Gemini

Время на прочтение3 мин
Количество просмотров8K

6 декабря Google опубликовала видеоролик про мультимодальность модели Gemini Ultra. Позднее выяснилось, что видео — лишь демка возможной производительности, а не реальный продукт. Грег Садецкий опубликовал простую демку, которая воссоздаёт 3 примера из видео. Для этих целей он задействовал доступную с конца сентября GPT-4V.
Читать дальше →

Google призналась, что демонстрация мультимодальности Gemini — это постановка

Время на прочтение6 мин
Количество просмотров16K


6 декабря вместе с семейством моделей Gemini компания Google показала видеоролик, где человек взаимодействует с мультимодальной языковой моделью. На видео пользователь общается голосом, рисует и показывает жесты, а Gemini распознаёт увиденное и всячески развлекает. Как заметили наблюдатели и как позже признала Google, видеоролик преувеличивает технические способности ИИ.
Читать дальше →

Даже если случайно переставить буквы в словах, GPT-4 понимает текст

Время на прочтение7 мин
Количество просмотров4.8K

Цветом выделена токенизация

Для представления внутри трансформеров слова или их небольшие части преобразуются в токены. Кажется, что если перемешать в каждом слове буквы, то языковая модель на трансформерах потеряет всякую способность понимать текст. Авторы научной работы «Unnatural Error Correction: GPT-4 Can Almost Perfectly Handle Unnatural Scrambled Text» (arXiv:2311.18805) показали, что это не так. Как выяснилось, GPT-4 без проблем оперирует текстом, где в каждом слове все буквы случайно переставлены.
Читать дальше →

Контекстное окно в 200 тыс. токенов Claude 2.1 подвергли проверке

Время на прочтение6 мин
Количество просмотров5.6K

Anthropic

Компания Anthropic представила Claude 2.1, следующую версию своей языковой модели. В 2.1 заявлены разнообразные улучшения точности и 50-процентное сокращение частоты галлюцинаций. Новая модель удваивает размер контекстного окна со 100 тыс. токенов до 200 тыс.

Грег Камрадт протестировал эффективность памяти Claude 2.1 в зависимости от длины контекста и выдал несколько рекомендаций.
Читать дальше →

Трёхмодальный вызов — ещё один шаг к сильному AI

Время на прочтение3 мин
Количество просмотров1.6K

Диалог — самая распространённая форма общения. В основном мы общаемся текстом (да здравствуют мессенджеры), но также регулярно пользуемся фотографиями или аудиосообщениями для детализации и придания окраски диалогу. Понимать текст, изображения и аудио в диалоге с человеком, одновременно сохраняя предыдущий контекст беседы, — настоящий вызов для современных AI-моделей. Приглашаем присоединиться к решению этой сложной, но увлекательной задачи на соревновании AI Journey Contest!

Подробнее о соревновании

Языковые модели понимают место и время, утверждает исследование

Время на прочтение6 мин
Количество просмотров5.8K


Исследователи Массачусетского технологического института утверждают, что им удалось выявить в большой языковой Llama 2 модель пространства и времени. Их работа говорит, что нейросеть имеет понимание положения географических мест на планете и исторических событий.
Читать дальше →

OpenAI внедряет в ChatGPT функции распознавания голоса и изображений

Время на прочтение2 мин
Количество просмотров4.4K

ChatGPT научился «слышать» и «говорить»: OpenAI начала внедрять в чат-бота распознавание голоса и изображений. Теперь пользователи смогут побеседовать с чат-ботом голосом или обсудить с ним содержимое картинки.

Новые функции дают больше вариантов для использования чат-бота, отмечают в OpenAI. Разработчики привели несколько примеров. Так, пользователь сможет сфотографировать достопримечательность и расспросить чат-бота о ней или обсудить интересные детали. Можно будет сфотографировать содержимое холодильника и вместе с ChatGPT придумать, что приготовить. Или решить математическую задачу из учебника, сфотографировав её и попросив у ChatGPT подсказку.

Читать далее