Как стать автором
Обновить
120.12

Natural Language Processing *

Компьютерный анализ и синтез естественных языков

Сначала показывать
Порог рейтинга

Яндекс научил Нейро точнее отвечать на вопросы пользователей и добавил голосовой ввод

Время на прочтение2 мин
Количество просмотров1.3K

Сегодня мы обновили сервис Нейро, о котором ранее уже рассказывали на Хабре. Благодаря обновлённой модели семейства YandexGPT 3 он стал точнее понимать запросы пользователей и отвечать более содержательно. Кроме того, задать вопрос теперь можно не только текстом и картинкой, но и голосом. А ещё сервис адаптировали для программ экранного доступа, которые необходимы для людей с нарушениями зрения.

Читать далее

Нейросети помогут исправить и улучшить текст в Яндекс Клавиатуре

Время на прочтение2 мин
Количество просмотров3.3K

Мы добавили в нашу виртуальную клавиатуру для мобильных устройств новые функции на основе нейросетей Яндекса. Пользователи Клавиатуры теперь могут использовать их в любом сервисе, где есть текстовый ввод. YandexGPT поможет исправить ошибки в тексте, разнообразить его синонимами и добавить подходящие эмодзи, а YandexART создаст уникальный фон по текстовому описанию.

Новые возможности уже доступны в последней версии Яндекс Клавиатуры для Android и iOS.

Читать далее

Яндекс представил новую версию машинного перевода, обученную с помощью YandexGPT

Время на прочтение2 мин
Количество просмотров4.7K

Мы впервые применили большую языковая модель YandexGPT для подготовили эталонных примеров текстов, на которых затем обучили нейросеть в Яндекс Переводчике. Это позволило сервису точнее понимать контекст, распознавать фразеологизмы и ориентироваться в профессиональной лексике.

Переводчик стал качественнее справляться с длинными и сложными текстами. Благодаря дообучению он лучше определяет взаимосвязи внутри предложений и между ними. Кроме того, выросло качество перевода статей узконаправленной тематики. Например, сервис теперь поймёт по контексту, что речь идёт о языке программирования или фондовом индексе, и оставит их названия без перевода.

Читать далее

Яндекс представил YandexGPT 3 Lite

Время на прочтение3 мин
Количество просмотров7.2K

Сегодня мы открыли доступ к YandexGPT Lite третьего поколения. Облегченная версия нашей большой языковой модели доступна через API в Yandex Cloud. Новая модель полезна в сценариях, где важна скорость ответа: например, её можно использовать в чат-ботах, для проверки орфографии или анализа данных. Это оптимальная по цене и качеству генеративная модель Яндекса для решения рутинных задач. 

Чуть более подробно о результатах сравнения с другими моделями, а также об изменениях в процессе обучения и архитектуре — в этой новости.

Читать далее

В словарном запасе ChatGPT усмотрели влияние обучавших его африканцев

Время на прочтение4 мин
Количество просмотров11K
В последние два года в научных статьях значительно чаще употребляется слово «delve». Это слово называют одним из маркеров письма ChatGPT. Как считает автор издания Guardian, любовь ИИ к «delve» — это следствие попадания в данные дообучения модели нигерийского диалекта английского языка.
Читать дальше →

Исследователи не смогли получить от ИИ-сервисов Midjourney и DALL-E от OpenAI картинку с чистым белым фоном

Время на прочтение2 мин
Количество просмотров14K

Нейросети Midjourney и DALL-E испытывают трудности с генерацией картинки чистого белого фона. К такому выводу пришёл независимый исследователь по обработке данных Коди Нэш и редакция Bleeping Computer.

Читать далее

Форк Newspaper4k продолжает развитие библиотеки Newspaper3k

Время на прочтение3 мин
Количество просмотров1.9K
Библиотека Newspaper3k для Python 3 предназначена для скрейпинга и автоматического парсинга новостных статей. С 2018 года проект не обновляется. Разработчик Андрей Параскив представил проект-форк Newspaper4k, в рамках которого он планирует закрывать баги и продолжать улучшать работу библиотеки.
Читать дальше →

Издание TechCrunch разбило GPT-нарушителей в магазине OpenAI на категории

Время на прочтение4 мин
Количество просмотров3.5K

TechCrunch

TechCrunch опубликовало обзор состояния магазина приложений GPT Store. Как считает издание, компания OpenAI слабо следит за соблюденим авторских прав, за спамом сторонних сайтов и даже за нарушениями собственных правил.
Читать дальше →

Копирование текста из ChatGPT нашли в рецензируемых научных журналах

Время на прочтение3 мин
Количество просмотров16K

PubPeer

Признаки копирования из ChatGPT часты не только в школьных сочинениях, но и в серьёзных научных изданиях. Речь не про недобросовестные журналы, готовые опубликовать что угодно за деньги. Как обнаружил Гийом Кабанак, такие проколы часты даже в журналах издательства Elsevier.
Читать дальше →

xAI открыл веса и архитектуру языковой модели Grok-1

Время на прочтение3 мин
Количество просмотров14K

Иллюстрация от Midjourney

Стартап Илона Маска xAI открыл исходники языковой модели Grok-1 под лицензией Apache 2.0. В виде торрента предлагают скачать 300 ГиБ файлов с весами MoE-модели c 314 млрд параметров.
Читать дальше →

Что нового в AI за неделю?

Время на прочтение2 мин
Количество просмотров4K

Что произошло за эту неделю на рынке AI?

Маск объявил, что на этой неделе он выпустит открытый исходный код Grok

OpenAI представляет внутренний отладчик-трансформер

Cohere AI выпустила Command R для использования RAG в производственных масштабах

Читать далее

Anthropic выпустила Claude 3

Время на прочтение7 мин
Количество просмотров25K

Anthropic

Компания Anthropic представила семейство больших языковых моделей Claude 3. Три модели покрывают различные ценовые сегменты и направления:

  • Дорогая и мощная Opus предлагается для автоматизации задач, помощи в исследованиях и анализе данных.
  • Более доступную Sonnet рекомендуют для обработки данных, рекомендаций, предсказаний и парсинга текста с изображений.
  • Дешёвая модель Haiku предназначена для точного перевода, модерации контента и обработки неструктурированных данных.

Заявлены исправления недостатков предыдущих версий Claude и превосходство над GPT-4 в бенчмарках.
Читать дальше →

Юристы попросили ChatGPT обосновать их гонорар, судья срезал им выплаты вдвое

Время на прочтение1 мин
Количество просмотров19K

Юридическая компания Cuddy Law из Нью-Йорка использовала ChatGPT в попытке обосновать гонорар за выигранный процесс. Юристы запросили шестизначную сумму, сославшись на данные чат-бота, однако судья раскритиковал фирму и уменьшил выплаты вдвое.

Читать далее

Ближайшие события

Google принесла извинения за «промах» в работе Gemini по генерации изображений людей в разные исторические периоды

Время на прочтение2 мин
Количество просмотров6.1K

Google извинилась за «неточности» в генерации изображений людей в разные исторические периоды, включая расово разнообразных немецких солдат в 40-х годах и темнокожих американских президентов в XIX веке. Компания заявила, что её попытки создать «широкий диапазон» результатов не увенчались успехом. 

Читать далее

Пользователи обратили внимание, что Gemini не любит рисовать европеоидов

Время на прочтение5 мин
Количество просмотров30K

@IMAO_

Мультимодальная языковая модель Gemini как отказывается рисовать просто исторических личностей, так и избегает изображений некоторых рас людей. Как обнаружили пользователи продукта, Gemini намеренно включает некоторые этносы даже в те контексты, в которых их встретить было тяжело или невозможно.
Читать дальше →

В рамках реструктуризации платформа Grammarly увольняет 230 сотрудников

Время на прочтение1 мин
Количество просмотров1.7K

Платформа для помощи в общении на английском языке на базе искусственного интеллекта Grammarly объявила о сокращении 230 сотрудников в рамках реструктуризации. В компании объяснили, что увольнения станут частью инициативы по увеличению внимания «к созданию рабочих мест с поддержкой ИИ».

Читать далее

Чат-бот Google Bard теперь работает на Gemini Pro и поддерживает Imagen 2

Время на прочтение2 мин
Количество просмотров6K

Google обновила чат-бота Bard. Он получил поддержку большой языковой модели Gemini Pro, а также модели Imagen 2 для генерации изображений.

Читать далее

Новый запуск курса Natural Language Processing

Время на прочтение2 мин
Количество просмотров1.6K

Этой весной сообщество Open Data Science и компания MTS AI делают новый запуск курса по обработке естественного языка. Вот страница нашего курса. Для того, чтобы его пройти, нужно зарегистрироваться.

Читать далее

Автор диплома от ChatGPT рассказал, как языковая модель нашла ему жену

Время на прочтение5 мин
Количество просмотров49K

@biblikz

Год назад Александр Жадан рассказал, как написал дипломную работу с помощью ChatGPT и защитил её. Последовавший за этим конфликт урегулировали на высшем уровне министерства образования. В итоге студента всё же не лишили диплома.

Это не отпугнуло Александра от экспериментов с большими языковыми моделями. Он разработал бота на моделях OpenAI, который общался с девушками и назначал свидания. Постепенно бот эволюционировал в помощника в отношениях, круг девушек сузился до одной, и дело дошло до предложения вступить в брак.

Опытом Жадан поделился у себя в микроблоге.
Читать дальше →

OpenAI добавила забытую ссылку на научную работу, на которой построен продукт компании

Время на прочтение3 мин
Количество просмотров8.3K


25 января 2023 года OpenAI опубликовала пост в блоге компании. 28 января текст обновили: добавили 3 буквы MRL и гиперссылку. За этим с виду мелким изменением скрывается ещё один виток спора о природе организации OpenAI.
Читать дальше →