Все потоки
Поиск
Написать публикацию
Обновить
125.43

Natural Language Processing *

Компьютерный анализ и синтез естественных языков

Сначала показывать
Порог рейтинга

OpenAI внедряет в ChatGPT функции распознавания голоса и изображений

Время на прочтение2 мин
Количество просмотров4.4K

ChatGPT научился «слышать» и «говорить»: OpenAI начала внедрять в чат-бота распознавание голоса и изображений. Теперь пользователи смогут побеседовать с чат-ботом голосом или обсудить с ним содержимое картинки.

Новые функции дают больше вариантов для использования чат-бота, отмечают в OpenAI. Разработчики привели несколько примеров. Так, пользователь сможет сфотографировать достопримечательность и расспросить чат-бота о ней или обсудить интересные детали. Можно будет сфотографировать содержимое холодильника и вместе с ChatGPT придумать, что приготовить. Или решить математическую задачу из учебника, сфотографировав её и попросив у ChatGPT подсказку.

Читать далее

Nvidia представила сервис NeMo Guardrails для борьбы с токсичностью ChatGPT и подобных систем

Время на прочтение2 мин
Количество просмотров2.1K

Nvidia разработала сервис NeMo Guardrails, который обеспечит точность, актуальность и безопасность ответов чат-ботов, основанных на больших языковых моделях (LLM). Код проекта опубликован на GitHub.

Читать далее

Студент Стэнфорда встроил ChatGPT в умные очки

Время на прочтение2 мин
Количество просмотров4.5K

Студент факультета информатики и электротехники Стэнфорда Брайан Хау-Пинг Чанг смог встроить чат-бота ChatGPT на базе GPT-4 в умные очки благодаря аппаратному обеспечению Monocle AR с открытым исходным кодом и автоматическому распознаванию речи (ASR) Whisper от OpenAI. Он управляет устройством через смартфон.

Читать далее

Критиков разочаровало качество статей, которые ИИ OpenAI написал для BuzzFeed

Время на прочтение5 мин
Количество просмотров2.8K
Робот Buzzy в соавторстве с человеком опубликовал 40 статей на сайте BuzzFeed. Это уже второй результат сотрудничества с OpenAI: до этого, в феврале, BuzzFeed представила ИИ-квизы, которые были больше похожи на чат-бота для развлечения пользователей. Опубликованные в середине марта тексты про туризм — первый известный пример статей BuzzFeed, написанных нейросетями OpenAI.

Несколько изданий оценили качество статей как низкое. Речь блога о путешествиях As Told to Buzzy кишит речевыми ошибками и неинформативна, части критиков полученное напоминает ферму контента для получения трафика из поисковика.
Читать дальше →

Магазин компьютерной электроники Newegg интегрировал ChatGPT, но СМИ результат не впечатлил

Время на прочтение6 мин
Количество просмотров2.7K

Newegg

Американский онлайн-ретейлер бытовой электроники Newegg добавил в конструктор на сайте интеграцию с ChatGPT. В пресс-релизе Newegg рассказал, что искусственный интеллект помог многим: поисковой оптимизацией сайта, инструментами для техподдержки и редактированием текста. Но наибольшее внимание изданий для компьютерных энтузиастов привлёк именно инструмент для рекомендации компонентов, работу которого оценили неудовлетворительно.
Читать дальше →

Новый запуск курса Natural Language Processing

Время на прочтение2 мин
Количество просмотров1.2K

TL;DR: Этой весной сообщество Open Data Science и компания Huawei делают новый запуск курса по обработке естественного языка. Вот страница нашего курса. Для того, чтобы его пройти, нужно зарегистрироваться.

Читать далее

От мультиязычных моделей до проектирования блок-схем на языке Дракон: Сбер, DeepPavlov, Ozon и другие на Conversations

Время на прочтение3 мин
Количество просмотров1.1K

2 декабря в Москве в онлайн- и офлайн-формате состоится Conversations – ежегодная конференция по разговорному AI для разработчиков и бизнеса. Про NLP-сервисы, диалоговые платформы и фреймворки, синтез и распознавание речи, UX и проектирование разговорных интерфейсов, генеративные модели и не только расскажут KODE, MTS AI, Альфа-Банк, Сбер, Yandex Cloud, DeepPavlov и другие эксперты. В нашем анонсе – особо интригующие спойлеры и промокод на скидку.

О чем будут вещать?

OpenAI открыла код системы распознавания речи Whisper

Время на прочтение2 мин
Количество просмотров8.1K

OpenAI опубликовала исходный код системы распознавания речи Whisper. Открыты код эталонной реализации на базе фреймворка PyTorch и набор уже обученных моделей для использования под лицензией MIT.

Читать далее

Участники эксперимента не смогли отличить GPT-3 от реального философа

Время на прочтение3 мин
Количество просмотров3.4K

Профессор философии Калифорнийского университета в Риверсайде Эрик Швитцгебель, философы Анна Штрассер и Мэтью Кросби провели эксперимент, в ходе которого испытуемых попросили определить, какие ответы на философские вопросы принадлежали их коллеге Дэниелу Деннету, а какие — генератору речи GPT-3. 

Читать далее

Хакатон «Разработка алгоритмов генерации голосовых фейков»

Время на прочтение1 мин
Количество просмотров540

Всем привет! 22-24 апреля 2022 года в Российском Технологическом Университете МИРЭА при поддержке нашей компании «Наносемантика» пройдет студенческий хакатон.

Студенты МИРЭА смогут посоревноваться в разработке алгоритма генерации голосового дипфейка, программы, которая копирует голос конкретного человека.

Под катом – задача, правила, ссылка на регистрацию и расписание хакатона.

Что такое хакатон

Хакатон – это ограниченное по времени соревнование по разработке алгоритмов и программ, решающих определенную задачу. 

Организаторы хакатона

Институт кибербезопасности и цифровых технологий Российского Технологического Университета МИРЭА. РТУ МИРЭА сегодня является одним из лидеров в области подготовки высококвалифицированных специалистов для быстро развивающихся наукоемких отраслей науки и техники: телекоммуникаций, информационных и компьютерных технологий, автоматики, кибернетики, радиотехники и электроники, химии и биотехнологий.

«Наносемантика»  — ведущий разработчик технологий искусственного интеллекта. Компания разрабатывает голосовых виртуальных ассистентов, нейронные сети и системы анализа больших данных.

Задачи и правила хакатона

Хакатон проводится для студентов РТУ МИРЭА. Участники разделятся на команды по 1-3 человека.

Место проведения:

Хакатон будет проходить с 22 по 24 апреля 2022 года в РТУ МИРЭА.

Задача:

Участникам будет предложено разработать алгоритм генерации голосового дипфейка – программы, которая копирует голос конкретного человека. 

Что будет предоставлено участникам:

1) Набор данных (датасет) из 2 часов аудиозаписей с голосом определённого человека

2) Программный код с предобученной нейронной сетью для синтеза речи

3) Вычислительные мощности (сервер с видеокартой)

За время хакатона командам необходимо сгенерировать 10 аудиозаписей по 10 предоставленным текстам и далее презентовать решение жюри, которое будет оценивать качество полученных аудиозаписей: их реалистичность и качество звучания.

Призы

Три лучших команды будут награждены призами (памятные сувениры и денежный приз). 

Победители также получат возможность пройти стажировку в «Наносемантике» и перенять опыт у высококлассных специалистов по ИИ. 

Актуальность выбранной темы

Дипфейк (deep fake) - реалистичная манипуляция аудио-, фото- и видеоматериалами с помощью искусственного интеллекта для достижения максимального сходства с реальными изображениями и звуковыми дорожками. Само название deep fake объединяет в себе «глубокое обучение» (deep learning) и «подделку» (fake).

Выбор темы хакатон не случаен. Помимо того, что технология производства дипфейков (Generative Artificial Intelligence) названа агентством Gartner стратегическим трендом для 2022 года, мы также наблюдаем постоянный рост случаев мошенничества и пропаганды с помощью сгенерированных аудио, видео и текстов. Для успешного противодействия таким технологиям обязательно необходимо понимать, как такой генеративный контент создаётся.

План хакатона

Пятница, 22 апреля 2022 года

17:00-18:30 – начало хакатона, рассказ о задаче, регистрация команд, погружение в задачу

20:00–21:00 – первая контрольная точка, кураторы отвечают на вопросы участников

Суббота, 23 апреля 2022 года

11:00–12:00 – вторая контрольная точка, кураторы отвечают на вопросы участников

12:00-13:00 – мастер-класс «Современные методики генерации голосовых дипфейков и синтеза речи», проводят специалисты «Наносемантики»

16:00-17:00 – мастер-класс «Ключевые особенности распознавания голосовых дипфейков», проводят специалисты «Наносемантики»

19:00-20:00 – третья контрольная точка, кураторы отвечают на вопросы участников

Воскресенье, 24 апреля 2022 года

11:00–12:00 – четвертая контрольная точка, кураторы отвечают на вопросы участников

16:00-17:30 – подведение итогов, награждение

За всеми обновлениями по хакатону можно следить на сайте мероприятия.

Читать далее

Just AI представит технологию гибридного синтеза речи на вебинаре 17 марта

Время на прочтение2 мин
Количество просмотров1.1K

Разработчик технологий разговорного ИИ Just AI выводит в продакшн гибридный синтез речи и представит технологию на бесплатном вебинаре 17 марта. Гибридный синтез позволяет быстро заменять любые фразы в аудиодорожках, записанных диктором для голосового бота, требуется только отредактировать текст. При этом синтезированная речь будет в точности сохранять интонацию, с которой диктор произносил неизмененные части реплики, и экстраполировать ее на новый текст так, чтобы он звучал естественно и не выделялся из контекста. 

Читать далее

OpenAI заставила GPT-3 вести себя лучше и выполнять инструкции

Время на прочтение2 мин
Количество просмотров3.9K

OpenAI заявила, что обучила свою языковую модель GPT-3 следовать инструкциям, благодаря чему она выдает меньше нежелательного текста.

Читать далее

Вышла публичная бета API для GPT-3

Время на прочтение2 мин
Количество просмотров3.7K

OpenAI объявила о выпуске API своей модели генерации текста GPT-3 в публичную бету. Любой желающий сможет использовать ее для создания приложений.

Читать далее

Ближайшие события

DeepMind утверждает, что ее языковая модель на 280 млрд параметров превосходит аналоги в 25 раз крупнее

Время на прочтение3 мин
Количество просмотров6.1K

AI-лаборатория DeepMind опубликовала три исследовательские работы, посвященные возможностям больших языковых моделей. Компания пришла к выводу, что дальнейшее масштабирование этих систем должно привести к множеству улучшений.

Читать далее

One Day Offer для Data Scientists: приглашаем экспертов в команду SberDevices

Время на прочтение3 мин
Количество просмотров4.1K


Мы продолжаем встречи с соискателями в формате “One Day Offer”, в результате которых можно получить предложение работы за один день. В этот раз приглашаем датасайентистов уровня Middle+/Senior.

Всё будет происходить онлайн, 4 декабря (это выходной) с 11:00 до 20:00. Для участия нужно зарегистрироваться, отправив заявку по адресу: 1dayoffer@sberdevices.ru.

Несколько слов о SberDevices. Наша команда создаёт современные модели обработки естественного языка (Natural Language Processing), речевые технологии, алгоритмы компьютерного зрения, разрабатывает системы биометрии, модели для генерации медиаконтента и даже нейроинтерфейсы. Мы используем последние разработки в области искусственного интеллекта и машинного обучения и очень любим работать с большими генеративными моделями. Впереди у нас ещё много интересных задач!

Итак, какие же команды нанимают в этот раз:

SmartNLP Team— выстраивает core-систему обработки естественного языка. Все запросы к виртуальным ассистентам Салют проходят через неё. Наш сервис реализует весь стек технологий NLP: от предобработки текста и выделения сущностей до определения намерения пользователя и вызова соответствующего навыка. В этом нам помогают собственные разработки в области Representation Learning, Metric Learning и Natural Language Understanding. О некоторых наших подходах можно почитать здесь, здесь и здесь.
Читать дальше →

Украинский стартап Grammarly оценили в $13 млрд

Время на прочтение1 мин
Количество просмотров10K

Основанная выходцами из Украины IT-компания Grammarly, которая разработала онлайн-сервис улучшения бизнес-текстов на английском языке, привлекла еще $200 млн. Таким образом. ее общая оценка достигла $13 млрд.

Читать далее

OpenAI открыла API GPT-3 для всех желающих

Время на прочтение2 мин
Количество просмотров50K

OpenAI объявила, что прогресс в обеспечении безопасности позволили компании открыть API генератора текстов GPT-3. Разработчики из поддерживаемых стран смогут зарегистрироваться и сразу же начать экспериментировать с ним.

Читать далее

Google представила голосового помощника Relate для людей с нарушениями речи

Время на прочтение2 мин
Количество просмотров1.3K

Google запустила бета-версию приложения, которое люди с нарушениями речи могут использовать в качестве голосового помощника. Цель тестирования состоит в том, чтобы сделать Google Assistant и другие голосовые функции более доступными для пользователей с неврологическими заболеваниями, влияющими на их речь.

Читать далее

NVIDIA объявила себя создателем метавселенной

Время на прочтение5 мин
Количество просмотров7.5K

NVIDIA считает себя аппаратным властелином «метавселенной» и намекнула на создание собственного виртуального пространства, где люди смогут работать, играть и взаимодействовать в качестве аватаров.

Читать далее

Исследование: мозг понимает язык с помощью «автокоррекции»

Время на прочтение2 мин
Количество просмотров4.4K

Исследователи Массачусетского технологического института применили модели искусственного интеллекта для изучения того, как и почему наш мозг понимает язык. Выяснилось, что человеческий мозг может работать примерно так же, как и функция автокоррекции на смартфоне.

Читать далее