Как стать автором
Обновить
13
0
Денис Филиппов @filldens

Пользователь

Отправить сообщение

ruCLIP — мультимодальная модель для русского языка

Время на прочтение5 мин
Количество просмотров14K

Известно, что глубокие нейронные сети (DNN) и модели компьютерного зрения, в частности, хорошо справляются с конкретными задачами, но зачастую не могут сделать обобщение при работе с новыми. Так, модель, которая хорошо работает с данными о продуктах питания, может показать себя не очень хорошо на спутниковых изображениях и т. д..

В начале этого года OpenAI опубликовала модель под названием CLIP (Contrastive Language–Image Pre-training). В статье авторы модели привели потрясающие результаты по точности zero-shot-классификации изображений, а также сопоставили тексты и картинки в рамках одной системы. Однако модель OpenAI работает только с английским языком. Можно ли быстро адаптировать её для работы с русским?

Команды R&D SberDevices и Sber AI увлеклись этим вопросом. В этой статье мы расскажем про первые результаты наших исследований CLIP для русского языка, опишем ключевые идеи предложенной модели и поделимся с вами кодом для её использования — решения задач zero-shot image classification.

Что же можно сделать с помощью ruCLIP?

Читать далее
Всего голосов 29: ↑29 и ↓0+29
Комментарии3

Golos — самый большой русскоязычный речевой датасет, размеченный вручную, теперь в открытом доступе

Время на прочтение6 мин
Количество просмотров15K


Меня зовут Саша, в SberDevices я занимаюсь системой распознавания речи и тем, как данные могут сделать её лучше. В этой статье я расскажу о новом речевом датасете Golos, который состоит из аудиофайлов и соответствующих транскрипций. Общая длительность записей составляет примерно 1240 часов, частота дискретизации – 16кГц. На текущий момент это самый большой корпус аудиозаписей на русском языке, размеченный вручную. Мы выпустили корпус под лицензией, близкой к CC Attribution ShareAlike, что позволяет его использовать как для научных исследований, так и в коммерческих целях. Я расскажу о том, из чего состоит датасет, каким образом он был собран и каких результатов позволяет достичь.
Всего голосов 37: ↑34 и ↓3+31
Комментарии14

О том, как гениальный беспризорник и профессор пили виски и придумывали первую модель искусственного нейрона

Время на прочтение14 мин
Количество просмотров16K

Первая модель искусственного нейрона Мак-Каллока-Питтса

Сейчас один из самых популярных инструментов искусственного интеллекта — это нейронные сети. Само название намекает на то, что речь идёт о некотором аналоге естественных нейронов и синаптических связей в мозгу. Отсюда вытекает распространённое ошибочное предположение, что нейронные сети являются точной копией своего биологического прототипа. Конечно же, это не так, а точнее не совсем так: учёные действительно работают над созданием импульсных нейронных сетей, предназначенных для максимально достоверной симуляции процессов, происходящих в нервной ткани, но обычно искусственный нейронные сети довольно сильно отличаются от своих биологических прародителей. Революция глубокого обучения произошла благодаря моделям, похожим на мозг примерно в той мере, в которой самолёты похожи на птиц. И всё-таки у истоков создания этих моделей стояли попытки учёных три четверти века назад постичь принципы работы нервной системы живых существ.

Один из «дедушек» современных нейросетей — это перцептрон Розенблатта, представленный публике в конце 1950-х, но его появлению предшествовали другие, менее известные попытки описать принципы, по которым могла бы работать «думающая» машина, подобная мозгу. К ним относятся исследования Уолтера Питтса и Уоррена Мак-Каллока. Их модель, увидевшая свет в 1943-м году в статье под названием «Логическое исчисление идей, относящихся к нервной активности», была весьма новаторским изобретением. И за ней стоит довольно занятная история. Кто такие были эти товарищи, приложившие руку к созданию модели? Чопорные учёные в очках с роговой оправой или, может, аналог современных хипстеров из thinktank’ов?
Читать дальше →
Всего голосов 19: ↑19 и ↓0+19
Комментарии8

Выпущены Яндекс.Навигатор и SpeechKit для Windows Phone

Время на прочтение1 мин
Количество просмотров17K
Сегодня снова хорошие новости для Windows Phone: Яндекс выпустил свой Навигатор для Windows Phone:



Приложение умеет всё, что необходимо водителю за рулём: строит быстрый маршрут с учётом пробок, голосом рассказывает, куда ехать, и предупреждает о дорожных событиях. Навигатор будет полезен в поездках по России, Украине, Беларуси и Турции. Для всех территорий доступны подробные векторные карты.


Но это — всего лишь интересная новость для пользователей смартфонов с WP, а вот что по-настоящему интересно для разработчиков — так это доступность технологии распознавания речи от Яндекса, которая как раз используется в приложении для ввода адресов. О самой технологии коллеги из Яндекса уже писали на Хабре около месяца назад.

Читать дальше →
Всего голосов 60: ↑51 и ↓9+42
Комментарии31

Распознавание речи от Яндекса. Под капотом у Yandex.SpeechKit

Время на прочтение10 мин
Количество просмотров146K
imageНа Yet another Conference 2013 мы представили разработчикам нашу новую библиотеку Yandex SpeechKit. Это публичный API для распознавания речи, который могут использовать разработчики под Android и iOS. Скачать SpeechKit, а также ознакомиться с документацией, можно здесь.

Yandex SpeechKit позволяет напрямую обращаться к тому бэкэнду, который успешно применяется в мобильных приложениях Яндекса. Мы достаточно долго развивали эту систему и сейчас правильно распознаем 94% слов в Навигаторе и Мобильных Картах, а также 84% слов в Мобильном Браузере. При этом на распознавание уходит чуть больше секунды. Это уже весьма достойное качество, и мы активно работаем над его улучшением.

image

Можно утверждать, что уже в скором времени голосовые интерфейсы практически не будут отличаться по надежности от классических способов ввода. Подробный рассказ о том, как нам удалось добиться таких результатов, и как устроена наша система, под катом.

Как устроено распознавание речи в Яндексе
Всего голосов 155: ↑149 и ↓6+143
Комментарии60

Робот Милена исполняет желания в Twitter

Время на прочтение1 мин
Количество просмотров1.2K
Привет, Хабр!

У нас для вас очередная радостная новость. Голосовой сервис заказа услуг и товаров «Самый нужный телефон» обзавелся собственным ботом. Одно сообщение роботу Милене — и желание осуществится.


Читать дальше →
Всего голосов 10: ↑6 и ↓4+2
Комментарии9

Робот Милена меняет имидж

Время на прочтение3 мин
Количество просмотров6.9K
Привет, жители Хабра!

Спешим поделиться важным известием: мы запустили новый сайт голосового сервиса «Самый нужный телефон». Теперь заказать мойку окон или ремонт стиральной машины стало ещё проще и удобнее. Ваш заказ по-прежнему примет голосовая девушка-робот Милена. А еще мы изменились не только внутренне, но и внешне. Смотрите, какой у нас красивый логотип.


Читать дальше →
Всего голосов 25: ↑18 и ↓7+11
Комментарии30

Информация

В рейтинге
Не участвует
Откуда
Москва, Москва и Московская обл., Россия
Работает в
Дата рождения
Зарегистрирован
Активность