Как стать автором
Обновить

Компания Neuro.net временно не ведёт блог на Хабре

Сначала показывать

ИИ в качестве актера озвучки звучит очень по-человечески. И цифровых агентов уже можно нанять

Время на прочтение6 мин
Количество просмотров9.8K
image

Голосовые агенты становятся все более совершенными. Мы уже рассказывали о том, насколько хорошо они понимают собеседника-человека и способны воспроизводить речь. Использовать цифровых агентов можно не только в качестве «сотрудника» колл-центра, но и в качестве актеров озвучки/дубляжа. Хороший пример — работа компании WellSaid Labs, о которой и рассказывается в этой статье.

Компания WellSaid Labs на своем сайте уведомляет посетителей, что у нее в запасе «восемь новых цифровых актеров озвучки». Тобин «энергичен и проницателен». Пейдж «уравновешенна и выразительна». Ава «отточенная, уверенная в себе и профессиональная».

Каждый цифровой агент использует голос реального актера, конечно, с согласия последнего. Теперь компании могут лицензировать эти голоса, чтобы рассказывать обо всем, что нужно бизнесу. Они просто вводят текст в голосовой движок, и на выходе получается четкий аудиоклип с естественным звучанием.

Распознавание речи при помощи Arduino Nano: пример простой системы

Время на прочтение2 мин
Количество просмотров15K
image

Разработчик по имени Питер, как и многие из нас, попал на долгое время в ловушку карантина. У него появилось свободное время, причем много, и Питер решил разработать систему распознавания речи на базе Arduino Nano.

Оборудование, как можно догадаться, не особо сложное. Основной компонент в этой системе — программное обеспечение. Питеру пришлось повозиться не только с обычным софтом, но и заняться низкоуровневым программированием контроллера.
Читать дальше →

Голосовой ИИ: технологии под капотом цифрового агента

Время на прочтение5 мин
Количество просмотров3.9K
image

Привет, Хабр! Сегодня мы предлагаем поговорить про так называемый голосовой искусственный интеллект и про технологии, которые делают его «умным». Кроме того, поговорим и о «магии» нашей голосовой платформы — о том, что позволяет голосовому агенту вести нормальную беседу с человеком.

Технологии достигли настолько высокого уровня, что даже профессионалы, которые занимаются разработкой голосовых технологий, зачастую затрудняются отличить робота от человека. Кстати, эта статья подготовлена по выступлению СТО Neuro.net Игоря Десятникова на Tech Week 2021. Если не хочется читать статью — вот видео, если же нужны подробности, то все самое интересное — под катом.

Кто такой СТО и каковы его задачи? Личный опыт и мнение технического директора

Время на прочтение6 мин
Количество просмотров48K


Привет, Хабр! Меня зовут Игорь Десятников, я Chief Technical Officer в компании Neuro.net. Несколько раз встречал на Хабре статьи с попыткой рассказать о роли СТО, об эволюции этой должности при расширении компании и т.п. С некоторыми вещами согласен, с другими — нет.

Сегодня расскажу о своем видении позиции СТО. Если получится — было бы отлично поднять в комментариях дискуссию. Если вы с чем-то не согласны, просто хотите дополнить или поделиться собственным опытом — давайте обсудим.
Читать дальше →

DeepMind считает, что обучения с подкреплением хватит для разработки сильной формы искусственного интеллекта

Время на прочтение5 мин
Количество просмотров7.6K
image

В многолетней погоне за созданием искусственного интеллекта IT-специалисты спроектировали и разработали всевозможные сложные механизмы и технологии для создания аналогов зрения, языка, мышления, моторики и других способностей, присущих разумной жизни. Хотя эти усилия и привели к созданию систем слабой формы искусственного интеллекта, которые могут эффективно решать определенные проблемы в ограниченных условиях и окружении, такие системы и в подметки не годятся уровню интеллекта не только людей, но и животных.

В новой статье, опубликованной в рецензируемом научном журнале Artificial Intelligence, ученые из DeepMind утверждают, что интеллект и связанные с ним способности появятся не в результате формулирования и решения сложных проблем, а в результате соблюдения простого, но действенного принципа: максимизация вознаграждения. Речь идет про обучение с подкреплением.
Читать дальше →

Microsoft разработала ИИ-систему, преобразующую простые текстовые запросы в код

Время на прочтение4 мин
Количество просмотров3.7K
image

Корпорация Microsoft на конференции для разработчиков Microsoft Build, которая прошла несколько дней назад, представила интересную новинку. Это модель обработки естественного языка GPT-3 от OpenAI, позволяющая создавать приложения с минимальным знанием языков программирования.

Да, здесь открывается широкий простор для шуток, но у этой разработки неплохие перспективы. Модель преобразует запросы на обычном языке — пока что лишь английском, в код. Результат преобразования не слишком сложный, все же нейросеть не в состоянии написать код на несколько тысяч строк по парочке обычных вопросов. Но потенциал у разработки есть, и немалый.
Читать дальше →

ИИ-технологии компании Aflorithmic помогли цифровому помощнику заговорить голосом Эйнштейна

Время на прочтение2 мин
Количество просмотров1.2K

Технологии быстро развиваются, это касается многих отраслей и направлений. Одно из них - цифровые помощники, которые учатся общаться с человеком при помощи искусственного интеллекта. Ученым из компании Aflorithmic удалось не только научить своего робота общаться, но и восстановить голос Альберта Эйнштейна. Теперь умный ассистент компании говорит голосом великого ученого.

В проекте Aflorithmic также принял участие стартап UneeQ. Они разместили чат-бота на своем сайте, так что при желании поговорить с ним может любой желающий. Восстановление голоса ученого реализовано благодаря сохранившимся записям, пусть и неидеального качества, и описаниям людей, которые с ним общались.

Читать далее

Зачем нам потребовалось написать свою реализацию MRCP-сервера. Часть 1

Время на прочтение4 мин
Количество просмотров3.2K

Привет, Хабр! Сегодня мы хотели бы поделиться кейсом создания собственного MRCP-сервера. Это протокол передачи данных, используемый серверами для предоставления различных услуг (таких как распознавание речи и синтез речи) для своих клиентов. MRCP опирается на другие протоколы, в частности, потоковый протокол реального времени (протокол RTSP) или протокол установления сеанса связи (протокол SIP) для установления и управления сеансом аудиопотоков между клиентом и сервером. О том, что нас привело к созданию собственной реализации этого сервера - под катом. Во второй части расскажем об особенностях своего проекта, с подробным разбором возможностей. 

Читать далее

Как мы развернули круглосуточную техническую поддержку с нуля всего за 1 год

Время на прочтение6 мин
Количество просмотров5.5K

И снова здравствуйте. Сегодня мы бы хотели обсудить не столько вопрос разработки технологий, о которых мы рассказывали в этой и вот этой статьях, сколько вопрос поддержки клиентов, которые эти технологии используют. На самом деле, это вовсе не праздный вопрос, а решение сложной проблемы, не менее трудной, чем обучение многослойной нейросети. Техподдержка - одна из головных болей стартапов и молодых компаний. 

Ведь хочется, чтобы поддержка продукта была круглосуточной и круглогодичной, а клиенты были всем довольны. Когда планируешь, как все это будет работать, то нередко рисуешь себе идеальную картину с розовыми пони. К сожалению, в реальной жизни все немного иначе - розовые пони исчезают сразу, как начинается планирование службы поддержки со всеми деталями, включая стоимость оплаты услуг специалистов, планирование смен, ТК РФ. Сегодня хотим поделиться опытом.

Читать далее

Как мы визуальный конструктор обучения цифровых агентов разработали

Время на прочтение6 мин
Количество просмотров2.4K

И снова привет, Хабр! В прошлой статье мы рассказывали, как создаем голосового агента (предпочитаем этот термин, а не "голосовой робот") всего на 500 записях. Если кратко вспомнить содержание, то мы научились успешно обучать агентов на очень небольшой базе звонков.

Чтобы было понятно, зачем это - наша компания предоставляет услуги контакт-центра на базе искусственного интеллекта. Ну а для построения логики диалога мы используем визуальный конструктор, который повышает эффективность этой работы. В новой статье как раз и рассказываем о том, что за система и как она работает. Со скриншотами и кейсами - все, как вы любите. 

Читать далее

Hi-tech коммуникации, или как мы создаем голосового агента всего на 500 записях

Время на прочтение8 мин
Количество просмотров2.2K
image

На Хабре не раз и не два писали о голосовых роботах, принципах их работы и задачах, которые они способны решать. Соответственно, общие принципы создания таких роботов (их мы предпочитаем называть «цифровыми агентами) понятны многим. И это хорошо, ведь в этой статье мы хотели бы поговорить о быстром обучении роботов.

Нам удалось успешно обучать агентов на очень ограниченной базе звонков. Минимальное количество записей, на основе которых можно разработать полноценного цифрового агента — всего 500. (Спойлер — речь идет, скорее, о специализации ассистента, а не обучении с нуля). Как происходит обучение, и какие здесь есть подводные камни, особенности, что лежит в основе технологии? Об этом сегодня и поговорим.

Нижний Новгород для IT-специалиста: перспективы для работы и возможности для жизни

Время на прочтение6 мин
Количество просмотров20K
image

Где айтишнику жить хорошо? Многие города и страны готовы приютить представителей IT-отрасли. Но иногда далеко и ходить уезжать не приходится — все нужное есть рядом. Мне, как жителю Нижнего Новгорода, кажется, что этот город отлично подходит для IT-специалистов.

В этой статье я стараюсь аргументированно показать, почему это так. Но, конечно, это мнение (как и любое другое) несколько субъективно, поэтому предлагаю обсудить все в комментариях.
Читать дальше →

Будущее уже здесь: как работают голосовые роботы и что они умеют делать

Время на прочтение7 мин
Количество просмотров8.3K
image

Роботизация рутинных операций, когда для решения простых и одновременно трудоемких задач используются роботы, а не люди — весьма активный тренд. Автоматизируется многое, включая телефонные разговоры с клиентами. Компания Neuro.net занимается созданием технологий, которые дают возможность улучшить возможности роботов.

В этой статье разработчики рассказывают о технологиях и нюансах распознавания пола собеседника по голосу и работе над важными элементами диалога.
2