Статьи / Профиль nvpushkarskiy2 / Хабр

@nvpushkarskiy2

X-ray vision and laser beam eyes

Профиль Публикации 41Комментарии 47Закладки 47

nvpushkarskiy2 29 мая 2020 в 14:49

Снятся ли выключателям вопросы морали (и электроовцы)?

4 мин

5.1K

Блог компании VoximplantБудущее здесьИскусственный интеллектКиберпанкМашинное обучение*

Перевод

Прямо сейчас в компьютерных сетях происходит революция: устройства все лучше оценивают происходящее вокруг себя, при этом анализируя данные локально, то есть «здесь и сейчас». Благодаря этому устройства могут предложить людям все бОльшую функциональность, не обращаясь к облаку. Но смогут ли в итоге выключатели освещения озаботится вопросами морали?

Читать дальше →

+27

nvpushkarskiy2 27 апр 2020 в 15:01

SIP-коннектор Telegram + Voximplant = звонки на сотовые и софтфоны

4 мин

8.7K

Блог компании VoximplantJavaScript*Программирование*Разработка систем связи*Мессенджеры*

Туториал

Для телеграма разработали SIP-коннектор (@siptg). Voximplant – это платформа телефонии. Правильно, они могут прекрасно работать в паре и сегодня мы покажем, как. Добро пожаловать под кат!

Читать дальше →

+24

nvpushkarskiy2 26 мар 2020 в 15:52

AI против COVID-19: опыт Хубэя и Флориды

4 мин

10K

Блог компании VoximplantБудущее здесьИскусственный интеллектМашинное обучение*

Перевод

Ученый работает над вакциной против COVID-19 в Университете Копенгагена. Дания, 23 марта 2020.

Всего за 10 дней количество заболевших COVID-19 увеличилось более чем вдвое – 153 тысячи 14 марта против 372 тысяч 24 марта. Даже с учетом совместных усилий и ресурсов китайских экспертов и «Врачей без границ», высокая скорость распространения вируса в Италии привела к полному заполнению больниц, невозможности принимать новых пациентов в реанимацию и, как следствие, повышенной смертности по сравнению с другими странами.

Читать дальше →

+19

nvpushkarskiy2 19 фев 2020 в 15:40

Contact Center AI: третий участник в разговоре – это нормально

4 мин

4.1K

Блог компании VoximplantГолосовые интерфейсы*Искусственный интеллектМашинное обучение*

Наши клиенты и читатели блога знают про Dialogflow – платформу для создания умных ботов. Именно Dialogflow лежит в основе Contact Center AI (далее CCAI) от корпорации добра. Схематично стек технологии равен DialogFlow + WaveNet (text-to-speech) + voice recognition (speech-to-text), на выходе оно расширяет возможности обычного колл-центра, а именно позволяет оказывать более персонализированные услуги поддержки. Как именно? Рассказываем под катом и даем примеры успешной интеграции, добро пожаловать!

+22

nvpushkarskiy2 17 янв 2020 в 14:40

Проект Neon от Samsung: цифровые банкиры, телеведущие, компаньоны

5 мин

13K

Блог компании VoximplantБудущее здесьИскусственный интеллектКиберпанк

Перевод

Суперреалистичные цифровые люди из проекта Neon – настоящие. Ну, вроде того. И да, не спрашивайте у них прогноз погоды…

Загадочная компания, выросшая из Samsung Technology и Advanced Research Labs (STAR Labs), показала себя на выставке CES 2020 в Лас-Вегасе с 7 по 10 января. Они презентовали технологию Neon – «виртуальное существо, которое выглядит и ведет себя как человек, проявляет эмоции и разумность». По сути, Neon создает видеочат-ботов (далее – неоны), которые выглядят как настоящие люди; это не всезнающие ассистенты, андроиды, заменители или копии людей, Они не расскажут вам о погоде или когда умер Авраам Линкольн. «Неоны – это не ИИ-ассистенты, они больше похожи на нас. Это независимые, хоть и виртуальные, существа, которые учатся на собственном опыте. Они не знают всего на свете и они – не интерфейс для доступа в Интернет, чтобы уточнять, какая погода за окном или включать вашу любимую музыку», – говорят в компании.

+29

nvpushkarskiy2 11 дек 2019 в 15:00

CIMON-2: (не)судный день, или как IBM Watson забрался выше облаков

6 мин

3.4K

Блог компании VoximplantГолосовые интерфейсы*Искусственный интеллектМашинное обучение*

Перевод

CIMON – Crew Interactive Mobile CompanioN (далее «Саймон») – научная разработка аэрокосмического агентства Airbus и IBM, спонсированная германским центром авиации и космонавтики DLR. В прошлом году его впервые испытали «в бою» на МКС, а в этом месяце начали испытание второй версии помощника. Так как нам интересно все, что связано с высокотехнологичными и прорывными коммуникациями – например, мы уже писал про работу с IBM Watson – то мы не смогли пройти мимо этой новости и подготовили перевод-компиляцию из нескольких зарубежных материалов, чтобы понять самим и сообщить вам – зачем астронавтам условная Алиса/Алекса/{you name it}? Под катом вас ждет хронология событий, цитаты сопричастных и небольшой вывод. Приятного чтения!

+23

nvpushkarskiy2 20 ноя 2019 в 12:00

Хранилище key-value, или как наши приложения стали удобнее

3 мин

6.1K

Блог компании VoximplantJavaScript*Программирование*Хранилища данных*

Туториал

Тот, кто разрабатывает на Voximplant, знает о концепции «приложений», которые связывают друг с другом облачные сценарии, телефонные номера, пользователей, правила и очереди звонков. Проще говоря, приложения – это краеугольный камень разработки на нашей платформе, входная точка в любое решение на основе Voximplant, так как именно с создания приложения все и начинается.

Раньше приложения «не помнили» ни действия, что выполняют сценарии, ни результаты вычислений, так что разработчики были вынуждены сохранять значения в сторонних сервисах или на своем бэкенде. Если вы когда-либо работали с local storage в браузере, то наша новая функциональность весьма похожа на это, т.к. позволяет приложениям запоминать пары «ключ-значение», которые уникальны для каждого приложения в вашем аккаунте. Работа хранилища стала возможна благодаря новому модулю ApplicationStorage – под катом вас ждет краткое руководство по его использованию, welcome!

Читать дальше →

+24

nvpushkarskiy2 5 ноя 2019 в 13:28

Стриминг видеозвонков по RTMP

6 мин

6.9K

Блог компании VoximplantJavaScript*Программирование*Работа с видео*Веб-разработка*

Туториал

Сегодня стриминг-платформы на пике популярности, так как миллионы талантливых людей регулярно делятся своими знаниями – читай, используют стриминг на всю катушку. Так как этот рынок растет, то существует и масса приложений, которые могут стримить видео в реальном времени, используя камеру смартфона или ноутбука. Возможно, вы тоже хотите внедрить в ваше приложение такую функциональность; если так, то спешим обрадовать – теперь Voximplant позволяет прокидывать видеозвонки по RTMP в любой CDN, который поддерживает этот протокол.

Эта функциональность стала возможна благодаря новому модулю Voxengine – StreamingAgent. Под катом вас ждут 5 шагов по настройке этой интеграции, добро пожаловать!

Читать дальше →

+22

nvpushkarskiy2 2 окт 2019 в 12:08

Исследование: если покупатель понимает, что говорит с чат-ботом, то покупка не состоится вовсе

4 мин

19K

Блог компании VoximplantИскусственный интеллектМашинное обучение*Программирование*

Перевод

Нет времени объяснять, вот главные постулаты сегодняшнего перевода:

чат-боты не имеют предельных издержек и продают в 4 раза больше, чем люди;
вероятность продажи падает на 79%, если люди понимают, что говорят с роботом;
потребители воспринимают роботов как менее компетентных и эмпатичных.

Под катом – подробности исследования и инсайты от ученых. Приятного чтения!

Читать дальше →

+40

nvpushkarskiy2 2 сен 2019 в 12:51

Zabbix + Voximplant: мониторинг со звонками, или как перестать беспокоиться и быстро это настроить

5 мин

9.4K

Блог компании VoximplantJavaScript*Настройка Linux*Разработка систем связи*Системное администрирование*

Туториал

Zabbix – умный, гибкий, кастомизируемый – умеет все. Или почти все. Было бы странно, если бы он не мог подружиться с облачной телефонией, особенно когда у последней есть удобное HTTP API – пользуйся на здоровье. Сегодня мы наглядно покажем, как настроить Zabbix для звонков-уведомлений через Voximplant, что может быть очень кстати в экстренном случае («нет времени объяснять, нужно звонить – боевой сервер упал только что»).

За основу взят кадр из х/ф «Матрица» (The Matrix (1999), Warner Bros.)

Внимание: туториал подразумевает, что у вас уже есть работающий Zabbix и настроен Zabbix frontend. Первичная установка Zabbix не является целью этой статьи, любопытные/нуждающиеся в таком руководстве могут посмотреть официальную документацию и/или погуглить.

Читать дальше →

+21

nvpushkarskiy2 12 авг 2019 в 13:00

Протокол QUIC в деле: как его внедрял Uber, чтобы оптимизировать производительность

12 мин

15K

Блог компании VoximplantIT-стандарты*Разработка мобильных приложений*Разработка систем связи*Сетевые технологии*

Перевод

За протоколом QUIC чрезвычайно интересно наблюдать, поэтому мы любим писать о нем. Но если предыдущие публикации о QUIC носили больше исторический (краеведческий, если хотите) характер и матчасть, то сегодня мы рады опубликовать перевод другого толка – речь пойдет про реальное применение протокола в 2019 году. Причем речь не про малую инфраструктуру, базирующуюся в условном гараже, а про Uber, который работает почти по всему миру. Как инженеры компании пришли к решению использовать QUIC в продакшене, как проводили тесты и что увидели после раскатки в прод – под катом.

Картинки кликабельны. Приятного чтения!

Читать дальше →

+37

nvpushkarskiy2 26 июл 2019 в 16:34

Распознавание эмоций с помощью сверточной нейронной сети

8 мин

24K

Блог компании VoximplantЗвукИскусственный интеллектМашинное обучение*Программирование*

Перевод

Распознавание эмоций всегда было захватывающей задачей для ученых. В последнее время я работаю над экспериментальным SER-проектом (Speech Emotion Recognition), чтобы понять потенциал этой технологии – для этого я отобрал наиболее популярные репозитории на Github и сделал их основой моего проекта.

Прежде чем мы начнем разбираться в проекте, неплохо будет вспомнить, какие узкие места есть у SER.

Читать дальше →

+30

nvpushkarskiy2 9 июл 2019 в 20:59

Интеллектуальные CPaaS: новинки индустрии и что ей дали AI/ML

6 мин

4.3K

Блог компании VoximplantПрограммирование*Веб-разработка*Разработка мобильных приложений*Разработка систем связи*

В июне в Амстердаме прошлая очередная APIDays – конференция для всех, кто так или иначе создает и пользуется различными API. Темой конференции стал «расцвет контекстуальных коммуникаций», то есть коммуникаций, в которых обе стороны сразу и полностью понимают контекст общения. Звучит абстрактно, поэтому пара примеров: вам звонят с незнакомого номера. Соответственно, вы не знаете, кто звонит, откуда и с какой целью. И напротив, если вы делаете какую-то операцию в приложении интернет-банкинга и на каком-то шаге что-то пошло не так, вы можете прямо с этого шага позвонить в поддержку – контекст ситуации с ходу будет ясен как вам, так и оператору. Чтобы обеспечивать такую осведомленность, бизнесы используют коммуникационные платформы (CPaaS, Communications Platform as a Service), а те, в свою очередь, используют AI и Machine Learning. Именно об этом и рассказывал наш CEO Алексей Айларов, выступая на APIDays, а сегодня мы публикуем адаптацию июньского выступления.

Читать дальше →

+24

nvpushkarskiy2 14 июн 2019 в 12:43

Dav1d – самый быстрый декодер AV1 теперь в Firefoх по умолчанию

3 мин

12K

Блог компании VoximplantFirefoxПрограммирование*Работа с видео*

Перевод

Вступление от Voximplant

Да, мы не впервые пишем про AV1 – у нас уже был перевод про Chrome 70 с поддержкой кодека, и вот мы снова делимся новостями. В этот раз – слово Nathan Egge, старшему инженеру Mozilla и участнику фонда Xiph.org, который порадовал новостью про дефолтную поддержку AV1. Трудно переоценить важность этого кодека для современных стриминговых сервисов, равно как и для real-time приложения для аудио/видеосвязи. Почему dav1d, чем он отличается от первого декодера AV1, немного графиков из бенчмарков и прогноз на будущее – коротко и по делу, прошу под кат.

Читать дальше →

+55

nvpushkarskiy2 17 мая 2019 в 16:12

Элементарно, Watson: вы интегрируетесь с Voximplant

5 мин

3.2K

Блог компании VoximplantJavaScript*Машинное обучение*Программирование*Разработка систем связи*

Туториал

Работа с естественными языками (NLU, NLP) – зона активной конкуренции между IT-гигантами. Равно как и развитие ИИ. Ну и, соответственно, пересечение этих множеств – тоже горячая ниша, за которой интересно наблюдать и осваивать новое. Voximplant давно подружился с гугловским Dialogflow, причем настолько хорошо, что мы сделали обертку для этой интеграции – Dialogflow Connector. У корпорации IBM есть аналог, Voice Agent на основе Watson, который выполняет ту же задачу – автоматизировать гибкое, адекватное общение с клиентом, чтобы заменить классический IVR. Мы попробовали технологию на простом демо и сегодня пошагово расскажем, как сделать также. А пока вы будете это читать, наши разработчики продолжат делать обертку уже для этой интеграции…

Читать дальше →

+27

nvpushkarskiy2 15 апр 2019 в 08:54

Основы Natural Language Processing для текста

12 мин

203K

Блог компании VoximplantPython*Машинное обучение*Программирование*

Перевод

Обработка естественного языка сейчас не используются разве что в совсем консервативных отраслях. В большинстве технологических решений распознавание и обработка «человеческих» языков давно внедрена: именно поэтому обычный IVR с жестко заданными опциями ответов постепенно уходит в прошлое, чатботы начинают все адекватнее общаться без участия живого оператора, фильтры в почте работают на ура и т.д. Как же происходит распознавание записанной речи, то есть текста? А вернее будет спросить, что лежит в основе соврменных техник распознавания и обработки? На это хорошо отвечает наш сегодняшний адаптированный перевод – под катом вас ждет лонгрид, который закроет пробелы по основам NLP. Приятного чтения!

+29

nvpushkarskiy2 11 мар 2019 в 16:10

Обновить панель управления для CPaaS: заново придумать UI/UX и внедрить IDE нормального человека

3 мин

3.2K

Блог компании VoximplantПрограммирование*Веб-разработка*Разработка систем связи*

Возможно, вы уже успели попробовать новую панель, пока она была в открытой бете: в старой панели была специальная кнопка для переключения. Как бы то ни было, теперь новая панель доступна всем.

И это не просто релиз, а настоящее переосмысление UI/UX управления аккаунтами Voximplant. Приглашаю всех под кат – вас ждет обзор самых существенных нововведений.

На всякий случай: скриншоты кликабельны.

Читать дальше →

+30

nvpushkarskiy2 22 фев 2019 в 13:26

DataChannels на QUIC: первые шаги

6 мин

3.5K

Блог компании VoximplantIT-стандарты*Разработка систем связи*Сетевые технологии*

Перевод

DataChannels, основанные на QUIC, считаются альтернативой нынешнему SCTP-транспорту. Рабочая группа WebRTC в Google уже экспериментирует с ними:

Looking for feedback: QUIC based RTCQuicTransport and RTCIceTransport API's are available as origin trial in Chrome 73 for experimentation.https://t.co/KVVEVmggms
— WebRTC project (@webrtc) February 1, 2019

Давайте мы тоже попробуем. Для этого мы создадим одностраничное приложение, похожее на пример WebRTC-канала для передачи текста – это полностью рабочий пример (причем без сигнальных серверов), который, к тому же, позволит легко сравнить подходы к реализации WebRTC DataChannels.

+25

nvpushkarskiy2 11 дек 2018 в 12:02

Каскадные SFU: улучшаем масштабируемость и качество медиа в WebRTC-приложениях

7 мин

7.2K

Блог компании VoximplantJavaScript*Программирование*Разработка систем связи*Сетевые технологии*

Перевод

В развертывании медиасерверов для WebRTC есть две сложности: масштабирование, т.е. выход за рамки использования одного сервера и оптимизация задержек для всех пользователей конференции. В то время как простой шардинг в духе «отправить всех юзеров конференции X на сервер Y» легко масштабируется горизонтально, он все же далеко не оптимален в плане задержек. Распределять конференцию по серверам, которые не только близко расположены к пользователям, но и взаимосвязаны – звучит как решение для обеих проблем. Сегодня мы подготовили перевод подробного материала от Бориса Грозева из Jitsi: проблемы каскадных SFU, с описанием подхода и некоторых трудностей, а также подробности внедрения. Стоит сказать, что конференции Voximplant тоже используют SFU; сейчас мы работаем над каскадированием SFU, которое должно появиться в нашей платформе в следующем году.

Мышиные нейроны. Изображение NIHD (CC-BY-2.0)

Читать дальше →

+28

nvpushkarskiy2 3 дек 2018 в 12:12

Тактичный робот: умеет слушать и не перебивает

5 мин

4.3K

Блог компании VoximplantJavaScript*Программирование*Веб-разработка*Разработка мобильных приложений*

Туториал

Распознавание речи (далее – ASR, Automatic Speech Recognition) используется при создании ботов и/или IVR, а также для автоматизированных опросов. Voximplant использует ASR, предоставляемый «корпорацией добра» – гугловское распознавание работает быстро и с высокой точностью, но… Как всегда, есть один нюанс. Человек может делать паузы даже в коротких предложениях, при этом нам нужна гарантия, что ASR не воспримет паузу как окончание ответа. Если ASR думает, что человек закончил говорить, то после «ответа» сценарий может включить синтез голоса со следующим вопросом – в это же самое время человек продолжит говорить и получит плохой пользовательский опыт: бот/IVR перебивает человека. Сегодня мы расскажем, как с этим бороться, чтобы ваши пользователи не огорчались от общения с железными помощниками.

+30

2 3