Как стать автором
Обновить
40
0
Юрий Бабуров @buriy

Web, AI, Deep Learning, Python

Отправить сообщение

Речевой бот в банке — худший UX ever

Время на прочтение4 мин
Количество просмотров33K
— Добрый вечер, меня зовут Наталья, чем я могу Вам помочь?
— Здравствуйте, у меня была заблокирована карта.
— Хорошо, назовите свое имя.
— Василий Моржаков.
(вбивает на клавиатуре)
— Ваше кодовое слово?
— Декобраз через Е.
— Простите, Вас не слышно.
— Де-ко-браз, через ЕЕ
— Что-то со связью, извините, можете повторить? (и кажется вешают трубку)

И вот я знаю немного про речевой ИИ, про ботов читал вчера Хабр, но все еще не могу понять, что же происходит.
Читать дальше →
Всего голосов 78: ↑77 и ↓1+103
Комментарии178

Мия — помощница из смартфона

Время на прочтение4 мин
Количество просмотров7.8K
Чем крупнее компания, тем больше вопросов возникает у сотрудников-новичков. К кому обратиться по поводу оснащения рабочего места? Куда начисляется зарплата? Как проходят корпоративные праздники? Где можно перекусить в обеденный перерыв? Вопросы не бог весть какой сложности, но получить на них ответы в одном месте обычно не получается, а спрашивать постоянно о всяких мелочах своих новых коллег не удобно, пока не освоишься в коллективе. Мы решили помочь новичкам адаптироваться в нашей компании и создали для этого в Telegram чат-бота по имени Мия — «М.Видео и я». Причём делали мы её на голом энтузиазме и Agile.
Читать дальше →
Всего голосов 19: ↑16 и ↓3+13
Комментарии13

Исследование топ-50 чат-бот платформ и виртуальных ассистентов 2019 года

Время на прочтение5 мин
Количество просмотров16K
Согласно исследованию ResearchAndMarket, мировой рынок чат-ботов и виртуальных ассистентов в 2019 году составляет около 2 миллиардов долларов и растет на 30% в год. В исследовании рассмотрены наиболее популярные в мире чат-бот-платформы, среди которых есть три решения от российских разработчиков — DeepPavlov, Electra.AI и Just.AI.

Лаборатория бизнес-решений на основе Центра компетенций НТИ по Искусственному интеллекту МФТИ представляет рейтинг 50 чат-бот платформ и виртуальных ассистентов 2019 года. В работе были рассмотрены 50 инструментов для создания чат-ботов, наиболее широко представленных на мировом рынке. Степень проникновения каждого продукта на рынок оценивалась по таким признакам, как количество публикаций с упоминанием платформы, число публичных кейсов по ее использованию, частота упоминаний в профессиональном сообществе, а также по результатам сбора консолидированного мнения экспертов рынка, которые приняли участие в создании данного отчета.



Читать дальше →
Всего голосов 10: ↑9 и ↓1+8
Комментарии4

Новостной агрегатор за две недели

Время на прочтение8 мин
Количество просмотров18K

18 ноября Telegram запустил соревнование по кластеризации данных: Data Clustering Contest. Нужно было за две недели сделать свой новостной агрегатор. Ограничения, которые были установлены в этом соревновании отпугнули кучу людей, но не меня и моих коллег. Я расскажу от том, каким путём мы прошли, какие выборы сделали и с какими сложностями столкнулись. Решение, которое мы заслали в соревнование обрабатывало 1000 документов за 3,5 секунды, занимало 150 Мб, заняло 6 место на публичном голосовании и 3 место в итоговых результатах. Мы допустили много ошибок, из-за которых не заняли место повыше, большинство из них сейчас исправлены. Весь код и все модели можно найти в репозитории. Все скрипты для обучения моделек перенесены на Colab.


Топ из публичного голосования
Топ из публичного голосования

Читать дальше →
Всего голосов 17: ↑17 и ↓0+17
Комментарии4

Собеседование здорового человека

Время на прочтение4 мин
Количество просмотров98K
Эта статья написана как ответ на статью «Собеседование в Додо Пиццу» со стороны разработчика с опытом синьора. Я не претендую на истинность суждений, мне хотелось бы выразить довольно популярное среди моих знакомых мнение о процессе найма в частности и жизни разработчика в целом.
Читать дальше →
Всего голосов 291: ↑277 и ↓14+327
Комментарии473

Как получать оповещения от Jupyter notebook в Telegram?

Время на прочтение2 мин
Количество просмотров16K

Довольно просто. Нам понадобится свой телеграм-бот, один пакет и одна строчка кода
А результат будет таким:

Читать дальше →
Всего голосов 40: ↑31 и ↓9+22
Комментарии17

Я больше не хочу работать, никогда и ни над чем. Но из меня научились выжимать результаты

Время на прочтение7 мин
Количество просмотров272K


Дерьмовое утро удалёнщика всегда начинается одинаково. Если детский плач не смог вытащить меня из кровати, то нытье жены сделает это с гарантией. Сумасшедшие девять утра, через час дейли-синк-ап, а за вчера, как всегда, сделано нихрена. Быстро варю кофе и за комп. За пять минут до созвона пулл реквест с кодом энтерпрайзного качества увесисто встал в очередь на билд. Иду курить, но по дороге телефон заорал — я зачем-то установил на него скайп, и теперь работа может добраться до меня где угодно. Курение откладывается, я готовлюсь возмущаться, что мне позвонили раньше положенного. Напялил наушники, принял вызов. Вместо привычной девушки менеджера созвон начал какой-то незнакомый мне чел. «Всем привет, Аня заболела, я буду её замещать». Окей, кому какое дело, с таким же успехом они могли бы прислать нам в качестве менеджера собаку — ничего бы не изменилось.
Читать дальше →
Всего голосов 420: ↑345 и ↓75+353
Комментарии780

Огромный открытый датасет русской речи версия 1.0

Время на прочтение2 мин
Количество просмотров19K

image


В начале этого года по ряду причин мы загорелись идеей создать самый большой открытый датасет русской речи. Подробнее о нашей мотивации и о том, как всё начиналось,
можно прочитать в этой статье — Огромный открытый датасет русской речи. С тех пор наш проект прошел через ряд масштабных изменений, мы в три раза увеличили количество данных, повысили их качество, добавили лейблы для спикеров и сейчас мы наконец готовы представить вам версию 1.0.


Также мы не готовы останавливаться на достигнутом и планируем продолжать делать интесивную работу над ошибками в последующих версиях и улучшать качество уже опубликованных данных. Версию 1.1 мы планируем посвятить масштабной работе над ошибками.

Читать дальше →
Всего голосов 46: ↑41 и ↓5+36
Комментарии18

Дмитрий Мацкевич, Dbrain: о предпринимательстве как психическом отклонении, ИИ и эмоциональной безопасности

Время на прочтение18 мин
Количество просмотров8.8K


Первая часть моего разговора с Дмитрием Мацкевичем, основателем и CEO ИИ-стартапа Dbrain и популяризатором нейронауки. Это очередное в серии интервью с топовыми специалистами в своих областях про продуктовый подход, предпринимательство, психологию и изменение поведения.

Читать дальше →
Всего голосов 14: ↑12 и ↓2+10
Комментарии3

Исправляем опечатки в поисковых запросах

Время на прочтение14 мин
Количество просмотров19K
Наверное, любой сервис, на котором вообще есть поиск, рано или поздно приходит к потребности научиться исправлять ошибки в пользовательских запросах. Errare humanum est; пользователи постоянно опечатываются и ошибаются, и качество поиска от этого неизбежно страдает — а с ним и пользовательский опыт.

При этом каждый сервис обладает своей спецификой, своим лексиконом, которым должен уметь оперировать исправитель опечаток, что в значительной мере затрудняет применение уже существующих решений. Например, такие запросы пришлось научиться править нашему опечаточнику:



Может показаться, что мы отказали пользователю в его мечте о вертикальной реальности, но на самом деле буква К просто стоит на клавиатуре рядом с буквой У.

В этой статье мы разберём один из классических подходов к исправлению опечаток, от построения модели до написания кода на Python и Go. И в качестве бонуса — видео с моего доклада «”Очки верткальной реальности”: исправляем опечатки в поисковых запросах» на Highload++.
Всего голосов 22: ↑21 и ↓1+20
Комментарии8

Как попасть в топ Google в ЕС/США в нише разработки и найти клиентов с большими бюджетами

Время на прочтение8 мин
Количество просмотров8.4K
Пост лучше всего подойдет разработчикам «one-man-company» или командам. Я расскажу, как достаточно легко и просто (при отсутствии или минимальном бюджете) попасть в топ поисковой выдачи в развитых странах в нише разработки и перестать бороться за клиентов в СНГ, которые хотят круто, классно, без ТЗ (ну ты понял, бро, хотим, чтобы все было красиво) и так, чтобы за $4/час и вообще оплата по факту. В конце попробую свести все в чеклист. Кто попробует ему следовать и отпишется о результатах в комментариях, обязательно дам фидбек с советами.


Читать дальше →
Всего голосов 21: ↑17 и ↓4+13
Комментарии14

«Сгоревшие» сотрудники: есть ли выход?

Время на прочтение18 мин
Количество просмотров161K
Ты работаешь в хорошей компании. Вокруг тебя крутые профессионалы, получаешь достойную зарплату, каждый день делаешь важные и нужные вещи. Илон Маск запускает спутники, Сергей Семёнович улучшает и без того лучший город Земли. Погода отличная, солнце светит, деревья цветут — живи да радуйся!

Но в твоём коллективе есть Грустный Игнат. Игнат всегда мрачный, циничный и уставший. Он отличный специалист, давно работает в компании и знает, как всё устроено. Игнату все хотят помочь. Особенно ты, ведь ты его менеджер. Но, поговорив с Игнатом, ты и сам начинаешь чувствовать, как много вокруг несправедливости. И тоже начинаешь грустить. Но особенно страшно, если грустный Игнат — это ты.

Что же делать? Как работать с Игнатом? Добро пожаловать под кат!


Всего голосов 224: ↑210 и ↓14+196
Комментарии400

Pitch-tracking, или определение частоты основного тона в речи, на примерах алгоритмов Praat, YAAPT и YIN

Время на прочтение10 мин
Количество просмотров23K
image

В сфере распознавания эмоций голос – второй по важности после лица источник эмоциональных данных. Голос можно охарактеризовать по нескольким параметрам. Высота голоса – одна из основных таких характеристик, однако в сфере акустических технологий корректнее называть этот параметр частотой основного тона.

Частота основного тона имеет непосредственное отношение к тому, что мы называем интонацией. А интонация, например, связана с эмоционально-экспрессивными характеристиками голоса.

Тем не менее, определение частоты основного тона является не совсем тривиальной задачей с интересными нюансами. В этой статье мы обсудим особенности алгоритмов для ее определения и сравним существующие решения на примерах конкретных аудиозаписей.
Читать дальше →
Всего голосов 33: ↑32 и ↓1+31
Комментарии7

История одного лендинга: привлек много клиентов и был скопирован под сотню раз

Время на прочтение6 мин
Количество просмотров57K
Привет, Хабр! Я Руслан Кокин, UX-дизайнер в компании UXhot, и у меня есть необычная история про лендинг, а также состояние копирайта в России.



Среди созданных нами продуктов есть по-настоящему легендарный лендинг пейдж, ставший донором для зарождающегося в интернете сегмента механизированной штукатурки. За три года работы он не только привлёк много клиентов, но и был скопирован почти 100 раз. Хотите узнать, что такого особенного в нем было?
Читать дальше →
Всего голосов 139: ↑134 и ↓5+129
Комментарии77

Чисти, размечай: как мы учили чатбот различать клиентские вопросы

Время на прочтение11 мин
Количество просмотров4.5K


Антон Чайников, разработчик Data Science, Redmadrobot
Привет, Хабр! Сегодня я расскажу о терниях на пути к чатботу, облегчающему работу операторам чата страховой компании. А точнее, как мы учили бота отличать друг от друга запросы с помощью машинного обучения. С какими моделями экспериментировали и какие получили результаты. Как сделали четыре подхода к чистке и обогащению данных приличного качества и пять попыток чистки данных качества «неприличного».

Читать дальше →
Всего голосов 15: ↑12 и ↓3+9
Комментарии2

Графический интерфейс или чат бот в управлении проектами: что эффективнее?.. Практический эксперимент

Время на прочтение6 мин
Количество просмотров5.4K
Лет 30 назад во многих книгах по искусственному интеллекту утверждалось, что в будущем общение человека с компьютером будет происходить на естественном языке, а все другие интерфейсы уйдут в прошлое. Такую же картину часто можно видеть в различных фантастических фильмах. Но действительно ли голосовой интерфейс эффективнее? В нашем опыте мы заменим систему управления проектами в организации на чатбот с голосовым интерфейсом и посмотрим, что произойдет.


Всего голосов 9: ↑6 и ↓3+3
Комментарии15

Искусственный интеллект для каждого

Время на прочтение5 мин
Количество просмотров8.5K
В начале января 2019 г. Forbes составил ТОП-10 главных технологических книг 2018 года, среди которых оказалась и «Машины прогнозирования: Простая экономика искусственного интеллекта» (Prediction Machines: The Simple Economics of Artificial Intelligence). Книга, написанная коллективом авторов — Джошуа Ганс (Joshua Gans), Аджай Агравал (Ajay Agrawal) и Ави Голдфарб (Avi Goldfarb), взрывает устоявшееся представление об искусственном интеллекте и переводит его в совершенно иную плоскость. Эта книга — реальный must have.

Один из авторов книги — эксперт по искусственному интеллекту Джошуа Ганс, профессор школы менеджмента Ротмана в Университете Торонто (Канада), ежедневно тратит много времени, отслеживая новости в области ИИ, отделяя хайп от реальности. Сегодня он преподает студентам MBA сетевое взаимодействие и стратегию цифрового маркетинга, в том числе то, каким образом компании могут успешно конкурировать на своих рынках за счет внедрения технологических инноваций.

Редакция журнала CEO.com обсудила с Джошуа его нашумевшую в бизнес-кругах книгу «Машины прогнозирования: Простая экономика искусственного интеллекта». Перевод интервью с ним читайте далее.

image

Читать дальше →
Всего голосов 16: ↑13 и ↓3+10
Комментарии0

Fuck Up story: как я разочаровался в digital-услугах для бизнеса и проимел своё дело (ну почти)

Время на прочтение14 мин
Количество просмотров58K
Это была славная охота.

Моя жизнь была посвящена ИТ-сфере. Я был инженером, создававшим интересные продукты для больших промышленных компаний. Моей географией была вся Россия, я вживую видел цеха КАМАЗа, ВАЗа и других автогигантов. Но всему в нашей судьбе настаёт предел, и я выгорел. О причинах расскажу как-нибудь в другой раз. Главное, что я, опытный разработчик и техник, ушёл на вольные хлеба и, поскольку у меня появилась семья, решил сделать бизнес — свой магазин товаров для детей, по особым принципам. В общем, как многие из программеров, сделать то, чего не достаёт мне среди предложений на рынке. И знаете, что? Я выяснил, что найти простейших, базовых, нужных профессионалов-подрядчиков очень сложно. Миллион фрилансеров и фирм, а выхлоп… Это был квест, и о нём я должен поведать миру. Не ходите по моим граблям.


Это самое лучшее, что описало моё состояние
Читать дальше →
Всего голосов 181: ↑175 и ↓6+169
Комментарии102

Чтобы избавиться от боли в спине вам, возможно, придётся сидеть по-другому

Время на прочтение7 мин
Количество просмотров349K


Когда я сижу, у меня болит спина.

Это происходит уже последние 10 лет. И неважно, где я нахожусь – на работе, в ресторане, даже дома на диване. Моя поясница кричит: «Прекрати сидеть!»

Чтобы уменьшить боли в спине, на работу я купила себе коленный стул. Потом стол для работы стоя. Потом вернулась к обычному стулу, потому что мне стало больно стоять.

Я ходила к врачам, хирургам-ортопедам и специалистам по боли. Я освоила пилатес, увеличила свою гибкость и силу мускулов. В какой-то момент мой пресс стал таким сильным, что муж стал называть его «дощечкой».

Эти средства немного помогли – сначала. Но боль так и не ушла. Поэтому несколько лет назад я решила принять это как должное: сидячее положение причиняет мне боль, и так будет всегда.
Всего голосов 72: ↑62 и ↓10+52
Комментарии231

Postgres auto_explain: автолог плана запроса

Время на прочтение3 мин
Количество просмотров16K
Очень коротко покажу, как настроить PG для логирования планов выполнения запросов и как потом, не искать по логам всё, что медленно исполнялось
Читать дальше →
Всего голосов 24: ↑24 и ↓0+24
Комментарии18

Информация

В рейтинге
Не участвует
Откуда
Новосибирск, Новосибирская обл., Россия
Дата рождения
Зарегистрирован
Активность

Специализация

Backend Developer, Chief Technology Officer (CTO)
Lead