Как стать автором
Обновить
69
0
Vladimir Larin @borges

Senior Data Scientist

Отправить сообщение

Добавляем голосовое управление на русском языке в VR-проект

Время на прочтение5 мин
Количество просмотров2.9K

Тема виртуальной, дополненной реальности, метавселенных набирает обороты. Но что это такое, как должно выглядеть, как этим пользоваться, никто толком пока не знает. Однако, как в своё время переход от десктопных приложений к мобильным, миграция в VR принесёт и новые паттерны взаимодействия с пользователем. Да, в виртуальной реальности уже можно «потрогать» предметы, но этого недостаточно для полноценного решения пользовательских задач. Кажется, что голосовое управление в VR станет ещё более актуальным, чем в мобильных устройствах — в виде, например, голосовых команд или ввода текстовых данных. 

Ниже опишу пошагово, как можно добавить голосовое управление на русском языке в VR-проект.

Читать далее
Всего голосов 6: ↑5 и ↓1+4
Комментарии1

SymFormer: как мы написали музыку с помощью трансформеров и вариационных автоэнкодеров

Время на прочтение9 мин
Количество просмотров4.2K

Когда вы слышите слово «творчество», какие ассоциации приходят к вам в голову? Скорее всего, не в последнюю очередь вы подумаете о музыке. Зачастую она — прямое выражение глубоких эмоций и переживаний. Как будто из идеального мира Платона к нам проникает свет, который композитор просто записывает в виде нот. Возможно поэтому мы и считаем музыку творчеством в чистом виде. Музыка — проявление глубинных эмоций. Как же ИИ может создавать её, не испытывая эмоций?

В этой статье я расскажу, как наша команда Управления экспериментальных систем машинного обучения SberDevices попыталась формализовать сочинение музыки и научить ему нейронную сеть. Запускайте наш первый генеративный альбом «Thriving Machine» и устраивайтесь поудобнее.

Читать далее
Всего голосов 19: ↑19 и ↓0+19
Комментарии6

Визуализация больших графов для самых маленьких

Время на прочтение12 мин
Количество просмотров56K


Что делать, если вам нужно нарисовать граф, но попавшиеся под руку инструменты рисуют какой-то комок волос или вовсе пожирают всю оперативную память и вешают систему? За последние пару лет работы с большими графами (сотни миллионов вершин и рёбер) я испробовал много инструментов и подходов, и почти не находил достойных обзоров. Поэтому теперь пишу такой обзор сам.
Читать дальше →
Всего голосов 95: ↑94 и ↓1+93
Комментарии30

Заметки с конференции ACL 2019

Время на прочтение8 мин
Количество просмотров2.7K


Annual Meeting of the Association for Computational Linguistics (ACL) — это главная конференция в области обработки естественного языка. Она организуется с 1962 года. После Канады и Австралии она вернулась в Европу и проходила во Флоренции. Таким образом, в этом году у европейских исследователей она была более популярна, чем похожая на нее EMNLP.

В этом году было опубликовано 660 статей из 2900 присланных. Огромное количество. Вряд ли можно сделать какой-то объективный обзор того, что было на конференции. Поэтому я расскажу своих субъективных ощущениях от этого мероприятия.
Читать дальше →
Всего голосов 13: ↑13 и ↓0+13
Комментарии0

XLNet против BERT

Время на прочтение3 мин
Количество просмотров13K


В конце июня коллектив из Carnegie Mellon University показал нам XLNet, сразу выложив публикацию, код и готовую модель (XLNet-Large, Cased: 24-layer, 1024-hidden, 16-heads). Это предобученная модель для решения разных задач обработки естественного языка.

В публикации они сразу же обозначили сравнение своей модели с гугловым BERT-ом. Они пишут, что XLNet превосходит BERT в большом количестве задач. И показывает в 18 задачах state-of-the-art результаты.
Читать дальше →
Всего голосов 42: ↑41 и ↓1+40
Комментарии10

Ускоряем написание Selenium-автотестов на Ruby

Время на прочтение3 мин
Количество просмотров16K
Одним из инструментов, позволяющих автоматизировать взаимодействие с браузером, является Selenium Webdriver. В действительности автоматизированные тесты веб-страниц с использованием Selenium Webdriver выглядят довольно громоздко. Вот «небольшой» пример, который параллельно в двух браузерах открывает страницу поисковика Google, заполняет поисковую строку и отправляет форму:


Читать дальше →
Всего голосов 20: ↑18 и ↓2+16
Комментарии12

SICP теперь по-русски! Часть третья

Время на прочтение1 мин
Количество просмотров12K
image
Перевод третьей лекции из курса «Структура интерпретация компьютерных программ».

Это самый известный курс по программированию за последние 25 лет; с 1980г читается в MIT, а с недавних пор что-то подобное читается и в Беркли.

Курс сменил преподавателей и даже язык программирования Scheme на Python(на мой взгляд совершенно зря) и тем не менее информация, которая дается в этом курсе остается архи актуальной в любое время. Я бы сравнил этот курс с чем-то очень фундаментальным и важным для программистов, типа математики или теории алгоритмов.

Мне бы очень хотелось, чтобы программирование у нас в стране преподавалось таким вот образом.

Приятного просмотра!
Читать дальше →
Всего голосов 98: ↑94 и ↓4+90
Комментарии39

На старт, внимание, N900!

Время на прочтение12 мин
Количество просмотров13K
Здравствуй, уважаемое хабрасообщество. Сегодня, продолжая свой цикл статей о Nokia N900, проведу достаточно нестандартное сравнение трех устройств (почти сравнение пылесоса и холодильника ).
Летом многие бегают и катаются на велосипедах. Некоторые используют для этого специализированные компьютеры. А если такого нет или не хочется покупать? В таком случае можно воспользоваться N900!
Так как я достаточно давно занимаюсь бегом, то у меня есть два беговых компьютера от Garmin. В этой статье я решил описать каким образом N900 можно превратить в беговой компьютер и насколько он хорошо смотрится на фоне профессиональных специализированных инструментов.

Под катом я проведу сравнительный анализ и выяснить, насколько Nokia N900 может заменить специализированные компьютеры от Garmin. И в этом анализе мне помогут два моих других устройства: Garmin FR50 и Garmin FR305.
Читать дальше →
Всего голосов 61: ↑54 и ↓7+47
Комментарии48

Эпидемия

Время на прочтение1 мин
Количество просмотров948
На beta.ya.ru эпидемия, с каждой секундой прибывает и прибывает население.
У меня из 225 инвайтов, осталось 200.

Отдам даром :)

PS: уже больше 100 человек воспользовались инвайтами. Спасибо! Значит я рассылал их не зря :)

PSS: больше, к сожалению, инвайтов не имеется :(
Всего голосов 71: ↑63 и ↓8+55
Комментарии456

трансляция rit2007 non-stop

Время на прочтение1 мин
Количество просмотров481
Всего голосов 32: ↑25 и ↓7+18
Комментарии77

Игровые сообщества — часть нашего будущего

Время на прочтение2 мин
Количество просмотров665
Мы большую часть дня проводим перед экраном монитора, называем друг друга по никам, и многие планы прокучиваем в голове, чтобы продвинуться в игре, как я в Дозорах. Но, несомненно, при этом испытываем потребность дополнить это полноценной реальной жизнью. Поэтому ездим друг другу в гости, пересекая половину континента, собираемся в уже совершенно обычных компаниях за совершенно обычным столом. Что это? С чем это связано, к чему ведет?
Читать дальше →
Всего голосов 19: ↑16 и ↓3+13
Комментарии10

7 распространенных заблуждений о «клонировании» Youtube

Время на прочтение3 мин
Количество просмотров1.1K
1. Ниша не занята и, если мы выпустим клон к апрелю, — рынок будет наш.
2. Сделать скрипт а-ля Youtube стоит $100.
3. На первом этапе мы привлечем деньги инвесторов и венчурных фондов.
4. Главное купить этот скрипт за $100, а потом мой проект купят за $1 600 000 000.
5. Даже если не купят проект, мы заработаем на рекламе.
6. Если сделать скрипт стоит $100, значит стартапу достаточно $100 + $N, где N — это моя зарплата.
7. Два человека могут повторить успех YouTube.

Суровая правда жизни...
Всего голосов 104: ↑88 и ↓16+72
Комментарии113

Участвуем в выставке. Часть 1: подготовка

Время на прочтение7 мин
Количество просмотров16K
В сети присутствует огромное количество публикаций репортажами с выставок — CES, NAB, CeBIT и других. Но информации, как стать участником, а не посетителем выставки, мало. Когда примерно год назад у нас сформировалась идея об участии на выставке CSTB, информацию пришлось собирать по крупицам. Очевидных вещей вроде «ваш стенд должен быть информативен» было полно, действительно полезной информации — мало. Сейчас, завершая подготовку уже к третьей выставке, хочу поделиться опытом участия с практической стороны с теми, кто думает об участии первый раз.
Читать дальше →
Всего голосов 7: ↑5 и ↓2+3
Комментарии2

Опыт применения Google Apps for Business

Время на прочтение4 мин
Количество просмотров63K
Каждая компания на определенном этапе развития становится перед вопросом организации и последующей автоматизации своего документооборота. Хотим поделиться нашим опытом использования решений Google — Drive (Docs), Calendar и Contacts.

image
Читать дальше →
Всего голосов 36: ↑31 и ↓5+26
Комментарии39

Сравнение алгоритмов распознавания аудио для Second Screen

Время на прочтение6 мин
Количество просмотров8.7K

Введение


На сегодняшний день существует множество методов распознавания звука. В самом общем виде большинство методов состоят из алгоритма построения сигнатуры (fingerprints) сигнала (максимально компактного и при этом наиболее точно описывающего трек набора признаков), алгоритма ее поиска в базе данных и алгоритма отсечения ложных срабатываний. Перед нами стояла задача выбора технологии для построения second screen приложений.

При этом сравнение алгоритмов распознавания на основе известных точностных характеристик является довольно условным, поскольку эти характеристики получены на разных тестовых данных и при разных ошибках первого рода (false positives). Также, исходя из контекста задачи, нас интересовала эффективность алгоритма применительно к распознаванию аудиосигнала телеэфира, при искажениях обусловленных параметрами микрофонов современных мобильных устройств.

Поскольку в открытых источниках сравнительных данных, удовлетворяющих нашим требованиям, найдено не было, было решено провести собственное исследование алгоритмов распознавания звука, с учетом специфики аудиопотока и искажений. В качестве потенциальных кандидатов мы остановили свой выбор на алгоритмах J. Haitsma и A. Wang. Оба широко известны и основаны на анализе частотно-временных признаков, полученных с помощью оконного преобразования Фурье.
Читать дальше →
Всего голосов 20: ↑20 и ↓0+20
Комментарии5

Текстурирование спрайтов с помощью (dis)placement map

Время на прочтение3 мин
Количество просмотров5K

Недавно, ковыряя с целью исследования один чужой проект, наткнулся на весьма любопытную и в то же время — очень простую технологию. Сразу скажу, что ковырял я флэшку, но данная технология может быть использована не только во флэше, а вообще — где угодно.

Если коротко, то технология позволяет иметь одну отрендеренную анимацию и накладывать на нее разнообразные скины, тем самым получая внешне различные объекты.

Суть в том, что в изучаемой мной игре есть большое количество анимированных спрайтов человечков (как я изначально считал — заранее отрендеренных). Человечки разные (по-разному одетые, разных цветов и т.п.).
Читать дальше →
Всего голосов 183: ↑181.5 и ↓1.5+180
Комментарии63

Licenzero: ищем порно по цвету кожи

Время на прочтение3 мин
Количество просмотров9.7K
Маска по цвету кожиПродолжаем описание классификатора порнографического видеоконтента, разработанного компанией Inventos (Licenzero, присутствующее в заголовке это не отдельная компания, а подразделение в компании Инвентос).

Детектор цвета кожи является одним из детекторов, при помощи которых мы классифицируем видео. Он не такой сложный, как детектор движения, или детектор фрагментов, можно даже сказать совсем простой. Вначале у нас была куча идей, связанных с цветом кожи в видео. Но попробовав самый простой подход к классификации, мы решили (возможно временно) на нем остановиться, поскольку полученные результаты нас вполне устроили. Итак.
Читать дальше →
Всего голосов 125: ↑118 и ↓7+111
Комментарии118

Свет и освещение

Время на прочтение7 мин
Количество просмотров165K
Часто (в том числе и на хабре) всплывает вопрос освещения, особенно «нанотехнологиченого» светодиодного и зачастую говны священных войн «светодиод» против люминисцентных ламп начинают подбурливать. Больше года я уже собирался написать статью о свете, и оно наконец свершилось.
Из этой статьи вы узнаете почему в фотостудиях не снимают с люминесцентными лампами, почему светодиоды до сих пор не захватили мир и стоит ли ими освещать улицы. Поехали!
Читать дальше →
Всего голосов 302: ↑297 и ↓5+292
Комментарии208

Licenzero: простые движения

Время на прочтение6 мин
Количество просмотров7.2K
Двустороннее движениеЭтим постом мы продолжаем цикл статей о том, как мы делали порнофильтр. Сейчас речь пойдет о попытке классифицировать порнографический контент по характерным движениям в кадре.

Началось это все как просто шутка из разговора. Ведь классифицировать порнографические движения довольно непросто — они слишком разные, чтобы найти в них что-то общее. Но мы попробовали, результат нас вполне устроил, и детектор движения занял свое место в общем классификаторе порнографического видеоконтента.
Читать дальше →
Всего голосов 80: ↑73 и ↓7+66
Комментарии38

Построение систем доставки видео на основе HTTP Dynamic Streaming от Adobe и OpenSource

Время на прочтение8 мин
Количество просмотров21K
В рамках проекта для одного из наших заказчиков в очередной раз встала задача построить систему конвертации/ хранения/ доставки видео в интернет. Типичная такая задача создания своего маленького (или не очень маленького) “Тьюба” только с профессиональным, а не UGC-контентом.

С момента создания первых “Тьюбов” технологии видео в интернете прошли некоторый путь развития, позволяют сейчас делать намного больше, да и требования к современному видео-сайту стали несколько иными.

Наиболее интересными трендами последнего времени, на наш взгляд, являются:
  • возможность смотреть один видео-сайт с разных устройств,
  • технология адаптивного HTTP стриминга

Читать дальше →
Всего голосов 55: ↑53 и ↓2+51
Комментарии55
1

Информация

В рейтинге
Не участвует
Откуда
Орел, Орловская обл., Россия
Работает в
Дата рождения
Зарегистрирован
Активность