Articles / Bookmarks / Profile of krox / Habr

Фёдор @krox

Специалист в области IT

ProfileArticles6PostsNewsComments262

olezhkapetrov Dec 2 2020 at 09:03

Как из четырёх минут речи мы воссоздали голос молодого Леонида Куравлёва

7 min

20K

Сбер corporate blogNatural Language Processing*Voice user interfaces*Machine learning*

Всем привет! Меня зовут Олег Петров, я руковожу группой R&D в Центре речевых технологий. Мы давно работаем не только над распознаванием речи, но и умеем синтезировать голоса. Самый простой пример, для чего это нужно бизнесу: чтобы для каждого нового сценария, которому обучают голосовых роботов, не нужно было организовывать новую запись с человеком, который его когда-то озвучил. Ещё мы развиваем продукты на основе голосовой и лицевой биометрии и аналитики по голосовым данным. В общем, работаем над серьёзными и сложными задачами для разного бизнеса.

Но недавно к нам пришли коллеги из Сбера с предложением поучаствовать в развлекательной истории — «озвучить» героя Леонида Куравлёва в новом ролике. Для него лицо Куравлева было воссоздано по кадрам из фильма «Иван Васильевич меняет профессию» и наложено на лицо другого актера с помощью технологии Deepfake. Чтобы мы смогли не только увидеть, но и услышать в 2020 году Жоржа Милославского, мы решили помочь коллегам. Ведь с годами голос у всех нас меняется и даже если бы Леонид Вячеславович озвучил героя, эффект был бы не тот.

Под катом я расскажу, почему эта, уже во многом привычная задача голосового синтеза, оказалась чуть сложнее, чем мы ожидали, и поясню, почему такие голоса не смогут обмануть качественные системы биометрической авторизации.

+40

IvanShafran Aug 11 2020 at 09:33

Делаем игру с управлением улыбкой

8 min

VK corporate blogGame development*Development for Android*Hackathon

Tutorial

Привет! Меня зовут Иван Шафран, недавно я присоединился к команде видео ВКонтакте в роли программиста-разработчика для Android. Участвую в создании как продуктовых приложений, так и SDK. Время от времени я посещаю хакатоны, где можно реализовывать любые безумные идеи. Сегодня расскажу, как за пару часов сделать прототип мобильной игры с необычным управлением: персонаж будет реагировать на улыбку и подмигивание.

heathen Nov 8 2020 at 23:49

Затерянные в тумане, или Увлекательные приключения в мире АПР *

11 min

22K

Programming microcontrollers*Development for Raspberry Pi*DIYHealth

* АПР - аэропоника с пневматическим распылением

Уже почти год назад мой друг, в качестве хобби выращивавший дома клубнику, увлёк меня этой идеей. Я решил изучить практику высокотехнологичного сельского хозяйства, а затем методом проб и ошибок начал строить установку для безсубстратного выращивания клубники в закрытых помещениях - естественно, с желанием довести до состояния, при котором её можно масштабировать, а само выращивание будет максимально автоматизированным.

Вышло ли из этого что-то и что конкретно - под катом. Сразу предупрежу: статья огромная, потому что материала много. И очень много фото.

+77

worksolutions Nov 2 2020 at 16:58

Подборка статей о машинном обучении: кейсы, гайды и исследования за октябрь 2020

6 min

4.4K

Machine learning*Artificial IntelligenceTensorFlow*Python*

В октябре традиционно в центре внимания вновь GPT-3. С моделью от OpenAI связано сразу несколько новостей — хорошая и не очень.

Читать дальше →

+15

November 2 2020

Между бункером и виллой: как я строил умный дом в российской глубинке

Читая про умные дома, зачастую натыкаешься просто на обзоры множества гаджетов. Умные колонки, розетки, холодильники со встроенным компьютером и прочие штучки, слабо связанные друг с другом. На самом деле всё это будет просто нагромождением различных автономных систем с кучей точек отказа. Поэтому мой умный дом начинался задолго до условного похода по магазинам — с кропотливого планирования. Под катом я расскажу, что и как я лично реализовал и какие плюшки это привнесло в мою жизнь.

Добро пожаловать / Вход воспрещён

+15

skillfactory_school Oct 20 2020 at 11:14

Абстрагируемся от фреймворков глубокого обучения с Neuropod от Uber

13 min

2.6K

Skillfactory corporate blogMachine learning*Artificial IntelligencePython*Open source*

Translation

В сегодняшнем материале рассказывается про Neuropod, движок вывода глубокого обучения с открытым исходным кодом от Uber ATG. Это слой абстракции над фреймворками глубокого обучения, решающий проблему быстрой замены написанных на разных фреймворках моделей и проблему адаптации модели для производственных сред, помогающий построить единый и оптимизированный конвейер входных данных. Подробности, как обычно, под катом.

Приятного чтения!

+15

Alexufo Oct 8 2020 at 14:24

Восстановление утраченных текстов с помощью современных алгоритмов. Софт

12 min

16K

Data visualization*Popular scienceImage processing*

Tutorial

В первой части мы с вами поговорили о научном оборудовании, которое используется для прочтения, казалось бы, утраченных навсегда текстов. А теперь мы поговорим о том, как обрабатывать эти данные. Мы рассмотрим интересные цветовые пространства, алгоритмы, фильтры и методы статистического анализа. Но перед этим еще раз вернемся к их извлечению. Нам, простым смертным, доступны два варианта — сканеры и фотоаппараты.

+31

sismetanin Sep 3 2020 at 11:37

Анализ тональности в русскоязычных текстах, часть 3: вызовы и перспективы

14 min

12K

VK corporate blogMachine learning*Social networks and communities

Анализ тональности успешно применяется для социальных сетей, отзывов, новостей и даже учебников. На основе ключевых исследований для русского языка, описанных в предыдущей статье, здесь мы рассмотрим основные вызовы, с которыми сталкиваются исследователи, а также перспективные направления на будущее. В отличие от предыдущих работ я сосредоточился на прикладном применении, а не на самих подходах и их качестве классификации.

Читать дальше →

+22

ragequit Sep 21 2020 at 08:00

Новый метод биометрии: биоакустическая подпись

5 min

11K

VDSina.ru corporate blogPopular scienceInformation Security*IOTSound

Южнокорейские учёные изобрели новый метод биометрической идентификации: по звуковым волнам, проходящим через тело (палец). Оказывается, этот сигнал достаточно уникален у каждого человека. И лишён главной уязвимости оптических методов биометрии, таких как сканирование отпечатков пальца, радужной оболочки глаза или лица. Все эти методы по своей сути подвержены спуфингу с фотографированием «биометрического материала». Со звуковыми волнами так не выйдет, их нельзя сфотографировать.

Разработанная система биоакустической частотной спектроскопии модулирует микровибрации, которые распространяются через тело и генерируют уникальную спектральную характеристику. В тестах характеристика сохранялась в течение двух месяцев и обеспечила точность верификации 41 субъекта на уровне 97,16%.

Читать дальше →

+35

Sonax Aug 26 2020 at 20:27

Настройка GUI WSL Kali Linux & Ubuntu. Выход в графическую оболочку

3 min

24K

Configuring Linux*

Tutorial

Здравствуйте. Установив WSL и скачав из Microsoft Store Kali Linux & Ubuntu я столкнулся с тем, что передо мной терминал, а я абсолютно ничего не понимая в Linux, хотел бы хоть как-то ориентироваться в системе через графическую оболочку. Я неделями гуглил команды и в итоге написал скрипт для настройки. Делюсь, может кому поможет

Читать дальше →

DmitrySpb79 Sep 1 2020 at 17:47

Определяем пульс по вебкамере в 50 строчек кода

4 min

34K

Lifehacks for geeksPopular scienceAlgorithms*Programming*Python*

Technotext 2020

Привет Хабр.

Однажды мне попалось описание приложения для Android, которое определяло пульс по камере телефона, просто по общей картинке. Камера не прикладывалась к пальцу, кожа не просвечивалась светодиодом. Интересный момент был в том, что ревьюеры не поверили в возможность такого определения пульса, и приложение было отклонено. Чем дело кончилось у автора программы, не знаю, но стало интересно проверить, возможно ли это.

Для тех кому интересно что получилось, продолжение под катом.

+84

ru_vds Aug 12 2020 at 15:18

8 ML/AI-проектов, которые украсят ваше портфолио

6 min

24K

RUVDS.com corporate blogArtificial IntelligenceIT careerMachine learning*Programming*

Translation

Автор материала, перевод которого мы сегодня публикуем, предлагает вниманию читателей 8 идей проектов в сферах машинного обучения и искусственного интеллекта. Описание идей сопровождается ссылками на дополнительные материалы. Реализации этих идей способны украсить портфолио проектов профильного специалиста.

Читать дальше →

+32

salaxieb Aug 13 2020 at 13:28

Обзор методов создания эмбедингов предложений, Часть1

18 min

13K

Data Mining*Natural Language Processing*Python*

Представте себе, как было бы удобно, написать предложение и найти похожее к нему по смыслу. Для этого нужно уметь векторизовать всё предложение, что может быть очень не тривиальной задачей.

По специфике своей работы, я должен искать похожие запросы в службу поддержки и даже имея достаточно большую разметку, бывает тяжело собрать необходимое количество сообщений подходящих по тематике, но написанных другими словами.

Ниже обзорное исследование на способы векторизации всего предложения и не просто векторизации, а попытка векторизовать предложение с учётом его смысла.

Например две фразы 'эпл лучше самсунг' от 'самсунг лучше эпл', должны быть на противоположном конце по одному из значений вектора, но при этом совпадать по другим.

Можно привести аналогию с картинкой ниже. По шкале от кекса до собаки они находятся на разных концах, а по количеству чёрных точек и цвету объекта на одном.

Читать дальше →

oldadmin Aug 13 2020 at 09:55

Заметки Дата Сайентиста: маленькие утилиты — большая польза

5 min

8.6K

RUVDS.com corporate blogLifehacks for geeksData Mining*Big Data*

Чаще всего в работе датасаентиста мне приходится перегонять данные из одного представления в другое, агрегировать, приводить к одинаковой гранулярности и чистить данные, загружать, выгружать, анализировать, форматировать и присылать результаты (которые в общем-то тоже данные в каком-то виде). С данными всегда что-то не так и их нужно шустро гонять туда и обратно — больше всего в этом мне помогают классические юниксовые утилиты и небольшие, но гордые тулзы: вот о них-то мы сегодня и поговорим.

И сегодня будет подборка с примерами и ситуациями, в которых мне приходится их использовать. Все описанное здесь и ниже — это настоящий субъективный опыт и конечно же он у всех разный, но возможно кому-то он будет полезен.

Tools — learn the tools — все написанное субъективно и основано исключительно на личном опыте: помогло мне может быть поможет и вам.

Читать дальше →

+41

worksolutions Jul 6 2020 at 14:50

Подборка статей о машинном обучении: кейсы, гайды и исследования за июнь 2020

3 min

Python*TensorFlow*Artificial IntelligenceMachine learning*

Здесь вас ждёт список вышедших за июнь материалов на английском языке. Все они написаны без лишнего академизма, содержат примеры кода и ссылки на непустые репозитории. Большинство упомянутых технологий находятся в открытом доступе и не требуют сверхмощного железа для тестирования.

Читать дальше →

+12

MagisterLudi Jul 2 2020 at 09:47

Онтол от DeepMind: самые полезные материалы по искусственному интеллекту от мирового лидера

13 min

11K

Skillfactory corporate blogArtificial IntelligenceIT careerMachine learning*Studying in IT

Translation

Ученые из DeepMind составили Curated Resource List образовательных материалов для тех, кто хочет связать свою жизнь с ИИ и машинным обучением. Я называю такую подборку «онтол» — список того, что формирует картину мира по данному вопросу, ранжированный по важности и составленный живым человеком, специалистом, который несёт репутационную ответственность за этот список (чтобы не было в нём маркетинговой и ангажированной фигни).

По задумке, если десяток лучших компаний в области ИИ попросят своих ведущих специалистов (каждого) сделать подборку лучших материалов, которые сформировали их как специалистов, то мы получим массив подборок (список топ-10/100 ресурсов+имя составителя) и на основе этого можно будет делать интересные выводы ( а)по качеству материалов, что следует учить в первую очередь б) по качеству специалистов, которые могут выделять главное в)что-то ещё). Так мы «разметим» все открытые тексты/видео в области ИИ. Потом возьмемся за другие темы: еда, доверие, дело жизни, семья, сотрудничество, когнитивные искажения и прочее — то, что формирует картину мира.

Тестируйте прототип beta.ontol.org и подписывайтесь на канал @Ontol

Продвинутый уровень визуализации данных для Data Science на Python

7 min

55K

Skillfactory corporate blogBig Data*Python*Data visualization*Studying in IT

Translation

Как сделать крутые, полностью интерактивные графики с помощью одной строки Python

Когнитивное искажение о невозвратных затратах (sunk cost fallacy) является одним из многих вредных когнитивных предубеждений, жертвой которых становятся люди. Это относится к нашей тенденции продолжать посвящать время и ресурсы проигранному делу, потому что мы уже потратили — утонули — так много времени в погоне. Заблуждение о заниженной стоимости применимо к тому, чтобы оставаться на плохой работе дольше, чем мы должны, рабски работать над проектом, даже когда ясно, что он не будет работать, и да, продолжать использовать утомительную, устаревшую библиотеку построения графиков — matplotlib — когда существуют более эффективные, интерактивные и более привлекательные альтернативы.

За последние несколько месяцев я понял, что единственная причина, по которой я использую matplotlib, — это сотни часов, которые я потратил на изучение сложного синтаксиса. Эти сложности приводят к часам разочарования, выясняя на StackOverflow, как форматировать даты или добавить вторую ось Y. К счастью, это прекрасное время для построения графиков в Python, и после изучения вариантов, явным победителем — с точки зрения простоты использования, документации и функциональности — является библиотека plotly. В этой статье мы погрузимся прямо в plotly, изучая, как создавать лучшие графики за меньшее время — часто с помощью одной строки кода.

Читать дальше →

+23

AlexeyPolunin Jul 16 2020 at 09:45

Totum — open source конструктор CRM/ERP и произвольных учетных систем (PHP + PgSQL)

12 min

26K

Start-up developmentPHP*Open source*ERP-systems*CRM systems*

В двух словах — продвинутые таблицы. Ориентирован на отдельных разработчиков или микрокоманды из двух-трех человек. Подходит начинающим разработчикам и бизнес-аналитикам, желающим превратить свое понимание бизнеса в готовое решение или быстро разработать проект под конкретного клиента. Для небольших бизнес-ниш — в которых нет типовых решений. Small-code принцип — множество простых, ситуационных кодов. Есть подробная документация и видео. Устанавливается на собственный сервер за 5 мин. Со временем позволит выгружать разработанные на нем решения с коммерческими лицензиями с использованием встроенной защиты.

Читать дальше →

+22

MaxRokatansky Jul 20 2020 at 15:35

Sktime: унифицированная библиотека Python для машинного обучения и работы с временными рядами

7 min

15K

OTUS corporate blogBig Data*Mathematics*Machine learning*

Translation

Всем привет. В преддверии старта базового и продвинутого курсов «Математика для Data Science», мы подготовили перевод еще одного интересного материала.

Решение задач из области data science на Python – это непросто

Почему? Существующие инструменты плохо подходят для решения задач, связанных с временными рядами и эти инструменты сложно интегрировать друг с другом. Методы пакета scikit-learn предполагают, что данные структурированы в табличном формате и каждый столбец состоит из независимых и одинаково распределенных случайных величин – предположений, которые не имеют ничего общего с данными временных рядов. Пакеты, в которых есть модули для машинного обучения и работы с временными рядами, такие как statsmodels, не особо хорошо дружат между собой. Более того, множество важных операций с временными рядами, такие как разбиение данных на обучающий и тестовый наборы по временным промежуткам, в существующих пакетах недоступны.

Для решения подобных задач и была создана sktime.

Читать дальше →

worksolutions Aug 3 2020 at 17:37

Подборка статей о машинном обучении: кейсы, гайды и исследования за июль 2020

5 min

5.2K

Machine learning*Artificial IntelligenceTensorFlow*Python*

Похоже, не один наш дайджест не обходится без упоминания разработок Open AI: в июле самой обсуждаемой темой в области машинного обучения стал новый алгоритм GPT-3. Технически это не одна модель, а целое семейство, которое для удобства обобщают под единым названием. В самой крупной модели используется 175 млрд параметров, а для обучения использовался датасет размером 570 Gb, в который вошли отфильтрованные данные из архивов Common Crawl и высококачественные данные WebText2, Books1, Books2 и Wikipedia.

Здесь стоит отметить, что модель предобучена, и не требует файн тюнинга под конкретные задачи: для достижения лучших результатов рекомендуется предоставлять ей хотя бы один (one-shot) или несколько (few-shot) примеров решения задач на входе, но можно обойтись вообще без них (zero-shot). Чтобы модель сгенерировала решение задачи, достаточно описать задачу на английском языке. Принято считать, что это алгоритм генерации текстов, но уже видно, что потенциал намного богаче.

Читать дальше →

1 2

4 5 ...

23 24

Между бункером и виллой: как я строил умный дом в российской глубинке

Оглавление

Решение задач из области data science на Python – это непросто