Как стать автором
Обновить
  • по релевантности
  • по времени
  • по рейтингу

Обзор методов улучшения речи и шумоподавления: от классики к SotA

Блог компании МТС Алгоритмы *Звук Natural Language Processing *Голосовые интерфейсы

Всем привет! Меня зовут Оля Яковенко, я разработчик в MTS AI, занимаюсь задачами по автоматической обработке сигналов. В частности, на данный момент я исследую различные подходы шумоподавления для последующего распознавания речи, и сегодня я хотела бы поделиться с вами обзором и некоторыми находками на эту тему.

Читать далее
Всего голосов 3: ↑2 и ↓1 +1
Просмотры 457
Комментарии 1

Сгенерированная нейросетью картина ушла с молотка за $432 500

Обработка изображений *Машинное обучение *Искусственный интеллект Будущее здесь

«Эдмонд де Белами, из семьи де Белами. Состязательная нейронная сеть, печать на холсте, 2018. Подписана функцией потерь модели GAN чернилами издателем, из серии одиннадцати уникальных изображений, опубликованных Obvious Art, Париж, в оригинальной позолоченной деревянной раме». — таково описание лота 363, который вчера продан на аукционе «Сотбис» за $432 500.
Всего голосов 27: ↑22 и ↓5 +17
Просмотры 18K
Комментарии 41

Дизайнер нагенерировал жуков нейросетью StyleGAN

Алгоритмы *Обработка изображений *Машинное обучение *Искусственный интеллект DIY или Сделай сам

Источник: cunicode

Бернат Куни, исследователь в области цифрового дизайна и экодизайна, работающий в студии cunicode, обучил нейросеть на иллюстрациях жуков, которые он взял из энциклопедии. После этого машина смогла сгенерировать собственные изображения.
Читать дальше →
Всего голосов 20: ↑16 и ↓4 +12
Просмотры 9.8K
Комментарии 9

Nvidia показала генератор говорящих голов для видеоконференций из 2D-изображений

Работа с видео *Машинное обучение *Искусственный интеллект
image

Исследователи Nvidia AI представили систему на ИИ, которая создает говорящие головы для видеоконференций из одного 2D-изображения. Авторы разработки говорят, что алгоритм способен выполнять широкий спектр манипуляций, включая вращения и перемещения головы человека.
Всего голосов 11: ↑11 и ↓0 +11
Просмотры 3.8K
Комментарии 7

В Nvidia показали обучение нейросетей на небольшом наборе данных

Машинное обучение *Искусственный интеллект
image

В Nvidia Research представили модель искусственного интеллекта, которая использует ограниченный набор данных для обучения генеративных нейросетей и способна подражать известным художникам.
Всего голосов 6: ↑5 и ↓1 +4
Просмотры 1.9K
Комментарии 0

Студенческий AI-хакатон от Deutsche Telekom IT Solutions и Университета ИТМО

Блог компании Deutsche Telekom IT Solutions (ex T-Systems) Хакатоны Машинное обучение *Искусственный интеллект Интернет вещей

Приглашаем студентов и недавних выпускников на студенческий AI онлайн-хакатон от Deutsche Telekom IT Solutions и Университета ИТМО 23 апреля!

Читать далее
Всего голосов 3: ↑3 и ↓0 +3
Просмотры 523
Комментарии 0

Блогер показал версию GTA V, которую в реальном времени генерирует нейросеть

Обработка изображений *Дизайн игр *Искусственный интеллект Игры и игровые приставки

YouTube-блогер Харрисон Кинсли поделился видео, демонстрирующим GAN Theft Auto, нейронную сеть, которая может самостоятельно генерировать игровую часть мира Grand Theft Auto V. Работа GAN Theft Auto основана на нейросети Nvidia GameGAN.

Читать далее
Всего голосов 27: ↑25 и ↓2 +23
Просмотры 47K
Комментарии 57

DeepMind научила нейросеть предсказывать время и место дождей

Машинное обучение *Исследования и прогнозы в IT Искусственный интеллект

DeepMind работала с британскими синоптиками, чтобы создать нейросеть, которая бы лучше справлялась с краткосрочными прогнозами, чем существующие системы.  Компания разработала инструмент глубокого обучения под названием DGMR («глубокая генеративная модель дождя»), который может точно предсказать вероятность дождя в ближайшие 90 минут.

Читать далее
Всего голосов 14: ↑14 и ↓0 +14
Просмотры 2.8K
Комментарии 3

Самые чистые кристаллы GaN вырастили в Польше

Химия
Удивительно, но никому не известная польская фирма Ammono смогла обставить гигантов электронной промышленности, таких как Intel, и получить самые чистые кристаллы нитрида галлия (GaN) — критически важного материала для электроники 21 века.


Слева — первые кристаллы GaN, полученные компанией Ammono двадцать лет назад; из-за металлических примесей имеют неприглядный коричневатый оттенок. Справа — абсолютно чистые кристаллы GaN формой правильного шестиугольника размером до 51 мм; продукт последних лет.

Простые химики из Варшавы теперь станут мультимиллионерами, и их имена занесут в пантеон славы электронной индустрии, пишет журнал IEEE Spectrum.
Читать дальше →
Всего голосов 79: ↑66 и ↓13 +53
Просмотры 1.9K
Комментарии 49

Разбираемся с войной нейронных сетей (GAN)

Big Data *Машинное обучение *
Generative adversarial networks (GAN) пользуются все большей популярностью. Многие говорят о них, кто-то даже уже использует… но, как выясняется, пока мало кто (даже из тех кто пользуется) понимает и может объяснить. ;-)
Давайте разберем на самом простом примере, как же они работают, чему учатся и что на самом деле порождают.
Читать дальше →
Всего голосов 21: ↑18 и ↓3 +15
Просмотры 36K
Комментарии 10

Нейросетевая игра в имитацию

Блог компании Open Data Science Алгоритмы *Обработка изображений *Математика *Машинное обучение *

Здравствуйте, коллеги. В конце 1960-ых годов прошлого века Ричард Фейнман прочитал в Калтехе курс лекций по общей физике. Фейнман согласился прочитать свой курс ровно один раз. Университет понимал, что лекции станут историческим событием, взялся записывать все лекции и фотографировать все рисунки, которые Фейнман делал на доске. Может быть, именно после этого у университета осталась привычка фотографировать все доски, к которым прикасалась его рука. Фотография справа сделана в год смерти Фейнмана. В верхнем левом углу написано: "What I cannot create, I do not understand". Это говорили себе не только физики, но и биологи. В 2011 году, Крейгом Вентером был создан первый в мире синтетический живой организм, т.е. ДНК этого организма создана человеком. Организм не очень большой, всего из одной клетки. Помимо всего того, что необходимо для воспроизводства программы жизнедеятельности, в ДНК были закодированы имена создателей, их электропочты, и цитата Ричарда Фейнмана (пусть и с ошибкой, ее кстати позже исправили). Хотите узнать, к чему эта прохладная тут? Приглашаю под кат, коллеги.

Читать дальше →
Всего голосов 75: ↑75 и ↓0 +75
Просмотры 41K
Комментарии 32

Автоэнкодеры в Keras, Часть 5: GAN(Generative Adversarial Networks) и tensorflow

Python *Алгоритмы *Обработка изображений *Математика *Машинное обучение *
Tutorial

Содержание



(Из-за вчерашнего бага с перезалитыми картинками на хабрасторейдж, случившегося не по моей вине, вчера был вынужден убрать эту статью сразу после публикации. Выкладываю заново.)

При всех преимуществах вариационных автоэнкодеров VAE, которыми мы занимались в предыдущих постах, они обладают одним существенным недостатком: из-за плохого способа сравнения оригинальных и восстановленных объектов, сгенерированные ими объекты хоть и похожи на объекты из обучающей выборки, но легко от них отличимы (например, размыты).

Этот недостаток в куда меньшей степени проявляется у другого подхода, а именно у генеративных состязающихся сетейGAN’ов.

Формально GAN’ы, конечно, не относятся к автоэнкодерам, однако между ними и вариационными автоэнкодерами есть сходства, они также пригодятся для следующей части. Так что не будет лишним с ними тоже познакомиться.

Коротко о GAN


GAN’ы впервые были предложены в статье [1, Generative Adversarial Nets, Goodfellow et al, 2014] и сейчас очень активно исследуются. Наиболее state-of-the-art генеративные модели так или иначе используют adversarial.

Схема GAN:



Читать дальше →
Всего голосов 25: ↑25 и ↓0 +25
Просмотры 24K
Комментарии 9

Автоэнкодеры в Keras, часть 6: VAE + GAN

Python *Алгоритмы *Обработка изображений *Математика *Машинное обучение *
Tutorial

Содержание



В позапрошлой части мы создали CVAE автоэнкодер, декодер которого умеет генерировать цифру заданного лейбла, мы также попробовали создавать картинки цифр других лейблов в стиле заданной картинки. Получилось довольно хорошо, однако цифры генерировались смазанными.

В прошлой части мы изучили, как работают GAN’ы, получив довольно четкие изображения цифр, однако пропала возможность кодирования и переноса стиля.

В этой части попробуем взять лучшее от обоих подходов путем совмещения вариационных автоэнкодеров (VAE) и генеративных состязающихся сетей (GAN).

Подход, который будет описан далее, основан на статье [Autoencoding beyond pixels using a learned similarity metric, Larsen et al, 2016].



Иллюстрация из [1]
Читать дальше →
Всего голосов 37: ↑37 и ↓0 +37
Просмотры 16K
Комментарии 7

Генеративные модели от OpenAI

Блог компании Wunder Fund Алгоритмы *Машинное обучение *
Перевод


Эта статья посвящена описанию четырех проектов, объединенных общей темой усовершенствования и применения генеративных моделей. В частности, речь пойдет о методах обучения без учителя и GAN.
 
Помимо описания нашей работы, в этой статье мы хотели бы подробнее рассказать о генеративных моделях: их свойствах, значении и возможных перспективах развития.
Читать дальше →
Всего голосов 14: ↑14 и ↓0 +14
Просмотры 15K
Комментарии 1

Учим робота готовить пиццу. Часть 2: Состязание нейронных сетей

Python *Машинное обучение *


Содержание



В прошлой части, удалось распарсить сайт Додо-пиццы и загрузить данные об ингредиентах, а самое главное — фотографии пицц. Всего в нашем распоряжении оказалось 20 пицц. Разумеется, формировать обучающие данные всего из 20 картинок не получится. Однако, можно воспользоваться осевой симметрией пиццы: выполнив вращение картинки с шагом в один градус и вертикальным отражением — позволяет превратить одну фотографию в набор из 720 изображений. Тоже мало, но всё же попытаемся.


Попробуем обучить Условный вариационный автоэнкордер (Conditional Variational Autoencoder), а потом перейдёт к тому, ради чего это всё и затевалось — генеративным cостязательным нейронным сетям (Generative Adversarial Networks).

Читать дальше →
Всего голосов 20: ↑18 и ↓2 +16
Просмотры 7K
Комментарии 10

Смена пола и расы на селфи с помощью нейросетей

Блог компании Open Data Science Алгоритмы *Обработка изображений *Математика *Машинное обучение *

Привет, Хабр! Сегодня я хочу рассказать вам, как можно изменить свое лицо на фото, используя довольно сложный пайплайн из нескольких генеративных нейросетей и не только. Модные недавно приложения по превращению себя в даму или дедушку работают проще, потому что нейросети медленные, да и качество, которое можно получить классическими методами компьютерного зрения, и так хорошее. Тем не менее, предложенный способ мне кажется очень перспективным. Под катом будет мало кода, зато много картинок, ссылок и личного опыта работы с GAN'ами.

Читать дальше →
Всего голосов 100: ↑95 и ↓5 +90
Просмотры 42K
Комментарии 67

Улучшение качества изображения с помощью нейронной сети

Алгоритмы *Обработка изображений *Машинное обучение *Читальный зал
Сегодня, хочу рассказать об интересном подходе по улучшению качества изображения. Официальное название подхода Super Resolution. Улучшение качества изображения программными методами известно с начала появления цифровых снимков, но в последние 3 года произошёл качественный скачок, вызванный использованием нейронных сетей.


Пример улучшения качества изображения с использованием технологии Super Resolution.
Читать дальше →
Всего голосов 34: ↑31 и ↓3 +28
Просмотры 56K
Комментарии 25

Нейросеть научилась состаривать и омолаживать людей по фото

Искусственный интеллект Фототехника

Оригинальная фотография (a), первоначальная реконструкция (b), два варианта оптимизации реконструкции (с) и результат состаривания/омолаживания лиц со вторым вариантом оптимизации IP, то есть с лучшим сохранением узнаваемости лица (d)

Состаривание лица (синтез возраста) с морфингом фотографии — важная задача, которая имеет много практических применений. Такое состаривание необходимо делать для корректной работы систем распознавания лиц. Оно нужно при поиске пропавших детей спустя годы или десятилетия после пропажи. Ну и конечно, морфинг лиц используется в индустрии развлечений — например, в кинематографе. Вероятно, мобильные приложения c такой функцией могут стать популярными. Каждому интересно посмотреть, как в молодости выглядел этот старичок-преподаватель или какой станет ваша красавица-однокурсница через 40-50 лет.
Читать дальше →
Всего голосов 19: ↑19 и ↓0 +19
Просмотры 23K
Комментарии 9

Результаты конкурса Google на самый эффективный инвертор

Электроника для начинающих IT-компании

Инвертор второго призёра, команды Schneider Electric

Почти два года назад компания Google объявила конкурс Little Box Challenge с призовым фондом 1 миллион долларов на разработку самого эффективного компактного инвертора, преобразующего постоянный ток в переменный. Для победы нужно было создать двухкиловаттный инвертор с удельной плотностью мощности не менее 50 ватт на кубический дюйм (3,05 Вт на см3).
Читать дальше →
Всего голосов 32: ↑31 и ↓1 +30
Просмотры 19K
Комментарии 85

Нейросеть Pix2pix реалистично расцвечивает карандашные наброски и чёрно-белые фотографии

Софт Искусственный интеллект

Четыре примера работы программы, код которой опубликован в открытом доступе. Слева показаны исходные изображения, справа — результат автоматической обработки

Многие задачи в обработке изображений, компьютерной графике и компьютерном зрении можно свести к задаче «трансляции» одного изображения (на входе) в другое (на выходе). Так же как один и тот же текст можно представить на английском или русском языке, так и изображение можно представить в RGB-цветах, в градиентах, в виде карты границ объектов, карты семантических меток и т.д. По образцу систем автоматического перевода текстов, разработчики из лаборатории Berkeley AI Research (BAIR) Калифорнийского университета в Беркли создали приложение для автоматической трансляции изображений из одного представления в другое. Например, из чёрно-белого наброска в полноцветную картинку.
Читать дальше →
Всего голосов 24: ↑23 и ↓1 +22
Просмотры 37K
Комментарии 46