neuroonet Feb 3 2022 at 16:50

Нейросети могут быть опасными: сгенерированные лица и синтезированные голоса все более реалистичны

4 min

7.2K

Neuro.net corporate blogInformation Security*Machine learning*Artificial Intelligence

Comments 9

wrewolf Feb 3 2022 at 17:30

О чём эта статья? Зачем это на хабре? Выглядит как текст скопированный из произвольной взятой газеты....

habrabkin Feb 3 2022 at 20:17

Ждем у сбера! (видео mp4)

cdn.discordapp.com/attachments/494571953697456129/938766298467409940/mp4.mp4

semibiotic Feb 4 2022 at 16:59

Изящный способ воровства денег у следующего человека в очереди.

Alexey2005 Feb 3 2022 at 21:04

Как минимум подделка голоса в российских реалиях неактуальна — все эти нейронки тренированы только на англоязычной речи. Очень сомневаюсь, что в ближайшие пять лет появится качественный русскоязычный синтезатор, способный подделать любой голос по короткому сэмплу.

corvair Feb 4 2022 at 07:58

Да по моему уже есть системы, способные в частности "говорить" голосом Путина. VeraVoise например. Вообще вся эта индустрия дипфейков вызывает только тревогу, риск нелегитимного применения достаточно велик, при этом порог входа снижается. В соцсетях и мессенджерах очень часто можно встретить переозвученные ролики самого разного качества, часто их используют для некорректной рекламы, например выступления деятелей науки, обычно медицины, с переозвучкой и заменой задника в целях мошенничества. Обычно такая реклама нацелена на пожилых и в целом на доверчивый контингент, поэтому с губами или не заморачиваются или скрывают их простым блюрингом всей картинки. Но например для манипуляций общественным мнением можно заморочится и с Lip sync, оно того стоит :).

UFO just landed and posted this here

usv_usv Feb 4 2022 at 06:16

Вывод: образцы голоса и изображения лица не могут быть средством аутентификации пользователей в банковской сфере и т.д.

snakers4 Feb 4 2022 at 11:51

Очередная статья от копирайтера на Хабре. Мы на эту тему написали в разделе нашей недавней статьи про синтез речи, искать по "Существует ли массовая опасность со стороны "ИИ".

TLDR — для массового пользователя атака будет скорее всего "тупая" просто по предзаписанным фразам другого человека (пример — разводят бабушку якобы сын просит перевести деньги, попал в беду, запись голоса не сына, а какого-то левого чувака.

Но разовую дорогостоющую диверсию, если есть "много денег", провести вполне реально даже по качественной записи 1 телефонного разговора.

AigizK Feb 9 2022 at 08:17

Ну вот у этих вроде что то получается https://coqui.ai/blog/tts/yourtts-zero-shot-text-synthesis-low-resource-languages