Комментарии 55
Основная проблема была именно в голосе.
Правда мне кажется, что что-то похожее я слышал, даже википедия говорит как минимум о четырех продуктах, из которых парочка доступны всем, то есть говорить о «первой» подобной технологии — некорректно.
Вас узнают в жэк-е и бросают трубку или бывший(ая) супруг(а) не отвечают на ваши вызовы, а может быть вы коллектор и клиент уже знает ваш голос? То новая услуга специально для вас.
з.ы: Авторские права на голос?
О, теперь можно петь, как Роберт Плант?)
Не ручаюсь за точность цитаты, «годы я тренировался для того, чтобы моё сделать моё пение похожим на то девчачье нытьё, которое вы слышите сейчас»
Телефонные аферисты тоже наверно довольны, теперь «мама я попал в аварию, пришли денег» будет работать ещё лучше.
Заключённые аплодируют стоя!
Кто первый из присутствующих на хабре запустит голосовой SIP прокси VPN.
Одним из первых бета тестеров данного сервиса будут мошеннки и телефонные лже-террористы.
Lyrebird кандидат на блокировку Роскомнадзора, ишь ты чего удумали голос менять — подумал чиновник, прежде чем добавить в бан Lyrebird .
Тут уже начинается двухфакторная авторизация: «сынок, а мы в каком году на море ездили? а как звали твоего первого питомца»?
Вы должны не только знать информацию, но и обладать чем-то, отдельным от информации.
Терминатор 101 таким способом обманул Т-1000. Оба терминатора в беседе друг с другом использовали такой способ обмана и оба поняли что поговорили не с людьми. ))))
О каком прорыве вообще идёт речь если они просто немного доработали Microsoft Sam'а, да и так что всё равно слышно только Сэма что не слышно доработок?
эффективно работала технология голосовой идентификации.
Эта тема была раскрыта Солженицыным в романе «В круге первом».
Товарищ Ализар, слово «разыскной» сейчас подвели под общее правило (без ударения пишем «раз-»).
Adobe ананосировал эту возможность еще год назад в своем продукте, презентация есть на youtube, да и на хабре была статья.
Можно запустить и более простой тест, используя i-vectors и алгоритмы идентификации говорящего. Более простой он в том смысле, что его легче обмануть.
А так — алгоритмы преобразования речи (изменения пола, тона, и т.д.) существуют очень давно, а органы восприятия человека обманываются очень легко и без алгоритмов.
Получается голосовую идентификацию, в том числе и банках, скомпрометировали ещё до повсеместного внедрения?
А шумы допилят со временем.
Благодаря передовым разработкам в области ИИ теперь злоумышленники смогут пустить оперативников по ложному следу
Ровно наоборот! Это теперь люди в штатском смогут посадить любого за экстремизм и терроризм при помощи аудиозаписи в которой подозреваемый кричит экстремистские высказывания и обсуждает подготовку теракта.
У кого какие идеи как это реализовано и как можно повторить самому? В области ИИ не силен, но думаю что тут LSTM сеть, но каким образом она обрабатывает 2 голоса (свой, и тот, в который его надо превратить) и выдает подделку? Как и чем её обучали?
По идее, для того, чтобы разница между двумя волнами была не так заметна, оба голоса должны произносить один и тот же текст, но тогда весь смысл фейка теряется. Чтобы сказать произвольный текст нужным голосом, скорее всего надо опуститься на уровень пониже, снять «маски» слогов или отдельных звуков, а не слов. Тогда нейросеть будет сканировать нашу произвольную речь, узнавать в ней слоги, и на каждый слог накладывать слог из банка слогов нужного тембра.
[далее полное ИМХО, я не специалист в ML]
Две нейросети, генератор и дискриминатор.
Дискриминатор пытается отличить сгенерированыый голос от настоящего,
а генератор пытается впарить сгенерированный голос дискриминатору.
На мой взгляд, подделка голоса может быть использована исключительно в неблаговидных целях и не лишним будет законодательно запретить пользование этим сервисом.
Разработчики говорят, что Lyrebird — первая в мире компания, которая предлагает технологию для точной подделки чужих голосов. В связи с этим на них налагаются определённые этические обязательства. Главным этическим обязательством является повсеместное информирование о возможностях технологии по точной подделке чужого голосаШикарная попытка бесплатной раскрутки) Мы вам покажем десяток роликов очень посредственного качества, ну а вы скорее рассказывайте всем и каждому о нашей чудо технологии! Галактика в опасности!.. :)
Это сильно меняет работу журналистов, юристов, историков и всех тех, для кого порой голос — единственная возможность идентифицировать человека.
Контакт Алеса, можно напрямую или через сайт «Выргород» разницы нет.
Создана первая технология для подделки любых голосов