IgnatChuker 12 июн 2023 в 15:09

TrueConf показала возможности своего шумодава при включённом тракторе

1 мин

9.4K

Искусственный интеллектIT-компанииВидеоконференцсвязь

+51

Комментарии 48

Hardcoin 12 июн 2023 в 15:16

Слишком круто. Сначала он показывает пару тривиальных функций (замена фона и центрирование человека), а потом показывает то, к чему конкуренты даже близко не подошли. Наверное для контраста :)

Arsick 12 июн 2023 в 15:37

Подумали, что надо показывать возможности шумодава буквально на максимум :)

sergarcada 12 июн 2023 в 22:50

Сначала он показывает замену фона, а потом показывает трактор.

Что-то одно из этого работает идеально - замена фона или шумоподавление ;-)

ReadOnlySadUser 13 июн 2023 в 18:58

Ну, я может о чём-то не в курсе, но при наличии видеокарточки от NVidia все представленные ништяки доступны, если установить NVidia Broadcast. И шумодав, и замена/удаление фона и парочка криповых штук, таких как имитация того, что ты смотришь прямо в камеру.

Popadanec 13 июн 2023 в 19:30

парочка криповых штук, таких как имитация того, что ты смотришь прямо в камеру.

А что не так? Меня лично всегда раздражает, когда собеседники смотрят непонятно куда.
Даже думал об идее камеры с несколькими матрицами по разным сторонам экрана.

ReadOnlySadUser 14 июн 2023 в 15:22

Ну, во-первых, смотреть прямо в камеру - это неестественно)

Во-вторых, реализация вышла довольно криповой, потому что глаза там получаются не под естественными углами. Эффект зловещей долины никто не отменял.

От себя лично могу сказать, что я персонально ненавижу эту функцию из-за своей, как я её обозвал, "скайпофобии" (боязнь общения по ВКС). Я не знаю как это объяснить, но у меня внутри постоянно дискомфорт при общении по видео. Я всегда сворачиваю окно с отображением участников звонка, потому что иначе начинаю нервничать. Более или менее свыкся с этим во времена ковида, но тяженько бывает до сих пор.

И вот функция, которая заставляет людей в кадре смотреть "прямо в душу" меня прям конкретно так пугает)

Areso 12 июн 2023 в 15:22

Трактор какой-то неправильный, судя по родным пятиэтажкам на фоне.

Должен быть Беларус!

Popadanec 12 июн 2023 в 16:52

От них даже белорусы уже открещиваются. Изделия для тех, кто не ищет лёгких путей.
Отец решил что ему слишком скучно и купил минитрактор МТЗ-132н, теперь полностью перешёл на русский матный. Сразу понимаешь, откуда идут корни многоэтажных матных конструкций.

Dart55 13 июн 2023 в 11:16

С Беларусом шумодав не справляется.

dimodin 13 июн 2023 в 15:58

обещали ребята с Белаза (завод) сделать натурное испытание собственно с Белазом(и шумный цех и самосвал). Ждем-с.

1e100 12 июн 2023 в 15:52

Осталось добавить своего AI аватара чтоб одетый сидел и моргал, останется только говорить :)

ssj100 12 июн 2023 в 15:54

ТехtToSpeech на ChatCPT и вперед

d2d8 12 июн 2023 в 18:40

Не понимаю почему тут минус. Но ведь сейчас нейросеть может генерить код, голос, персонажей, видео и обучать кожаных мешков тому, что она проходит за 3 минуты.

gsaw 12 июн 2023 в 15:53

Ещё бы сделали возможность записать зацикленное видео, как в шпионских ыильмах и что бы когда начинаешь говорить автоматом переключалось опять на видеопоток с камеры. А то иногда хочется почесаться, воды попить, при этом вода мимо рта на рубашку льется. То вот так бы было красиво, конференции более расслаблено проходили бы.

trueteam 12 июн 2023 в 16:26

Пока в разработке отслеживание доски/документа в кадре для более удобного развертывания в кадре по отношению к другим участникам ВКС. И транскрибация речи сейчас на закрытом тестировании.

TimsTims 12 июн 2023 в 20:00

Obs Studio в помощь) он может делать "виртуальную камеру", которая на самом деле будет транслировать то, что вы ей скажете - хотите рабочий стол, хотите видео, хотите сцены переключайте.

Harliff 12 июн 2023 в 16:44

Как пилить фичи и пиариться - так это ок. Как поправить зависание намертво камеры в виндовс 10 на iMac для клиента, который вам платит за «стандартную» поддержку - так это фиг (запрос уже 16 месяцев в работе, прогнозы не понятны).

https://trueconf.ru/support/technical-support/view?ticket_id=14734&d=efac6d1c001c0e78768fd445fbad8fa5

Areso 12 июн 2023 в 16:48

План, как и прогноз, вполне очевиден:

1) ждём EOL для 10-ки

2) говорим, что 10-ка не поддерживается =)

3) закрываем тикет!

angry_paimon 12 июн 2023 в 17:06

Использовать винду на маке, а вы знаете толк в извращениях)

spc 12 июн 2023 в 16:45

Интересно, а не бывает такого, чтобы ИИ, понаблюдав за спикером, после шумоподавления снова приводил частотную характеристику речи в норму? А то здесь после шумоподавления субъективно слишком много металла в голосе, хотя чистота, конечно, на высоте.

Ilusha 12 июн 2023 в 16:58

Возможно, не шумодав классно работает, а AI вычленяет голос.

1dNDN 13 июн 2023 в 13:04

Металл в голосе - это, вроде бы, если фазы сдвинуты

dimodin 13 июн 2023 в 15:50

если тихо - шумодав лучше вообще отключать. Лишняя обработка голоса ни к чему.

ris58h 12 июн 2023 в 16:49

Мне одному кажется что ИИ путают с машинным обучением?

Ilusha 12 июн 2023 в 17:09

ML - это метод в области AI, если верить Википедии.

rsashka 12 июн 2023 в 17:18

Лучше не верить, т.к. вики не является авторитетным источником.

"Процитированное в преамбуле определение искусственного интеллекта, данное Джоном Маккарти в 1956 году на семинаре в Дартмутском университете, не связано напрямую с пониманием интеллекта у человека. "

YegorP 12 июн 2023 в 16:56

Каков лаг?

Arsick 12 июн 2023 в 19:26

Вы имеете в виду задержку? Шумодав работает в режиме реального времени

angry_paimon 12 июн 2023 в 17:08

Не ожидал такого эпика в конце. Звучит годно, интересно будет попробовать

Daddy_Cool 12 июн 2023 в 17:37

Вау! Я впечатлен! Интересно, а настройку "детское кафе", "метро", "парк" - можно сделать?
Все таки рядом с трактором и перфоратором не выдержись в первую очередь сам, а не твои слушатели.

Arsick 12 июн 2023 в 18:30

Настройки как таковой нет. Бытовой шум и музыку тоже хорошо удаляет.

brotchen 12 июн 2023 в 18:46

Самому можно просто в хороших наушниках сидеть.

НЛО прилетело и опубликовало эту надпись здесь

Arsick 12 июн 2023 в 21:15

Музыку режет на ура. С голосами сильно сложнее. Под конкретного человека учить нейросеть задачи нет.

У нас цель с помощью ИИ-функций решить типовые проблемы отдельных пользователей со звуком и видео, повысить приватность, немного разгрузить сис. администраторов и ИТ-отделы в компаниях.

AndronNSK 12 июн 2023 в 21:08

А с дешёвыми микрофоном с никаким динамическим диапазоном сможет перф заглушить?))))

Arsick 12 июн 2023 в 21:10

На видео использовался встроенный в ноутбук HP микрофон. От гарнитуры технология не зависит. Но, конечно, для собственного комфорта в условиях шумного фона - проще самому сидеть в наушниках.

papilaz 12 июн 2023 в 23:06

Тут самое главное, чтобы тракторист не матерился. Ведь сторонние голоса отсеять нельзя. Ждём репортаж из группы детского сада, как там этот ИИ справится?

XaBoK 12 июн 2023 в 23:28

Презентация - не повод рукоплескать. Сделать шумодав для работающего двигателя трактора - не сложно. Если я правильно помню, то таким было тестовое задание для одного моего знакомого при найме. Сделать универсальный шумодав - вот тут уже задача для серьёзных претендентов на "короля горы".

Daddy_Cool 12 июн 2023 в 23:43

Ха, а ведь и вправду - эти инструменты э... циклические. И такой шум должен иметь характерные паттерны/периоды.

Popadanec 13 июн 2023 в 08:03

Смотря как оно работает. Если постоянно отрезаются все звуки кроме голоса, то это уже заявка на успех.
Если смогут ещё и конкретный голос оставлять, вырезая все остальные, то шумодав будет разлетаться как горячие пирожки.

dimodin 13 июн 2023 в 15:56

так он универсальный. Его же не на тракторах мы учили. Я даже специально попросил проверить, мы справимся с трактором во дворе или нет. Удивлён сам, что справились. Дрели, лобзики - я сам проверял, тут нет вопросов. Хлопки, стук - тоже долой. Там проблема - спикер орать начинает в микрофон, так как громко вокруг. А дешевые микрофоны по честному не справляются с таким.

Ну и будем честны, пробить его можно. Пихаете в микрофон дрель непосредственно и вуаля. Дрель загасит, но и речь тоже скорее всего накроется. Не для таких все же ситуаций сделано. Станки там на фоне, человек-сосед, такое вот.

XaBoK 14 июн 2023 в 18:38

Вот это было бы уже интересно почитать. На чём учили, что побивает и тд.

Сунуть дрель в микрофон, всё-таки, не юзкейс. А как насчёт невнятного произношения, заиканий, множества живых голосов на фоне, записи/радио/музыка, эхо в конце концов. Универсальность "не на тракторах учили" - слишком слабый аргумент. Я не специалист, но кажется, тут должно быть что то аналогичное вычислительной фотографии. Выделить голос, отделить шумы, достроить слабые участки. Точно так же, как на смартфонах заменят фото луны на рендер, можно было бы и генерировать распознанные слова голосом говорящего.

Ну и, конечно, никуда без бизнес решений в неоднозначных ситуациях: если я звоню с концерта и молчу - нужно ли транслировать окружающие звуки или только голоса? А если я звоню с совещания, то нужно ли подавлять все голоса кроме моего? А если в автобусе? Короче, чистой универсальности техническим путём вряд ли можно достичь.

НЛО прилетело и опубликовало эту надпись здесь

Manwe_SandS 14 июн 2023 в 06:35

Фокус на лице – классно, почти догнали разработку Apple двухгодичной давности. Что-что, а повторять наши инженеры всегда умели.

А вот звук действительно впечатлил.

angry_paimon 14 июн 2023 в 10:56

А что плохого в том, что разработчик сделал СВОЮ версию фокуса на лице, для которого не нужны девайсы эпл?

Manwe_SandS 15 июн 2023 в 13:08

Разработчик молодец. Проблема в идеях. Наши копируют чужие идеи после того, как они были реализованы и доказали свою успешность. Вечно в догоняющих. Бывает даже своя классная новаторская идея, но её не воплощают, боясь провала. Ждут пока сделают американцы, а потом такие «а мы это первыми придумали». Печально.

Cirick 16 июн 2023 в 00:51

А как сейчас работает эхо подавление в TrueConf? Года 4 назад, именно из него мы отказались от TrueConf.

assan9e 16 июн 2023 в 18:51

В вопросах звука за 4 года было проделано очень много работы, эхоподавление и автоматическая регулировка уровня громкости прокачиваются постоянно.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий