unistory22 авг 2024 в 10:56

Страх и ненависть в телевизоре: как 3 разработчика взяли целую кучу нейросетей и научили их находить буквально ВСЁ

Простой

10 мин

Data Engineering *

Кейс

Recovery Mode

Комментарии 8

pagin 22 авг 2024 в 11:11

А почему не CLIP/DINO/Yolo-world? Для задачи "Определить всё" явно лучше. Ну и как бы получается one-stage. И учить не нужно - берем из коробки.

unistory 22 авг 2024 в 15:16

Нам была важна специфичная настройка различных сторон анализа и асинхронность при обработке из-за потенциально огромного количества видео. Поэтому решили не использовать универсальное решение.

Dynasaur 22 авг 2024 в 11:26

Почему плачет один дата-сайентист? В чем проблема сказать нейросети, что адидасов бывает три?

unistory 22 авг 2024 в 11:31

Не то чтобы это была проблема. Но ведь работы действительно становится больше.

AigizK 22 авг 2024 в 13:19

анализируете каждый кадр? или применяете какие то оптимизации, например анализ только i-frames
как получаете данные от ТВ

unistory 22 авг 2024 в 15:39

Cистема умеет работать в двух режимах: анализ каждого кадра; анализ каждого кратному переданному числу кадра.
Cуществует наш внутренний сервис, ответственный за это. Мы подключаемся к нему по UDP и получаем данные от TV.

MisterClever 23 авг 2024 в 05:24

Если не секрет, подскажите пожалуйста, какой нейросетью вы пользовались, когда создавали обложку и арты внутри статьи с отсылками на Страх и ненависть в Лас Вегасе?))) Они просто до мурашек атмосферны и захатывающи)

unistory 23 авг 2024 в 05:57

Спасибо) все банально, Midjourney. Писал промпты вроде « picture in the style of the movie fear and loathing in las vegas, three guys in a car surrounded by bats. »

Еще хотел для конца статьи сделать такую картинку: терминатор-скелет вылезает из телевизора, при этом у него длинные черные волосы как у Самары из «Звонка». Выдало лютую крипоту.

Потом отказался от этой идеи и решил просто сделать Самару из «Звонка», вылезающую из телевизора, но милую. Верный способ сделать что-то милое в Midjourney — добавить в промпт «pixar style». В итоге картинки выглядели примерно так: очень милая голова девочки без шеи и тела. Лежит на полу. Оригинал потерял, но вот что-то похожее.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий