Как стать автором
Обновить
12
3
Антон Костин @visualcomments

Пользователь

Отправить сообщение

То я его деинсталлирую из жалости, чтоб не мучился

Тоже проявление эмпатии, однако.

На самом деле цинизм никуда не делся, разработчикам тут важно увеличить время пользовательской сессии и частоту сессий за день. Вот например, показательный случай с СяоАйс.

Да, ну тут в любом случае получается подстройка бота под пользователя, но немного другая. Бот может сопротивляться и дистанцироваться, если у юзера есть на это запрос, например. Есть целый пласт пользовательской этнографии, когда люди всячески ищут способы напугаться и находят таки. Например, изобретают миф про приложение или устройство, которое их подслушивает или даже преследует. Ну а разработчики собирают этнографию, находят такие запросы и встраивают в свои приложения, чтобы оно периодически шумело в определенные моменты и в полуигровой форме пугало юзера. А что касается сопереживания и эмпатии, оно тоже может быть совсем не веселым, такие примеры есть в нашем датасете.

Да, именно как развлечение это не сильно оправдано, быстро надоедает. Но в других задачах может быть важным умение бота подстраиваться под пользователя. Вот сейчас все идет к тому, что генеративный ИИ сменится интерактивным. Например, вы даете задание чат-боту закупить канцтовары и доставить их по такому-то адресу. Для этого ему нужно связаться с другими ботами и людьми, и скоординировать процесс закупки-доставки. Если для общения с другими чатботами достаточно машинного кода, то общаться с людьми, а тут есть сложнейшая задача самому инициировать диалог, боту уже гораздо сложнее. Для этого и нужна подстройка, чтобы все друг друга поняли.

Да, всё так, для этого и нужна гибкая подстройка чат-бота под уникальный случай взаимодействия. Если бот не повторяет заготовленные фразы, а действует ситуативно, это будет лучше.

Спасибо на добром слове! Совсем сырые данные мы выложить не можем из-за закона о персональных данных, GDPR и так далее, но обезличенные данные для построения графа, воспроизведения пейджранка и сетевого анализа в целом выложили, вот ссылка на гитхаб: github.com/visualcomments/coronavirus_data
Именно так. Сейчас, когда это можно исследовать на больших данных, приходится переписывать концепцию медиа, потому что кластер на миллионы комментариев вокруг казалось бы немедийного персонажа со странной социальной повесткой — это действительно вызов обобщенному телевизору.
Научное любопытство, ничего личного. Кроме того, это памятник эпохи, нужно оставить для пытливых потомков.
Добавил в шапку поста ссылку на предыдущие посты, где есть общая информация об алгоритме, параметрах, отвечающих за цвет вершин и так далее. Вот ссылка на статью от разработчиков.
Если суммировать, то длина ребер зависит от связей вершины с другими вершинами. Чем меньше связей, тем больше длина. Соответственно, комментарии условных «ботов», которые прицельно комментируют только конкретные ролики, можно увидеть по их удаленности от условного центра (облака комментариев) и высокой связности друг с другом (кластеризации).
То есть визуализация комментариев — это навигационная система, которая указывает, где есть большая вероятность найти ботов. К сожалению, всё это пока неточно и сводится к эмпирико-описательной работе. Но мы работаем над этим.
Что касается данных, то мы используем открытые данные о комментариях на ютуб-каналах, добытые с помощью скрепера. Плюс проводим качественный контент-анализ содержания комментариев (пока делаем вручную).
Открытая статистика просмотров малоинформативна и говорит о канале, а не о его аудитории. Когда мы изучаем по комментаторам аудиторию одного канала, мы можем посмотреть затем, как она пересекается с аудиториями других каналов. Кроме того, комментарий говорит о большей вовлеченности, чем просмотр.
Тоже будет интересно узнать. Уже в процессе изучения контента я нашел испанский канал, где попадались ролики о тохо-косплее, и практически все ссылки этого канала были на каналы о тохо-косплее. И этот канал оказался изолированным от остальных каналов в выборке. Так что можно внезапно обнаружить сообщество в сообществе, как оказалось.
Там не всё подходящее оказалось, особенно у корейского сообщества. Но основной корпус «глобальных» ссылок кажется в порядке.
Оптимизация затрат на размещаемый контент, это наверное из самого очевидного. То есть по наибольшим скоплениям комментариев можно определить, где ролик посмотрит максимальное количество народа.
Спасибо! Поищем нужный тип укладки в Gephi, может получится что-то в этом духе. Знающие товарищи советуют обратить внимание на Yifan Hu Proportional, так как у наших графов есть явное тяготение к кластеризации. Хотя пулевой ад — тоже неплохо.
Да, мы как раз планируем сделать и то, и то. Сейчас работаем над визуализацией комментариев тематических ютуб-сообществ на разных языках, для начала будем сравнивать русскоязычные, а потом и другие языковые сообщества с условно-международным. Сервис думаем запустить после доработки софта и автоматизации всего того, что мы пока что делаем руками.

Информация

В рейтинге
1 042-й
Откуда
Россия
Зарегистрирован
Активность

Специализация

Data Analyst, Web Analyst
Middle
Python
Linux