То я его деинсталлирую из жалости, чтоб не мучился
Тоже проявление эмпатии, однако.
На самом деле цинизм никуда не делся, разработчикам тут важно увеличить время пользовательской сессии и частоту сессий за день. Вот например, показательный случай с СяоАйс.
Да, ну тут в любом случае получается подстройка бота под пользователя, но немного другая. Бот может сопротивляться и дистанцироваться, если у юзера есть на это запрос, например. Есть целый пласт пользовательской этнографии, когда люди всячески ищут способы напугаться и находят таки. Например, изобретают миф про приложение или устройство, которое их подслушивает или даже преследует. Ну а разработчики собирают этнографию, находят такие запросы и встраивают в свои приложения, чтобы оно периодически шумело в определенные моменты и в полуигровой форме пугало юзера. А что касается сопереживания и эмпатии, оно тоже может быть совсем не веселым, такие примеры есть в нашем датасете.
Да, именно как развлечение это не сильно оправдано, быстро надоедает. Но в других задачах может быть важным умение бота подстраиваться под пользователя. Вот сейчас все идет к тому, что генеративный ИИ сменится интерактивным. Например, вы даете задание чат-боту закупить канцтовары и доставить их по такому-то адресу. Для этого ему нужно связаться с другими ботами и людьми, и скоординировать процесс закупки-доставки. Если для общения с другими чатботами достаточно машинного кода, то общаться с людьми, а тут есть сложнейшая задача самому инициировать диалог, боту уже гораздо сложнее. Для этого и нужна подстройка, чтобы все друг друга поняли.
Да, всё так, для этого и нужна гибкая подстройка чат-бота под уникальный случай взаимодействия. Если бот не повторяет заготовленные фразы, а действует ситуативно, это будет лучше.
Спасибо на добром слове! Совсем сырые данные мы выложить не можем из-за закона о персональных данных, GDPR и так далее, но обезличенные данные для построения графа, воспроизведения пейджранка и сетевого анализа в целом выложили, вот ссылка на гитхаб: github.com/visualcomments/coronavirus_data
Именно так. Сейчас, когда это можно исследовать на больших данных, приходится переписывать концепцию медиа, потому что кластер на миллионы комментариев вокруг казалось бы немедийного персонажа со странной социальной повесткой — это действительно вызов обобщенному телевизору.
Добавил в шапку поста ссылку на предыдущие посты, где есть общая информация об алгоритме, параметрах, отвечающих за цвет вершин и так далее. Вот ссылка на статью от разработчиков.
Если суммировать, то длина ребер зависит от связей вершины с другими вершинами. Чем меньше связей, тем больше длина. Соответственно, комментарии условных «ботов», которые прицельно комментируют только конкретные ролики, можно увидеть по их удаленности от условного центра (облака комментариев) и высокой связности друг с другом (кластеризации).
То есть визуализация комментариев — это навигационная система, которая указывает, где есть большая вероятность найти ботов. К сожалению, всё это пока неточно и сводится к эмпирико-описательной работе. Но мы работаем над этим.
Что касается данных, то мы используем открытые данные о комментариях на ютуб-каналах, добытые с помощью скрепера. Плюс проводим качественный контент-анализ содержания комментариев (пока делаем вручную).
Открытая статистика просмотров малоинформативна и говорит о канале, а не о его аудитории. Когда мы изучаем по комментаторам аудиторию одного канала, мы можем посмотреть затем, как она пересекается с аудиториями других каналов. Кроме того, комментарий говорит о большей вовлеченности, чем просмотр.
Тоже будет интересно узнать. Уже в процессе изучения контента я нашел испанский канал, где попадались ролики о тохо-косплее, и практически все ссылки этого канала были на каналы о тохо-косплее. И этот канал оказался изолированным от остальных каналов в выборке. Так что можно внезапно обнаружить сообщество в сообществе, как оказалось.
Оптимизация затрат на размещаемый контент, это наверное из самого очевидного. То есть по наибольшим скоплениям комментариев можно определить, где ролик посмотрит максимальное количество народа.
Спасибо! Поищем нужный тип укладки в Gephi, может получится что-то в этом духе. Знающие товарищи советуют обратить внимание на Yifan Hu Proportional, так как у наших графов есть явное тяготение к кластеризации. Хотя пулевой ад — тоже неплохо.
Да, мы как раз планируем сделать и то, и то. Сейчас работаем над визуализацией комментариев тематических ютуб-сообществ на разных языках, для начала будем сравнивать русскоязычные, а потом и другие языковые сообщества с условно-международным. Сервис думаем запустить после доработки софта и автоматизации всего того, что мы пока что делаем руками.
Тоже проявление эмпатии, однако.
На самом деле цинизм никуда не делся, разработчикам тут важно увеличить время пользовательской сессии и частоту сессий за день. Вот например, показательный случай с СяоАйс.
Да, ну тут в любом случае получается подстройка бота под пользователя, но немного другая. Бот может сопротивляться и дистанцироваться, если у юзера есть на это запрос, например. Есть целый пласт пользовательской этнографии, когда люди всячески ищут способы напугаться и находят таки. Например, изобретают миф про приложение или устройство, которое их подслушивает или даже преследует. Ну а разработчики собирают этнографию, находят такие запросы и встраивают в свои приложения, чтобы оно периодически шумело в определенные моменты и в полуигровой форме пугало юзера. А что касается сопереживания и эмпатии, оно тоже может быть совсем не веселым, такие примеры есть в нашем датасете.
Да, именно как развлечение это не сильно оправдано, быстро надоедает. Но в других задачах может быть важным умение бота подстраиваться под пользователя. Вот сейчас все идет к тому, что генеративный ИИ сменится интерактивным. Например, вы даете задание чат-боту закупить канцтовары и доставить их по такому-то адресу. Для этого ему нужно связаться с другими ботами и людьми, и скоординировать процесс закупки-доставки. Если для общения с другими чатботами достаточно машинного кода, то общаться с людьми, а тут есть сложнейшая задача самому инициировать диалог, боту уже гораздо сложнее. Для этого и нужна подстройка, чтобы все друг друга поняли.
Да, всё так, для этого и нужна гибкая подстройка чат-бота под уникальный случай взаимодействия. Если бот не повторяет заготовленные фразы, а действует ситуативно, это будет лучше.
Если суммировать, то длина ребер зависит от связей вершины с другими вершинами. Чем меньше связей, тем больше длина. Соответственно, комментарии условных «ботов», которые прицельно комментируют только конкретные ролики, можно увидеть по их удаленности от условного центра (облака комментариев) и высокой связности друг с другом (кластеризации).
То есть визуализация комментариев — это навигационная система, которая указывает, где есть большая вероятность найти ботов. К сожалению, всё это пока неточно и сводится к эмпирико-описательной работе. Но мы работаем над этим.
Что касается данных, то мы используем открытые данные о комментариях на ютуб-каналах, добытые с помощью скрепера. Плюс проводим качественный контент-анализ содержания комментариев (пока делаем вручную).