Как стать автором
Обновить
70.55
РосКомСвобода
Защита цифровых прав

Demhack 7: применение ChatGPT и борьба с дезинформацией

Время на прочтение7 мин
Количество просмотров3K

НАСТОЯЩИЙ МАТЕРИАЛ (ИНФОРМАЦИЯ) ПРОИЗВЕДЕН И (ИЛИ) РАСПРОСТРАНЕН ИНОСТРАННЫМ АГЕНТОМ «РОСКОМСВОБОДА» ЛИБО КАСАЕТСЯ ДЕЯТЕЛЬНОСТИ ИНОСТРАННОГО АГЕНТА «РОСКОМСВОБОДА». 18+

Новый хакатон запомнился успешным следованием технологическим трендам и воодушевлённым настроем участников.

С 29 сентября по 1 октября 2023 года прошёл онлайн-хакатон Demhack 7. Он объединил русскоязычных IT-специалистов, активистов и исследователей Интернета по всему миру. 

Хакатон состоял из трёх треков: приватность, свобода интернета и исследования интернета. Главная тема — блокировки сайтов и VPN-сервисов: их измерение, изучение, создание и развитие средств обхода. Задачи ставили AmneziaVPN, Lantern, Sota, VPNGenerator, The Moscow Times, ОВД-Инфо, Теплица социальных технологий и «Роскомсвобода», а также партнёры из Казахстана и Кыргызстана.

До финала дошли 9 проектов, 3 из которых стали победителями (без выделения 1, 2 и 3 места):

  • Textgericht с решением для проверки текстов на признаки манипуляций, логических ошибок и хейт-спича;

  • Vox-harbor — команда, решившая задачу по противодействию ботам и накруткам в Telegram;

  • 418 и её VPN-сервер с интегрированной системой управления и умной маршрутизацией.

Команды разделили призовой фонд в размере 1200 USDT, а также получили дополнительные денежные призы от авторов задач, ключи от Paper VPN и другие подарки от партнёров.

«Наше мероприятие не существует в отрыве от происходящего в мире. Люди всегда реагируют на события, предлагают свои решения проблем, ответы на вызовы, которые ставит перед ними реальность. А мы даём для этого площадку и поддержку, возможность безопасно и эффективно сотрудничать на общее благо», — прокомментировала координатор Demhack 7 и Privacy Accelerator Дарья Горбачёва.

Подробнее о проектах

Команда Rotten Apple работала над инструментами сборки для упаковки приложения Lantern под различные версии Linux. Участники написали несколько строк из нескольких команд в CI-сценарии: для скачивания и распаковки дистрибутива Deb, анализа и генерации метаданных, а также сборки для дистрибутива Arch.

За хакатон команда достигла цели в виде перепаковки из одного формата архива сборки из (Deb) в другой (Aur и их PKGBUILD) бинарного пакета в окружении GitHub Actions.

«Ход работы был довольно сложный, — признались участники, — мы выбрали сразу несколько путей для решения, чтобы потом использовать его для других систем».

👉  GitHub

OpenVoiceOS создавала русскоязычного офлайнового голосового помощника, который не будет отправлять данные на серверы компаний. Сервис задумывался достаточно простым в применении, чтобы пользователи без глубоких технических познаний могли самостоятельно устанавливать его. В дальнейшем планируется внедрение и других языков, таких как украинский, польский, чешский, казахский, узбекский.

За основу команда взяла уже существующий проект OpenVoiceOS (бывший Mycroft.ai), для распознавания голоса использовала библиотеку VOSK, для генерации — языковые модели Silero. 

За хакатон участники подготовили скрипт для автоматической установки и настройки голосового помощника на Raspberry Pi, написали плагин для офлайновой генерации голоса через Silero и доработали переводы OpenVoiceOS на русский язык.

«Дальше всё будет быстрее и больше. Понятно, что коммерческие решения в виде «Алисы» и «Маруси» нам не обогнать. Но есть люди, которые не готовы отдавать свои данные российским компаниям, вот это и есть наша аудитория», — поделились в OpenVoiceOS.

👉 GitHub

Команда «Свой умненький домик» занималась системой умного дома, главной особенностью которого является модульное устройство узлов системы в виде разветвлённой сети на микроконтроллерах с центральным сервером. При таком устройстве пользователь может самостоятельно, быстро и легко развёртывать систему. 

Основой системы является MQTT-протокол. Система представляет собой многоуровневую сеть, на вершине которой находится MQTT-сервер, к нему подключаются узлы первого уровня. К этим узлам в свою очередь подключаются датчики и узлы более низкого уровня и т.д. 

К концу хакатона участники полностью проработали структуру сети и сделали несколько базовых классов связи и множество классов датчиков.

👉 GitHub

В «Между строк» занимались дизайном сайта о политзаключенных, который должен рассказывать о способах оказывать помощь: 

«Наша цель — соединить политзаключённых с теми, кто хочет помочь. Мы показываем, как пройти весь путь от поиска человека до, например, отправки письма».

На сайте представлены истории людей, обоснования, кого и почему можно считать политзаключёнными, и статистика по теме. Нужную информацию можно найти через опцию фильтрации по выставленным критериям.

Способов помочь команда предложила несколько: писать письма, собирать деньги в помощь людям, отправлять передачки, распространять информацию, а также посещать судебные заседания в рамках дел политзаключённых и донатить помогающим организациям.

За время хакатона участникам удалось сделать дизайн основных страниц сайта.

Источник: «Между строк»
Источник: «Между строк»

Nev.ru предприняла попытку реализовать API-систему для мониторинга доступности VPN-сервисов, в частности, VPN-протоколов. Целевой аудиторией сервиса являются журналисты независимых СМИ. 

«Мы анализируем трафик и считываем первый из пакетов, который поступает на VPN-сервер, чтобы определить, работает ли протокол. Если пакет поступил, следовательно, клиент активен и может использовать данный VPN-протокол в той локации, где он находится с учетом оператора/ провайдера связи», — рассказали о своей идее в команде.

Пользователь может получить собранные сырые данные, агрегированные датасеты (полученные на основе сырых данных) или готовый отчёт (в формате дашборда и текстового описания рекомендаций по выбранным фильтрам).

👉 GitHub

В Vpn gen app работали над задачей создания простого — однокнопочного — приложения для VPN-generator (сервис для установки VPN). Приложение подключается к серверу VPN-generator по комбинации openvpn over cloak, сгенерированной сервисом в виде vpn:// ссылки. 

За хакатон команде удалось сделать приложение со своим интерфейсом и провести парсинг конфигурации от VPN generator.

👉 GitHub

В 418 разрабатывали решение на базе прокси Xray (XTLS-Reality) для прямого доступа к заблокированным сайтам через прокси,  устойчивое к блокировкам Роскомнадзора.

Решение основано на 3X-UI (оболочка для xray-core), в рамках него также сделан самописный телеграм-бот с функционалом удаления/добавления пользователей у администратора и генерации шаблонных конфигураций у пользователя.

На данный момент сервис готов к практическому использованию и развертыванию, однако у команды есть планы по облегчению настройки клиентов конечных пользователей, а также разработке сценариев для пользователей не из России.

👉 GitHub

Vox-harbor проанализировала создание искусственного общественного мнения в Telegram. 

«Наша гипотеза — мнением в интернете манипулируют. Мы хотели узнать, как это делают, на примере Telegram. В России имитация — государствообразующий принцип, а самая важная имитация — это имитация общественной поддержки», — пояснили суть своего исследования участники.

Команда рассматривала накрутку реакций в опросах и голосованиях и училась выявлять ботов по сообщениям. Для этого участники собрали большую базу данных (35 млн комментариев и 10 млн реакций) и создали большой распределённый парсер Telegram. Вся информация загружается в базу (ClickHouse), где впоследствии анализируется на наличие накруток и ботов. 

«Вы можете видеть, как одномоментно на таком-то канале накрутили определённых реакций», — прокомментировали члены команды. 

vox-harbor сделала веб-интерфейс для удобного просмотра результатов., backend api и провела анализ комментариев с помощью fine-tune chat gpt. 

«Полезно доносить до аудитории информацию о манипуляциях. Делать это следует путём сборам доказательств и их публикаций. По результатам исследования планируем, собственно, написать статью и разместить её в независимых изданиях. Кроме того, будем продвигать наше решения как средство противодействие дезинформации в Telegram», — заключили в команде.

👉 GitHub

В Textgericht учились находить признаки манипуляций, логических ошибок и хейтспич в текстах (новостях, статьях, публичных комментариях). 

«Мы развивали проект в двух траекториях потенциального применения: исследовательский (создание корпуса текстов и его «машинная» аннотация) и образовательный (человекочитаемое объяснение проблем, найденных в тексте, через телеграм-бот)», — поделились участники.

Команда собрала корпус текстов из 15 телеграм-каналов. Из каждого из них textgericht извлекала 500 последних постов, которые сохраняла в базу с текстом превью и мета-данными. Далее она составила запросы для ChatGPT API в целях поиска манипуляций, логических ошибок и хейтспича. Затем запустила собранные промпты на выборке из базы (50 текстов на источник).

Наконец, участники визуализировали результаты, «обернув» данные в интерактивный формат, а также написали телеграм-бота, через который можно проверять тексты.

👉 GitHub

Demhack 7 — самый сильный из всех Demhack

Члены и менторы жюри охарахтектировали прошедший хакатон как лучший по уровню подготовки команд. Так, член жюри Алексей Шевелёв, руководитель отдела по работе с пользователями «Хабр», рассказал, что все проекты были очень сильными и разноплановыми. Кроме того, он обратил внимание, что использование ChatGPT красной нитью проходило по многим проектам. 

Про новые инструменты сказала и член жюри Молдир Утегенова, руководитель проектов в MediaNet (Казахстан), Access Now Fellow. Эксперт также добавила, что хотела бы, чтобы такие мероприятия проходили и в её стране:

«Мы знаем, какие проблемы сейчас в России и какие — в Казахстане. Они перекликаются. Поэтому решения некоторых задач подходят и для Казахстана. Я надеюсь, что у нас тоже найдутся сильные разработчики, тимлиды и другие специалисты, которые могут отвечать на сложные, интересные вопросы».

С тем, что команды в этот раз были настолько сильными, что победителей оказалось сложно выбрать, согласился и член жюри Станислав Шакиров, технический директор «Роскомсвободы»:

«Этот хакатон — лучший из всей серии Demhack. Поэтому то, что жюри выбрало только три проекта, не означает, что остальные плохие: практически все они на предыдущих хакатонах могли претендовать на призовые места. Уверен, что многие сегодняшние проекты должны двигаться дальше, из них могут получиться важные и интересные сервисы».

А вот члену жюри Сергею Сидоренко, руководителю «Теплицы социальных технологий», по его словам, нравились все Demhack, которые проходят два раза в год, начиная с осени 2020 года. Относительно седьмого хакатона он обратил внимание на профессионализацию и углубление команд в темы:

«Особенно стоит отметить ярко выделяющуюся отрасль circumventtech технологий по преодолению цензуры. Об уровне зрелости circumventtech можно судить об этом хотя бы потому, на каком уровне мы говорим с вами о протоколах».

Кроме того, Сидоренко возлагает особенную надежду на т.н. DisinfoTech. По его словам, будет здорово, «если DisinfoTech станет проявляться не только в доступе к информации, но и в посыле о том, что эта информация должна быть качественной».

Ментор Филипп Кулин, автор проекта «Эшер II», эксперт по анализу блокировок, рассказал, что даже те темы, которые ему не понравились, были раскрыты хорошо. Он считает, что задачи оказались полезны не только самим «заказчикам», но и тем, кто потом смотрел на их решение. 

«Не все ТЗ были удачны, но команды справлялись и справлялись офигенно. Во-первых, слушатели потом увидели, в чём заключалась суть задач, во-вторых, вынесли из этого что-то для себя, в-третьих, «заказчики» тоже были удовлетворены». 

Кулин также отметил воодушевление, с которым участники пришли на мероприятие: «Для примера: я был на другом хакатоне, там команды понимали, что не успеют решить задачу за выходные, и сникали. А здесь, несмотря на возможный неуспех, все были бодры и стремились сделать максимум». 

Организаторы хакатона благодарят всех участников, менторов и партнёров! И ждут всех в новом наборе Privacy Accelerator!

Теги:
Хабы:
Всего голосов 16: ↑14 и ↓2+16
Комментарии6

Публикации

Информация

Сайт
roskomsvoboda.org
Дата регистрации
Дата основания
Численность
11–30 человек
Местоположение
Россия
Представитель
Артем Козлюк

Истории