Новости / Профиль mtuci / Хабр

@mtuci

Пользователь

ПрофильСтатьи11ПостыНовости4Комментарии

mtuci 16 янв 2025 в 09:51

О том, как в МТУСИ предложили новый метод анализа юридических текстов с помощью дерева решений и технологии TF-IDF

3 мин

967

Блог компании МТУСИ

Обзор

В свете быстрого прогресса информационных технологий и неуклонного увеличения объемов текстовых данных, задача эффективной обработки и анализа текстов становится крайне актуальной, особенно в области юриспруденции.

Сфера права сталкивается с необходимостью мгновенного и точного анализа множества правовых документов, судебных решений и законодательных актов. Традиционные методы анализа часто оказывались недостаточно эффективными, что в свою очередь подчеркивает потребность в современных технологических решениях.

В частности, метод TF-IDF, используемый в качестве основы для построения дерева решений, представляет собой эффективный инструмент для выделения ключевых слов и понятий, что может быть ценно при обработке юридических текстов.

Дерево решений –метод машинного обучения, представляющий собой древовидную структуру, где каждый узел представляет собой вопрос или тест на определенное свойство данных, каждая ветвь соответствует возможному ответу на этот вопрос, а каждый лист дерева представляет собой прогноз или решение. Построение дерева решений на основе алгоритма TF-IDF позволяет учитывать важность слов, выделяя ключевые термины и фильтруя часто встречающиеся слова. Этот подход обеспечивает легкость работы с текстовыми данными, интерпретируемость результатов и минимальные требования к предварительной обработке, что делает его удобным для задач категоризации и тематического анализа.

В МТУСИ над разработкой новой методики применения дерева решений, основанного на методе TF-IDF для анализа естественного языка при решении задач в области гражданского права, работали: Скородумова Елена Александровна, доцент кафедры ТВиПМ, к.ф.-м.н., доцент, и Захарьева Диана, студентка МТУСИ.

mtuci 2 дек 2024 в 09:27

В России прошло международное соревнование по обнаружению голосовых дипфейков

3 мин

Блог компании МТУСИ

Заявки на участие в соревновании подали более 240 человек из России, Эфиопии, Казахстана, Вьетнама, Бразилии, Китая, Узбекистана и Индии.

Московский технический университет связи и информатики и Институт AIRI завершили хакатон SafeSpeak 2024, посвященный разработке технологий обнаружения аудио-спуфинга. Решения участников были направлены на работу с актуальными проблемами безопасной голосовой аутентификации и защиту биометрических систем от атак.

Системы автоматической верификации спикера (Automatic Speaker Verification, ASV) определяют, принадлежит ли голос в аудиозаписи заданному человеку. Они находят применение в различных областях, например, в финансовом секторе такие системы применяют для аутентификации пользователей при проведении транзакций или в смарт‑устройствах для обеспечения эксклюзивного доступа владельца к управлению оборудованием.

На сегодняшний день в обнаружении поддельного голоса используется множество методов, включая те, что основаны на предобработке сырой аудио волны, создания разных спектрограмм и применения к ним различных нейросетей.

Участники Хакатона объединялись в группы от 1 до 4 человек и самостоятельно выбирали подходы для генерации собственных решений. Основной задачей соревнования было создать модель бинарной классификации для определения того, является ли речь на записи подлинной, человеческой, или искусственно созданной. Первое место занял коллектив участников из ТГУ и МИСиС, второе – индивидуальный участник из МТУСИ, третье – индивидуальный участник из МФТИ, четвертое место досталось коллективу студентов НИЯУ МИФИ и Сколтеха, замкнули пятерку лидеров участники из НГУ. Призовой фонд составил 225 тысяч рублей.

mtuci 30 ноя 2024 в 06:07

Ученые разработали адаптивную оптическую систему коррекции волнового фронта для беспроводной квантовой связи в атмосфере

2 мин

1.1K

Блог компании МТУСИКвантовые технологии

На конференции «Енисейская фотоника-2024» был представлен доклад на основе исследований возможности увеличения эффективности квантовой связи в свободной атмосфере «Изменения уровня битовых ошибок при использовании адаптивной оптической системы для задач квантовых коммуникаций».

mtuci 11 окт 2024 в 10:38

Представлена новая ИИ-модель для борьбы с голосовым мошенничеством

Средний

3 мин

1.2K

Блог компании МТУСИ

Ученые МТУСИ и Института AIRI предложили новую модель детекции поддельных сгенерированных голосов под названием AASIST3. Представленная архитектура вошла в топ-10 лучших решений международного соревнования ASVspoof 2024 Challenge. Модель применима для противодействия голосовому мошенничеству и повышению безопасности систем, использующих голосовую аутентификацию.

Системы голосовой биометрии (ASV) помогают идентифицировать людей на основе их голосовых характеристик. Их используют для аутентификации пользователей при проведении финансовых транзакций и эксклюзивном контроле доступа в смарт-устройствах, а также в противодействии телефонному мошенничеству нового поколения.

Модели распознавания голоса могут быть уязвимы к состязательным атакам, когда определенным образом настроенное небольшое изменение входного аудио приводит к значительному изменению результатов работы модели, для человека же оно незаметно или незначительно. В поиске способов обойти преграды систем безопасности, злоумышленники научились генерировать синтетический голос с помощью преобразования текста в речь (text-to-speech, TTS) и преобразования голоса (voice conversion, VC). Для эффективного противодействия таким атакам необходимо внедрение систем защиты от подмены голоса.

ИИ-модель AASIST для анализа аудио ряда была продемонстрирована коллективом ученых из Южной Кореи и Франции в 2021 году и показала высокую надежность, подтвержденную многочисленными исследованиями. В то же время, с бурным развитием генеративного ИИ после 2022 года ей перестало хватать качественного функционала для обнаружения синтетических голосов. Использовав AASIST в качестве базы, команда НИО «Интеллектуальные решения» МТУСИ и команда «Доверенные и безопасные интеллектуальные системы» AIRI при участии аспиранта Сколтеха сформировала новую архитектуру для выявления поддельных синтезированных голосов.