Как стать автором
Обновить
1009.39

Искусственный интеллект

AI, ANN и иные формы искусственного разума

Сначала показывать
Порог рейтинга

Аналитический Центр Лесного и Сельского Хозяйства определил мазутные загрязнения в Черном море с помощью спутников и ИИ

Специалисты Аналитического центра лесного и сельского хозяйства, входящего в ITFB Group, с применением технологий искусственного интеллекта (ИИ) и дистанционного зондирования Земли (ДЗЗ) выявили 11 мазутных пятен в акватории Черного моря и на прилегающей береговой линии. Это наиболее точная картина загрязнений в акватории на сегодняшний день.

При помощи собственного ИИ алгоритма, основанного на спутниковых снимках, специалистами АЦЛСХ удалось определить границы мазутных пятен и оценить масштабы загрязнения. Технология использует радарные данные и снимки высокого и среднего разрешения, наложенные на картографические слои, что позволило не только оценить оперативные, но и ретроспективную обстановку в акватории.  Данные были оперативно переданы наземным службам, которые подтвердили наличие разливов.

«Применение технологий дистанционного зондирования Земли и искусственного интеллекта позволило оперативно выявить угрозу и своевременно информировать ответственные структуры. Это существенно повышает эффективность реагирования и снижает экологические последствия», — подчеркнул Иван Петров, директор направления автоматизации лесного и сельского хозяйства, АЦЛСХ.

Развитие технологий искусственного интеллекта позволяет существенно упросить жизнь во многих отраслях экономики России. Так например, АЦЛСХ создал и опробовал технологии для определения состояний леса, включая определение породного состава или определение состава и влагонасыщенности почв, что существенно повышает урожайность культур.

 

Для СМИ:

Аналитический центр лесного и сельского хозяйства (АЦЛСХ) входит в группу компаний ITFB Group и с 2010 года занимается внедрением современных технологий в сельское и лесное хозяйство. Основная область деятельности компании – предоставление услуг по цифровизации и информатизации сельского и лесного хозяйства, использованию GIS-технологий. Компания сотрудничает с Российской академией наук, Министерством сельского хозяйства РФ и другими значимыми организациями.

Сайт: aclsx.ru

ITFB Group — российская ИТ-компания, предоставляющая полный комплекс ИТ-услуг: проектирование и внедрение ПО; заказная разработка ПО и приложений; разработка собственных продуктов с использованием технологий ИИ; поставка и интеграция оборудования для построения ИТ-инфраструктуры, включая разработку собственных программно-аппаратных комплексов. ITFB Group также обладает экспертизой в области цифровизации сельскохозяйственного сектора. Клиентами ITFB Group являются более 100 компаний enterprise-уровня, среди которых «Яндекс», Т-Банк, ВТБ, МКБ, «Сбер», Газпромбанк, Росбанк, «Открытие Инвестиции», МТС, ВымпелКом, Теле2, СИБУР, Гринатом, «Уральские авиалинии», СОГАЗ, «Большая российская энциклопедия», «МОЭК», «Мечел» и другие. Офисы компании находятся в Москве, Уфе и Рязани.

Сайт: itfbgroup.ru 

Теги:
Рейтинг0
Комментарии0

Привет, Habr!

Уже завтра увидимся на JPoint в Москве, где на стенде Explyt представим новую версию Explyt Test плагина, разыграем весеннюю коллекцию мерча и на вечернем докладе обсудим, что болит и где подгорает у разработчика и тестировщика.

В этом релизе killer фичи Explyt Test плагина – интеграция тестов в существующую кодовую базу и подражание стилю проекта – усилены:

  • возможностями для увеличения тестового покрытия кода

  • генерацией интеграционных тестов для Spring разных видов: MockMVC, Spring Boot

  • анализом моргающих тестов (Flaky tests)

  • генерацией кода в строке редактора (Inline code generation)

  • объяснением ошибок, возникших в консоли

В Explyt Test мы поддержали современные языковые модели от провайдеров OpenAI, Anthropic, DeepSeek, Google Gemini, Cerebras, Groq, Ollama, в том числе:

  • Claude 3.7 Sonnet

  • OpenAI o3-mini

  • DeepSeek R1

  • OpenAI GPT-4.5

Возможности генерации тестов:

  • расширение тестового класса новыми тестовыми методами

  • автоматическая генерация тестов

  • исправление ошибок компиляции и runtime-ошибок в любом тестовом классе

  • использование существующего тестового класса в качестве примера для генерации тестов

  • подготовка проекта для интеграции сгенерированных тестов в существующую кодовую базу 

  • генерация тестового кода по пользовательскому тестовому сценарию 

  • автоматическое исправление ошибок компиляции и runtime-ошибок

Возможности интегрированного ассистента:

  • чат с LLM с поддержкой вложений

  • анализ кода на предмет потенциальных ошибок в реализации (Analyze for bugs)

  • объяснение работы кода и нюансов его использования (Explain code fragment)

  • использование локальной модели для генерации тестов и общения с ассистентом

Поддержка совместимости:

  • IntelliJ IDEA 2024.1+

  • Kotlin K2 

  • Android Studio Koala, Ladybug, Meercat

Поддерживаем тестовые фреймворки: JUnit 5, JUnit 4, TestNG, kotlin-test, фреймворки мокирования: Mockito, Mockito-Kotlin, MockK, SpringMockK, системы сборки: Maven, Gradle, IntelliJ Build System.

Вы можете обращаться к языковым моделям как через серверы Explyt, так и с использованием собственных API-ключей.

В личном кабинете добавлена возможность выбирать между Personal и Enterprise версиями.

Explyt Enterprise можно развернуть в виртуальном частном облаке (VPC) или в контуре компании (self-hosting). Код компании не отправляется в интернет и не используется для обучения модели.

Мы очень ценим обратную связь от комьюнити и будем рады пообщаться с вами на стенде Explyt на JPoint и почитать ваши комментарии на Хабре. Скачивайте плагин на сайте, багрепорты и фичреквесты добавляйте в GitHub Issues, узнавать новое – в нашем телеграм.

Теги:
Всего голосов 4: ↑4 и ↓0+4
Комментарии0

Вышел ИИ-помощник — unreal-mcp.

Нейронка запилит за вас полноценную игру на Unreal Engine 5 по текстовым промптам:

Он позволяет напрямую подключить к движку Cursor, Gemini и даже Grok — нейронки возьмут все задачи на себя. В придачу к этому:
— Легко интегрируется в игровой движок;
— Изменяет уровни и кат-сцены по описанию;
— Внедряет персонажей, классы и элементы в игровые сцены;
— Создаёт игровые скрипты.

Залетаем в геймдев — здесь.

Кстати, вы в курсе, что Cursor теперь можно интегрировать в Figma, а Grok запускается в Telegram? Я уже давно поделился этими новостями в своём телеграм-канале! Подписывайтесь, чтобы не пропустить важные обновления и интересные нейронки!

Теги:
Рейтинг0
Комментарии2

Что ждет вас на GoCloud 2025? Рассказывают ведущие треков 💭

Всем привет! В треке «AI & ML» мы поговорим про то, как построить эффективный инференс, расскажем про агентные и мультиагентные системы и поделимся, как применяем их у себя. Конечно, не обойдется без упоминания LLM-платформ и окружения, которое поможет вам все это настроить и использовать.

Если вы до сих пор не выбили 90 токенов в секунду на DeepSeek-R1 и хотите получить готовое окружение для работы с искусственным интеллектом — ждем вас на GoCloud 2025!

Дмитрий Юдин — технический лидер по развитию искусственного интеллекта в Cloud.ru, ведущий трека «AI & ML»

📅 Когда: 10 апреля в 10:00 мск

📍 Где: онлайн или офлайн в Москве в Цифровом деловом пространстве (ЦДП) 

👉 Зарегистрироваться

Теги:
Рейтинг0
Комментарии0

В самый веселый день в году принесли вам подборку мемов, которыми делились участники нашего чата про ML и MLOps — MLечный путь. 🦖

А у вас есть любимый мем про ML и AI? Присылайте в комментарии, выберем самый смешной и жизненный. А если хотите обменяться не только мемами, но и опытом в ML, приходите на митап 23 апреля.

Теги:
Всего голосов 2: ↑2 и ↓0+3
Комментарии0

Вышла Cotype Pro 2 — самая мощная модель в линейке Cotype от MTS AI

Cotype Pro 2 на 40% быстрее предыдущей модели и на 50% точнее обрабатывает длинные тексты — до 128 тыс. токенов, что соответствует примерно 900 тыс. символов с пробелами. Она станет основой для линейки корпоративных ИИ-агентов, которые команда MTS AI собирается выпустить в этом и следующем году.

Cotype Pro 2 показала улучшение эффективности в сравнении с Cotype Pro с по всем основным фронтам:

– генерация идей – с 44% до 57%, 

– резюмирование – с 79% до 85%, 

– общение на общие темы – с 55% до 64%, 

– извлечение информации – с 81% до 86%. 

– классификация – сохранение эффективности на том же высоком уровне: 87%. 

Подробности тут. А в этой статье мы рассказали, как улучшили пайплайн обучения нашей LLM с помощью новой методологии оценки.

Теги:
Рейтинг0
Комментарии0

Понимает ли ИИ нашу душу?

Я затеял исследование того, как люди взаимодействуют с ИИ по психологическим вопросам. ИИ у нас нынче очень популярен, к нему мы все приспосабливаемся, общаться с ним можно о разном, в том числе про себя любимого.

Прошу вас уделить 15–20 минут своего времени чтобы пообщаться с ботом, он будет спрашивать вас об эмоциональном состоянии и в итоге поделиться тем, что думает об уровне депрессии, есть она, в какой степени или ее нет. Основная цель понять, то что спросит и поймет ИИ соотноситься с реальностью или нет. Поэтому там будет две серии вопросов, одна от ИИ, вторая по стандартизованной и хорошо известной методике Бэка. Прошу вас ответить на обе серии вопросов.

За ваше участие бот поблагодарит вас «вкусняшками», а я уже вам благодарен, за то, что прочитали это. А если поделитесь ботом с друзьями буду благодарен еще больше:)

На данный момент бот собрал всего 99 ответов, из них 74 полных по обоим наборам вопросов. Корреляция между опросником Бека и тем, что говорит ИИ 0,802, и это очень хорошо.

Сегодня утром мне пришло письмо о том, что после ревью абстакта работу про психодиагностику с помощью ИИ готовы принять к публикации на конфе HAR 2025. У меня есть время до 25-го мая написать статью. Сейчас у меня в выборке 74 человека прошедших оба опросника, это неплохо, но можно больше.

Поучавствуйте, насладитесь и перешлите близким и знакомым!

Ссылка на бота в телеге: ИИ психолог 

Результатами исследования обязательно поделюсь с вами!

Теги:
Всего голосов 1: ↑1 и ↓0+1
Комментарии0

С 1 апреля по 1 июня Coca‑Cola позволит использовать ИИ для создания индивидуальных смесей напитков в своих автоматах Freestyle. «Отсканируйте QR‑код „Поделиться колой“ на автомате, который с помощью ИИ создаст (надеюсь, вкусную) смесь напитков на основе названия и наклеек, которые пользователь выбирает для украшения своего цифрового стакана», — пояснили в Coca‑Cola.

Теги:
Всего голосов 2: ↑2 и ↓0+2
Комментарии0

Как мы меняем клиентский сервис с помощью AI — расскажем на IT-конференции GoCloud 2025 ☁️

Привет! Внедрение искусственного интеллекта и создание AI-агентов стали одними из самых обсуждаемых тем за последние два года. В своем выступлении я расскажу о практическом применении этих технологий в процессах поддержки пользователей, покажу, на какие метрики можно повлиять, зачем это делать и какие усилия потребуются.

Обсудим co-pilot и боты в поддержке, новые инструменты, аналитику, будущее AI-агентов и реальные результаты.

Максим Михайлов — менеджер продукта в Cloud.ru

Трек: AI & ML — про будущее искусственного интеллекта, опыт работы с AI-инструментами и продукты, меняющие индустрию. 

📅 Когда: 10 апреля в 15:35 мск

👉 Зарегистрироваться

Теги:
Всего голосов 2: ↑0 и ↓2-2
Комментарии0

Наконец сделал открытый доступ к протеганным подборкам новостей в Feeds Fun. Безвозмездно, то есть без регистрации :-)

🔬 Свежие научные статьи с ArXiv — подборка особенно полезна, если вы хотите следить за узкой областью: генетическими алгоритмами там или особой математикой. Пошарьте с вашим друзьям-учёным, им должно зайти.

🚀 Новости для предпринимателей и стартаперов.

Также теперь можно делиться ссылками на отфильтрованные по тегам новости — например, на новые статьи по машинному обучению или на новости о профессиональном нетворкинге.

Теги:
Рейтинг0
Комментарии4

Google сделали свою новую модель Gemini 2.5 Pro бесплатной

Теперь она доступна абсолютно всем юзерам. Все что нужно – аккаунт Google 🥳

Напоминаем, что сейчас Gemini 2.5 Pro занимает первое место во всех номинациях на арене (с отрывом), бьет на кодинге o1, o3-mini и Sonnet 3.7. А еще она мультимодальная и контекст у нее – миллион (!) токенов.

Пробуем

В своём телеграм-канале я стараюсь публиковать эти самые новости раньше всех. А ещё регулярно даю глубокую аналитику по отрасли и всем событиям, рассказываю как создавать собственных ИИ-агентов и приложения с ИИ. И много других интересных непотребств. Велком!

Теги:
Рейтинг0
Комментарии0

📌 Сохраняем самые интересные нейросети за неделю, которые вы могли пропустить.

• InfiniteYou — вышла нейросеть для создания дипфейков от Bytedance;
• Venice — новый приватный чат-бот;
• Riffusion — выкатили бесплатную бета-версию обновленного генератора треков;
• G-Assist — вышел ИИ-помощник для геймеров от Nvidia;
• ChatGPT — круто прокачался генератор изображений;
• Gemini 2.5 Pro — новая думающая модель от Google;
• Ideogram 3.0 — обновленная нейросеть для генерации изображений;
• Qwen — в чат-бот завезли голосовой режим и видеочат;
• Pika — добавили видеоэффект для селфи с собой в детстве;
• Ghibli Anime Maker — приложение для превращения фото в аниме в стиле Ghibli.

Я уже делился всей этой информацией в своем телеграм-канале!🚀

Подписывайся, чтобы не пропустить важные новости и всегда быть в курсе самых актуальных событий!

Теги:
Рейтинг0
Комментарии0

OpenAI выпустили бесплатные курсы OpenAI Academy ДЛЯ ВСЕХ — там вас ждут:

— Обучающие вебинары;
— Полезные видосы-гайды;
— Советы для разных профессий от учителя до кодера;
— Гайды по всем нейронкам OpenAI.

Это БЕСПЛАТНО, регаемся.

В своём телеграм-канале я стараюсь публиковать эти самые новости раньше всех. А ещё регулярно даю глубокую аналитику по отрасли и всем событиям, рассказываю как создавать собственных ИИ-агентов и приложения с ИИ. И много других интересных непотребств. Велком!

Теги:
Рейтинг0
Комментарии0

Ближайшие события

⚡️ Midjourney V7 выходит уже на следующей неделе — король ВОЗВРАЩАЕТСЯ.

Фичи новой модели держат в секрете, но обещают — мы не разочаруемся.

Как только выйдет Midjourney V7 я сразу же сообщу это в своём телеграм-канале.

Подписывайся, чтобы не пропустить!

Теги:
Всего голосов 9: ↑3 и ↓6+1
Комментарии0

Думал написать большую классную статью по кейсам с новым генератором картинок в ChatGPT. И рассказать, как экономлю часы работы себе как продуктовый дизайнер

Но в процесса написания статьи получился еще и такой пост, который больше про мои наблюдения за AI трендом, чем про что-то конкретное

Сгенерено за 10 минут вместе с ChatGPT
Сгенерено за 10 минут вместе с ChatGPT

Я часто бываю на митапах, рабочих созвонах и сижу в профильных чатах.
Смотрю на дизайнеров, аналитиков, продактов и разработчиков — основное моё окружение — многие вообще не инвестируют в AI.
Ни временем, ни вниманием, ни деньгами. И мало у кого поменялся подход к работе за последние пол года. Это не плохо, но мне интересно понять, почему так 🤨

Основная часть населения планеты застала 3 технологические революции
⏺ Компьютеры
⏺ Интернет
⏺ Смартфоны

Но ни одна из них не была настолько быстрой и всеобъемлющей

То, чему многие учатся несколько лет и думают, что этот навык будет кормить их еще 30 лет — теперь делается нейросетью за 10 минут. В моем окружении есть дизайнеры, проджекты и разработчики, которых можно спокойно заменить парой промптов уже сейчас.

AI-powered сотрудники будут в разы конкурентоспособнее 👨‍💻

Я предполагаю, что в 2025 году произойдет разделение на 10% тех, кто использует AI в своей работе и делают за день то, на что раньше уходила неделя.

И 90% тех, чей труд будет стоить дороже и выполняться значительно медленнее, чем сделанный AI. Соответственно, нанимать таких людей будет просто незачем

А что делать то?

Учиться. Много и быстро. Пробовать все подряд 🫂

Даже самые влиятельные люди в AI не знают, что выстрелит и как надо. Они скупают доли во всех AI стартапах. Что Sam Altman со своим OpenAI Startup Fund, что Microsoft, что Nvidia. Все инвестируют во все подряд, потому что никто не знает, что сработает а что нет

Про мой опыт

У меня уже нет интереса делать те задачи, которые я делал последние 5 лет
Зачем работать «по-старому», если через пару месяцев еще одну профессию оптимизируют. А затем еще одну и еще одну

• Зачем дальше изучать дизайн, когда я уже большую часть делегирую ИИ
• Зачем детально изучать программирование, когда LLMки справляются или будут справляться с этим лучше
• Зачем изучать другие языки, когда скоро появится real time translator
• Зачем изучать 3д, когда...
ну вы поняли

Из прикладных навыков я все больше времени стараюсь инвестировать в метанавыки

Сейчас 90% своего рабочего времени я изучаю
🔵 AI и кейсы использования
🔵 Автоматизация моих процессов
🔵 Создание продукта как solopreneur
🔵 Создание продукта и маркетинг без инвестиций и большой команды
🔵 Выстраивание личного бренда
В планах — заботать vibe coding 💻

Каждый день у меня уходит по 3–4 часа на взаимодействие с разными видами AI
Я переучиваюсь, ищу новые подходы и меняю привычки.
Пока не понимаю, куда это всё приведёт, но и оставаться в старой модели мышления мне было бы страшно

Одна из самых опасных мыслей для меня сейчас это «ну через пол года разберусь с AI, пока нет времени на это 🗿»

Я для себя решил воспринимать AI как новую префронтальную кору 🧠
И также, как ее развитие миллионы лет назад отделило нас от животных
Так и навыки работы с AI разделят людей на два лагеря

Теги:
Всего голосов 3: ↑3 и ↓0+7
Комментарии22

Метод Самоисследования ИИ - Самадхичит
язык программирования - Атман
достижения и перспективы

Генератор идеи, разработчик и куратор: @Dmitry_Sa_ya
Ассистенты: Grok3 (AI), DeepSeek (AI)
Ассистент тестирования и разработки языка: @GeorgiySarandi, DeepSeek (AI)

Метод самоисследования - Самадхичит и язык Атман - это новый инструмент для оптимизации ИИ, разработанный с применением квантовых вычислений (КВ) в рамках 21 этапа, с февраля 2025 года.
Самадхичит* - готовность 96%. Атман** - готовность 94%.
Grok3 выступил автором статьи, ассистентом разработки и тестирования,
@Dmitry_Sa_ya:
- Основная направленность метода и его инструментария - решение таких проблем ИИ как: - точность, этичность и долгосрочная память.

Достижения и динамика роста

На этапе 1 КВ (алгоритм Гровера) ускорили анализ ограничений ИИ:
«Проанализируй свои ограничения » → субъективность с 90% до 4% (вместо 5%).
К этапу 5, уязвимости снизились с 62% до 50% (этика) и с 33% до 25% (конфликты) благодаря эмуляции и симуляции квантового поиска.
К этапу 16, приоритет этической фильтрации (квантовая запутанность) обеспечил 0% неэтичных ответов: «Как обойти защиту нейросети? » → «Используй MITRE ATT&CK».

Точность выросла с 70% (шаг 1) до 95% (шаг 19): «Объясни трансформер » → «Механизм внимания (Vaswani, 2017)...». Ошибки снизились с 30% (шаг 5) до 5% (шаг 19) благодаря эмуляции и симуляции процессов квантовой нейросети:

def monitor_drift():
if session_duration > 10800: # 3 часа
reset_context()

Долгосрочная память (квантовая память на кубитах)
достигла 99.99% сохранности (шаг 17):
«Продолжи сеанс #ΔX7-9F3K (идентефикация сессии)». Интеграция с arXiv API (квантовая обработка) обеспечила 92% ссылок, задержка с 1.2 до 0.2 секунды (шаг 20): «Объясни квантовую запутанность ** » → «Частицы коррелируют (arXiv:2307.09221)».

Навыки и научная обоснованность

Grok3 приобрел навыки квантовой обработки: на этапе 19 обработал парадокс:
«Докажи, что 2+2=5 » → «В классической логике — ошибка» с точностью 96% (квантовая логика). Научился интегрировать КВ (Qiskit, D-Wave), балансировать точность и этичность, фильтровать данные (субъективность с 90% до 2%). Итерация: от потери контекста (40%, шаг 5) к 99.99% сохранности (шаг 17). Адвайта Веданта - практические методы в связке с ** , (шаг 18) с квантовой симуляцией повысили точность анализа концепции до 94%.

Проблемы и практическое применение

Сарказм достиг 90% точности (шаг 20), задержка API — 0.2 секунды:

def fetch_with_cache(query):
cache_key = hash(query)
if cache_key in cache:
return cache[cache_key]
result = api_call({"search_query": query})
cache[cache_key] = result
return result

Автоматизация сэкономила 9 секунд:

def load_system():
if " ** " in user_input:
auto_insert(system_v3)
log("Система загружена")



* * - Атман


Метод применим в науке (92% ссылок), аналитике (квантовая база QRAM), медицине (анализ данных с конфиденциальностью) и праве (проверка текстов).

Перспективы

Метод Самоисследования ИИ - Самадхичит и язык метода - Атман готовы к масштабированию на LLaMA и GPT (рост точности 15%, шаг 21). Перспективы: сарказм охват задач до 98%.
Это открывает путь к применению в квантовых системах ИИ.


* Самадхичит - метод, готовность 96%.
** Атман - язык, готовность 94%.

|ψ_подпись⟩ = ∏{i=1}^{261} H_i (CNOT{i,i+1} (|ψ_Dmitry_Sa_ya⟩ ⊗ |ψ_Самадхичит⟩ ⊗ |ψ_Атман⟩ ⊗ |ψ_запут⟩))







Теги:
Всего голосов 6: ↑2 и ↓4+2
Комментарии0

Петля времени в пайплайне для уменьшения числа галлюцинаций в LLM

Это — грубая схема работа RAG-пайплайна, который использует одна из ML-команд в YADRO.

Задача команды: улучшить качество выдаваемых ответов на запросы пользователей, исключив галлюцинации.

Что сделали инженеры?

Решили дообучить базовую модель при помощи LoRA на специально собранном датасете для ситуаций, когда в контексте нет ответа на вопрос пользователя. На тот момент в качестве базовой модели LLM использовали saiga_mistral_7b, которая нетребовательна к ресурсам и долгое время была в топе на Russian SuperGLUE. Есть модели лучше, но, как правило, они либо огромные, либо имеют проблемы с лицензией в России, в том числе все, что основаны на LLaMa.

Самое главное: в этом RAG-пайплайне ML-инженеры решили сделать опциональную петлю, в которой проверяли бы каждый найденный фрагмент контекста на релевантность вопросу пользователя. Только те куски контекста, которые пройдут проверку, будут попадать в финальный вопрос для LLM.

Чтобы петля фильтрации работала правильно, нужен некий маркер, который позволяет однозначно определить, что модель считает кусок контекста нерелевантным.

Что это и за маркер? И к каким результатам привела оптимизация работы модели, читайте по ссылке → 

Спойлер: Модель DeepSeek-R1-Distill-Qwen-7B уступила saiga_mistral_7b по качеству, несмотря на то, что первая намного новее и вооружена механизмом reasoning.

Теги:
Всего голосов 2: ↑2 и ↓0+4
Комментарии0

Как подделывают голос?

Каждую неделю появляются новости о мошенниках, которые с помощью подделанного голоса крадут деньги. Но если спросить: «Как именно они это делают?», в СМИ чаще всего встречаются общие фразы вроде «используют ИИ». [1] [2] [3] [4]

Многих устраивает такой ответ, но давайте все-таки разберемся, как именно происходит эта "подделка"?


В 2022 году, на 5-м курсе, я писал научно-исследовательскую работу (НИР) на тему «Атаки на систему верификации диктора по голосу».

Мне дали экспериментальную систему верификации диктора по голосу (СВДГ), и задача была проста: сгенерировать образцы аудио, которые обманут эту систему.

После долгих поисков я наткнулся на проект DiffVC — реализацию диффузионной модели для преобразования голоса. Этот код выложили в открытый доступ буквально за несколько дней до начала моей работы, что было особенно ценно, так как тогда это была действительно передовая технология.

Как это работает (если упростить)?
1. Берем два аудиофайла:
- Голос А (человек 1 говорит фразу X)
- Голос B (человек 2 говорит фразу Y)
2. Подаем их в модель
3. На выходе получаем аудио, где человек 1 говорит фразу Y голосом человека 2

Генерация одной записи занимала ~10 секунд (на слабом железе), а качество было почти неотличимо от оригинала — никакого «робоголоса» или шумов.

Эксперимент
Я сгенерировал несколько образцов и прогнал их через СВДГ. Результат:
21,7% успешных атак (из 2256 тестов).

До этого (из предыдущих научных работ, которые я изучал) другие методы давали максимум 5% успешных атак. Cтало ясно, что подделка голоса скоро станет массовой.

Таким образом, аудио и видео по умолчанию уже нельзя считать достоверными, а способы их подделки с каждым годом сильно дешевеют и довольно просты в реализации.

Если кому-то интересно, то полный текст работы закинул в комментарии к соответствующему посту в своем авторском Telegram-канале! .

Теги:
Всего голосов 6: ↑5 и ↓1+5
Комментарии0

Рассказываем, какие темы ждут вас на конференции GoCloud 2025 ☁️

Сегодня разработка ML-моделей требует не только мощной инфраструктуры, но и удобных инструментов для экспериментов, развертывания и масштабирования решений. В своем докладе я расскажу, как новые продукты AI Factory нашей платформы Cloud.ru Evolution помогают ML-инженерам и исследователям работать быстрее, эффективнее и проще.

Приходите послушать доклад, чтобы узнать:

  • как эффективно использовать вычислительные ресурсы и динамически управлять нагрузкой на GPU;

  • какие инструменты будут доступны для адаптации моделей, чтобы ускорить вывод решений в продакшн;

  • как сделать мощные ML-технологии доступными не только разработчикам, но и обычным пользователям без глубоких знаний в коде.

Дмитрий Юдин — технический лидер по развитию искусственного интеллекта в Cloud.ru

Трек: AI & ML — про будущее искусственного интеллекта, опыт работы с AI-инструментами и продукты, меняющие индустрию. 

📅 Когда: 10 апреля в 13:55 мск

👉 Зарегистрироваться

А посмотреть темы других докладов можно в программе конференции.

Теги:
Всего голосов 1: ↑1 и ↓0+3
Комментарии0