Как стать автором
Поиск
Написать публикацию
Обновить
1297.65

Искусственный интеллект

AI, ANN и иные формы искусственного разума

Сначала показывать
Порог рейтинга

Петля времени в пайплайне для уменьшения числа галлюцинаций в LLM

Это — грубая схема работа RAG-пайплайна, который использует одна из ML-команд в YADRO.

Задача команды: улучшить качество выдаваемых ответов на запросы пользователей, исключив галлюцинации.

Что сделали инженеры?

Решили дообучить базовую модель при помощи LoRA на специально собранном датасете для ситуаций, когда в контексте нет ответа на вопрос пользователя. На тот момент в качестве базовой модели LLM использовали saiga_mistral_7b, которая нетребовательна к ресурсам и долгое время была в топе на Russian SuperGLUE. Есть модели лучше, но, как правило, они либо огромные, либо имеют проблемы с лицензией в России, в том числе все, что основаны на LLaMa.

Самое главное: в этом RAG-пайплайне ML-инженеры решили сделать опциональную петлю, в которой проверяли бы каждый найденный фрагмент контекста на релевантность вопросу пользователя. Только те куски контекста, которые пройдут проверку, будут попадать в финальный вопрос для LLM.

Чтобы петля фильтрации работала правильно, нужен некий маркер, который позволяет однозначно определить, что модель считает кусок контекста нерелевантным.

Что это и за маркер? И к каким результатам привела оптимизация работы модели, читайте по ссылке → 

Спойлер: Модель DeepSeek-R1-Distill-Qwen-7B уступила saiga_mistral_7b по качеству, несмотря на то, что первая намного новее и вооружена механизмом reasoning.

Теги:
Всего голосов 2: ↑2 и ↓0+4
Комментарии0

Как подделывают голос?

Каждую неделю появляются новости о мошенниках, которые с помощью подделанного голоса крадут деньги. Но если спросить: «Как именно они это делают?», в СМИ чаще всего встречаются общие фразы вроде «используют ИИ». [1] [2] [3] [4]

Многих устраивает такой ответ, но давайте все-таки разберемся, как именно происходит эта "подделка"?


В 2022 году, на 5-м курсе, я писал научно-исследовательскую работу (НИР) на тему «Атаки на систему верификации диктора по голосу».

Мне дали экспериментальную систему верификации диктора по голосу (СВДГ), и задача была проста: сгенерировать образцы аудио, которые обманут эту систему.

После долгих поисков я наткнулся на проект DiffVC — реализацию диффузионной модели для преобразования голоса. Этот код выложили в открытый доступ буквально за несколько дней до начала моей работы, что было особенно ценно, так как тогда это была действительно передовая технология.

Как это работает (если упростить)?
1. Берем два аудиофайла:
- Голос А (человек 1 говорит фразу X)
- Голос B (человек 2 говорит фразу Y)
2. Подаем их в модель
3. На выходе получаем аудио, где человек 1 говорит фразу Y голосом человека 2

Генерация одной записи занимала ~10 секунд (на слабом железе), а качество было почти неотличимо от оригинала — никакого «робоголоса» или шумов.

Эксперимент
Я сгенерировал несколько образцов и прогнал их через СВДГ. Результат:
21,7% успешных атак (из 2256 тестов).

До этого (из предыдущих научных работ, которые я изучал) другие методы давали максимум 5% успешных атак. Cтало ясно, что подделка голоса скоро станет массовой.

Таким образом, аудио и видео по умолчанию уже нельзя считать достоверными, а способы их подделки с каждым годом сильно дешевеют и довольно просты в реализации.

Если кому-то интересно, то полный текст работы закинул в комментарии к соответствующему посту в своем авторском Telegram-канале! .

Теги:
Всего голосов 6: ↑5 и ↓1+5
Комментарии0

Рассказываем, какие темы ждут вас на конференции GoCloud 2025 ☁️

Сегодня разработка ML-моделей требует не только мощной инфраструктуры, но и удобных инструментов для экспериментов, развертывания и масштабирования решений. В своем докладе я расскажу, как новые продукты AI Factory нашей платформы Cloud.ru Evolution помогают ML-инженерам и исследователям работать быстрее, эффективнее и проще.

Приходите послушать доклад, чтобы узнать:

  • как эффективно использовать вычислительные ресурсы и динамически управлять нагрузкой на GPU;

  • какие инструменты будут доступны для адаптации моделей, чтобы ускорить вывод решений в продакшн;

  • как сделать мощные ML-технологии доступными не только разработчикам, но и обычным пользователям без глубоких знаний в коде.

Дмитрий Юдин — технический лидер по развитию искусственного интеллекта в Cloud.ru

Трек: AI & ML — про будущее искусственного интеллекта, опыт работы с AI-инструментами и продукты, меняющие индустрию. 

📅 Когда: 10 апреля в 13:55 мск

👉 Зарегистрироваться

А посмотреть темы других докладов можно в программе конференции.

Теги:
Всего голосов 1: ↑1 и ↓0+3
Комментарии0

Теперь у нас в Telegram поселился сам Grok — чат-бот от Илона Маска. Маск лично подтвердил запуск.

Доступен пока только Premium-подписчикам.
В своём телеграм-канале оставил ссылку на официального бота Grok!
(куча фейковых ботов появилось)

Теги:
Всего голосов 2: ↑1 и ↓1+2
Комментарии0

Когда уже прекратят представлять LLM как ИИ?

Это же просто поисковик, выдающий наиболее подходящий по статистике ответ.
Причем выдающий с примесью рандомизации().

Слова превращаются в вектор чисел, а вектор чисел - по сути то же что и изображение.
То есть задача сводится к распознаванию образа.

MNIST, классика.

Ответ всегда вектор. Выбираем N с максимальным процентом. И "бросаем кубик".

Прекратите называть LLM ИИ(Искуственным идиотом).

LLM даже до идиота далеко.

Теги:
Всего голосов 9: ↑6 и ↓3+3
Комментарии33
ChatGPT убил Midjourney, Photoshop и вообще всех
ChatGPT убил Midjourney, Photoshop и вообще всех

OpenAI только что показали ОГРОМНУЮ обнову для GPT-4o.

Всё самое интересное:

— Может редачить изображения;
— Модель научилась САМА генерировать изображения — качество лучше Midjourney, особенно текст на картинках (гляньте на коктейли);
— ChatGPT теперь может генерировать видео через Sora;
— Видосы можно генерировать даже если у вас нет подписки. Дают ~3 видео в сутки;
— Может миксовать кучу разных изображений (или отдельных объектов из них) в одну фотку!
— УДАЛЯЕТ ФОН!
— Качество в разы лучше, чем у конкурентов.

Раскатывают уже сегодня — проверяем у себя.

В своём телеграм-канале я стараюсь публиковать эти самые новости раньше всех. А ещё регулярно даю глубокую аналитику по отрасли и всем событиям, рассказываю как создавать собственных ИИ-агентов и приложения с ИИ. И много других интересных непотребств. Велком!

Теги:
Всего голосов 2: ↑1 и ↓1+2
Комментарии0

Вот чем хорош текущий ИИ: пришла мне ночью в голову "гениальная" идея: "Что, если наблюдаемая вселенная расширяется, потому что находится на краю огромной черной дыры, а не из-за темной энергии?". Моих познаний в физике не достаточно, чтобы привести аргументы или контраргументы, кроме того, что эфыект может быть похож. Но идея зудит. Раньше бы пошел это с кем то обсуждать, а тут закинул ИИ - и он сразу выдал и тех, кто ранее уже предлагал эту идею, и аргументы, почему это не так. Я так обрадовался, что написал этот пост)

Теги:
Всего голосов 4: ↑2 и ↓2+2
Комментарии0

👍 Google выпустила экспериментальную Gemini 2.5 Pro.

Новая думающая модель взлетела на 1 место в LMArena, обходя конкурентов в кодировании, математике и науке. По бенчмаркам опережает o3-mini, GPT-4.5, Claude 3.7 Sonnet и Grok 3. Контекст — до 1М токенов, в будущем завезут 2М.

Попробовать (из РФ с VPH)
Подробнее

В своём телеграм-канале я стараюсь публиковать эти самые новости раньше всех. А ещё регулярно даю глубокую аналитику по отрасли и всем событиям, рассказываю как создавать собственных ИИ-агентов и приложения с ИИ. И много других интересных непотребств. Велком!

Теги:
Всего голосов 6: ↑2 и ↓40
Комментарии0

Что такое метод дистилляции знаний? Рассказывают наши коллеги из лаборатории искусственного интеллекта. #нейрословарь

В сфере искусственного интеллекта используются разные методы оптимизации нейросетей. Среди них метод KD (knowledge distillation) часто применяется для переноса «знаний» от более сложной модели (учителя) к более простой (ученику).

Идея дистилляции знаний в том, чтобы научить упрощённую модель не только предсказывать верные классы, но и подражать поведению «учителя». Особенно это востребовано для смартфонов, интернета вещей (IoT) и граничных вычислений (edge-computing), словом — везде, где нужно «добавить нейронку» на слабое железо.

При обучении «ученика» используются как мягкие, так и жёсткие цели (one-hot метки как в обычном обучении). «Мягкие цели» содержат больше информации, чем простые метки классов. Они показывают не только какой класс правильный, но и как учитель воспринимает другие классы, какие из них считает более вероятными.

Для этого на стороне «учителя» увеличивается гиперпараметр «температура». Он смягчает распределение вероятностей классов, выдаваемое функцией softmax, в результате чего вероятности неправильных классов заметнее отличаются друг от друга.

Оба типа целей учитывает комбинированная функция потерь. Она вычисляет потерю дистилляции (разницу между предсказаниями ученика и мягкими целями учителя), а также стандартную кросс-энтропию (степень несоответствия предсказаний ученика жёсткими метками классов).

Есть три разновидности KD:

  • оффлайн — учитель обучается без взаимодействия с учеником, а затем генерирует ему мягкие цели;

  • онлайн — учитель и ученик обучаются параллельно, чтобы адаптироваться друг к другу;

  • cамодистилляция — модель учит сама себя. Одни слои сети играют роль «учителя» для других слоёв.

Модели, обученные с помощью дистилляции, обычно достигают лучшей точности и обобщающей способности, чем такие же модели, обученные только на жёстких метках классов с нуля.

Также дистилляция знаний используется для сжатия. Она позволяет создавать более компактные модели, которые занимают меньше места в памяти и работают быстрее. В частности, так создавались облегчённые версии больших языковых моделей (LLMs), включая BERT () и DeepSeek.

Теги:
Рейтинг0
Комментарии0

ITFB Group подтвердила совместимость платформы СИМФОНИЯ с операционной системой РЕД ОС 8

Платформа интеллектуального управления контентом, заявками и цифровизации бизнес-процессов СИМФОНИЯ от ITFB Group полностью совместима с отечественной операционной системой РЕД ОС 8. Это открывает организациям возможность автоматизировать широкий спектр бизнес-процессов — от документооборота до управления проектами — в полностью импортонезависимой ИТ-среде.

В рамках сотрудничества ITFB Group и РЕД СОФТ провели тестирование последних версий своих продуктов. По его результатам подтверждено, что платформа СИМФОНИЯ версии 2.0 корректно работает на РЕД ОС 8. Совместимость зафиксирована в протоколе тестирования и подтверждена двусторонним сертификатом. Компании уже подтверждали совместимость своих решений на более ранних версиях.

«Технологическое партнерство и совместимость отечественных продуктов различного класса ПО является сегодня важным условием создания надежной инфраструктуры в различных российских организациях. Платформа СИМФОНИЯ и РЕД СОФТ выпустили новые версии и в очередной раз подтвердили совместимость и корректность работы. Таким образом мы обеспечиваем российским компаниям возможность создания полностью импортонезависимого ИТ-ландшафта», — рассказывает Анастасия Литвиненко, автор и идеолог платформы СИМФОНИЯ, директор по развитию бизнеса ITFB Group.

«Инструментарий для автоматизации бизнес-процессов — важный и частый запрос, поступающий от пользователей. Продукты, разрабатываемые нашей компанией, помогают решать данную задачу на различных уровнях ИТ-инфраструктуры. В том числе, мы постоянно расширяем каталог совместимых решений качественными разработками технологических партнеров. Благодарим команду ITFB Group за плодотворное сотрудничество — доступность платформы СИМФОНИЯ на базе РЕД ОС 8 станет хорошей новостью для многих пользователей нашей операционной системы», — комментирует Рустам Рустамов, заместитель генерального директора РЕД СОФТ.

Теги:
Рейтинг0
Комментарии0

Как искусственный интеллект делает СЭД умными?

Системы электронного документооборота (СЭД) уже давно помогают бизнесу автоматизировать работу с документами, но с внедрением ИИ они становятся по-настоящему «умными». В статье «Грани искусственного интеллекта: как СЭД становится умной» Анастасия Литвиненко, директор по развитию бизнеса департамента стратегических проектов и разработки ITFB Group, рассказывает о ключевых трендах и возможностях интеллектуальных СЭД.

Почему СЭД — это будущее?

  • Сокращение бумажного документооборота на 30%

  • 93% компаний уже взаимодействуют с налоговыми органами в электронном виде

  • Рынок СЭД растет на 20–30% ежегодно

Уникальные возможности СИМФОНИИ:

Автоматическая обработка

  • Распознавание любых документов (даже фото и сканов) с помощью встроенного OCR EasyDoc

  • Автозаполнение шаблонов (например, трудовых договоров)

  • Мгновенная классификация входящих файлов

Искусственный интеллект в действии

  • Интеллектуальный поиск по смыслу, а не только по ключевым словам

  • Рекомендации по распределению задач между сотрудниками

  • Анализ процессов и выявление узких мест

Автоматизация процессов

  • Чат-боты для поддержки и обучения сотрудников

  • Интеграция с CRM/ERP-системами

  • Автоматический мониторинг безопасности и защита от угроз

Результат для бизнеса:

Сокращение затрат на 80%
Повышение точности обработки данных
Гибкость под любые изменения

Итог: Внедрение ИИ в СЭД — это не просто автоматизация, а снижение затрат, повышение точности и гибкости бизнес-процессов.

Читайте полную статью, чтобы узнать, как «умные» СЭД меняют подход к работе с документами!

Теги:
Всего голосов 3: ↑1 и ↓2+1
Комментарии0

🔥 Вышел новый приватный чат-бот.

Venice защищает ваши данные и хранит информацию только в браузере. Под капотом топовые модели с открытым исходным кодом: FLUX Custom, Stable Diffusion 3.5 Large, Qwen 2.5 VL 72B, DeepSeek R1 671B, Llama 3.1 405B.

Генерирует картинки, текст, код и анализирует документы.

Работает без регистрации, в день дают 25 бесплатных текстовых запросов и 15 генераций изображений.

Попробовать

В своём телеграм-канале я стараюсь публиковать эти самые новости раньше всех. А ещё регулярно даю глубокую аналитику по отрасли и всем событиям, рассказываю как создавать собственных ИИ-агентов и приложения с ИИ. И много других интересных непотребств. Велком!

Теги:
Всего голосов 3: ↑2 и ↓1+2
Комментарии1

Ближайшие события

GhatGPT убедил австралийца, что ему не нужна виза для поездки в Чили. Но она оказалась необходима — человек узнал об этом в аэропорту перед вылетом.

Марк Поллард занимается стратегическим менеджментом, пишет книги на эту тему и проводит мастер-классы. С начала марта житель Австралии посещает страны Латинской Америки, в которых проводит лекции о правильной разработке стратегий для брендов.

23 марта Поллард собирался вылететь в Сантьяго — столицу Чили, где на следующий день должен был провести лекцию. Но попасть в страну он не смог. В аэропорту Мехико (в Мексике прошла его последняя лекция) Поллард узнал, что для посещения Чили нужна виза — её нужно заранее оформлять через сайт посольства, это может занять до 20 дней. Специалист утверждает, что был уверен, что попасть в страну можно было без нее, потому что об этом ему ранее сообщил ChatGPT. Оказалось, что чат-бот выдает ошибочный ответ всем пользователям — ИИ сообщает, что граждане Австралии могут находиться в Чили без визы до 90 дней. Когда-то эта схема в самом деле работала, но с конца 2019 года для австралийцев ввели визы. В итоге Поллард остался в Мехико еще на несколько дней перед вылетом в Аргентину.

Теги:
Всего голосов 4: ↑4 и ↓0+6
Комментарии6

Какие доклады посетить на конференции GoCloud 2025? ☁️

Привет! Я покажу, как быстро и удобно развернуть любую LLM-модель в нашем новом ML-сервисе. А еще поделюсь, как наша новая технология Shared GPU позволяет сэкономить на аренде ресурсов, и расскажу, как мы трансформировали инференс с учетом зрелости компании в AI-технологиях.

Артемий Мазаев, менеджер продукта в Cloud.ru

Трек: AI & ML — про будущее искусственного интеллекта, опыт работы с AI-инструментами и продукты, меняющие индустрию. 

📅 Когда: 10 апреля в 12:20 мск

👉 Зарегистрироваться

Что еще интересного будет на GoCloud, смотрите в программе конференции.

Теги:
Рейтинг0
Комментарии0

⚡️ Самый мощный ИИ-агент Owl ВЫШЕЛ — это бесплатный аналог суперхайпового Manus, доступный абсолютно ВСЕМ!

— Даём агенту ЛЮБУЮ задачу и идём пить кофе;
— Может рулить браузером, заполнять таблички в Excel или выполнять код;
— Уничтожает рутину: может анализировать рынок акций, бронировать столики или вести аккаунты в соцсетях;
— Вы САМИ выбираете нужную модель: старичка ChatGPT или нашумевших китайцев DeepSeek;
— Понятный интерфейс — разберётся даже ребёнок;
— БЕСПЛАТНО.

Забираем вторую пару рук — здесь

В своём телеграм-канале я стараюсь публиковать эти самые новости раньше всех. А ещё регулярно даю глубокую аналитику по отрасли и всем событиям, рассказываю как создавать собственных ИИ-агентов и приложения с ИИ. И много других интересных непотребств. Велком!

Теги:
Всего голосов 2: ↑1 и ↓1+2
Комментарии0

Представлен список из 20 самых популярных стартапов 2024 года с открытым исходным кодом по всему миру с точки зрения количества «звёзд» GitHub в проектах и их прироста. Оказалось, что более половины из них (11 из 20) тесно связаны с ИИ.

Теги:
Всего голосов 3: ↑3 и ↓0+4
Комментарии1

Visual Capitalist показала динамику количества вакансий в разработке ПО в США за период с 1 февраля 2020 года до 1 марта 2025 года. За основу взяты данные ФРС США.

Согласно графику, спрос на разработчиков ПО снизился с началом пандемии, но потом резко взлетел в 2021–2022 годах. Стартапы купались в инвестициях, а компании брали всех без разбора, чтобы уже через год-два на фоне постковидной коррекции и макроэкономических проблем тысячами увольнять и замораживать наём. Тот всплеск стал одним из крупнейших в истории и кардинально изменил рынок вакансий в софтверной разработке, сделав осторожнее и соискателей, и компании, которые стали более стратегически подходить к масштабированию штата.

По факту ворваться в ИТ в 2025 году гораздо сложнее, чем раньше: интенсивность найма сейчас минимальная за последние пять лет — более чем на 33% ниже, чем в 2020 году. Помимо этого, на число вакансий влияет распространение ИИ-инструментов для написания кода, которые повышают продуктивность программистов. Компании тоже больше сосредоточены на повышении эффективности, а не на расширении.

Теги:
Рейтинг0
Комментарии0

Создаём РАБОЧИЕ сайты БЕСПЛАТНО и за пять минут — нашли для вас клёвую нейронку Lovable

Работает гигапросто: описываем словами наш будущий сайт и получаем его в точности до мелочей! Если что-то пошло не так — можно отправить нейросеть вносить правки.
Работает гигапросто: описываем словами наш будущий сайт и получаем его в точности до мелочей! Если что-то пошло не так — можно отправить нейросеть вносить правки.

Каждый день отсыпают новые кредиты, при этом хостинг БЕСПЛАТНЫЙ — можно играть вдоволь.

Мы уже говорили, что это бесплатно? 😁 Забираем Lovable

В своём телеграм-канале я публикую эти самые новости раньше всех. А ещё регулярно даю глубокую аналитику по отрасли и всем событиям, рассказываю как создавать собственных ИИ-агентов и приложения с ИИ. И много других интересных непотребств. Велком!

Теги:
Всего голосов 5: ↑0 и ↓5-5
Комментарии1

Я тут понял чего мне не хватает для эффективной литературной деятельности в "соавторстве" с LLM. Древовидных AI-чатов. Сейчас все известные мне чаты - линейные, т.е. представляют собой линейный список. Да, я могу вернуться к любому своему вопросу в истории общения и отредактировать его, задав по новой - но при этом все вопросы и ответы, которые были после пропадут из контекста и из чата. А что если бы была возможность ответвляться от любого вопроса в истории с сохранением предыдущих линий общения, и произвольно переключаться между ветвями? И контекст бы строился как путь от текущего листа дерева до корня?

Теги:
Всего голосов 12: ↑12 и ↓0+17
Комментарии7