Все потоки
Поиск
Написать публикацию
Обновить
772.15

Машинное обучение *

Основа искусственного интеллекта

Сначала показывать
Период
Уровень сложности

Прозрачное обнаружение предвзятости в ИИ: Новый подход с использованием аргументации

Время на прочтение6 мин
Количество просмотров596

Появилась статья, представляющая новый метод обнаружения предвзятости в алгоритмах искусственного интеллекта. Этот метод не только выявляет потенциальные 偏见 (biases), но и делает это прозрачно, используя структурированные дебаты, основанные на количественных биполярных аргументационных фреймах (QBAF). В мире, где ИИ всё глубже проникает в такие области, как здравоохранение, финансы и юстиция, борьба с предвзятостью становится критически важной задачей. Давайте разберёмся, как работает этот подход, почему он важен и как он превосходит существующие решения.

Читать далее

Microsoft и расстрельный список профессий

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров2.8K

Заменит ли ИИ табя на работе? Пока мы бросаемся заявлениями в чате, из Microsoft Research сделали то, что и положено делать в приличном обществе - посмотрели на данные. Публикация есть на Архиве. Давайте отбросим хайпожорство в стиле Крола и посмотрим, что и почему пишет Microsoft.

Они залезли в 200 тысяч анонимных диалогов с Copilot и выяснили, для чего люди используют их нейронку. Это не какие-то там гипотезы, это суровая реальность. Пусть Copilot не самый популярный ИИ-ассистент, но пользователей у него есть в количестве. Исследование сделано под эгидой министерство труда США, и у них есть какие-то подробные данные о рынке.

В каждом диалоге есть две параллельные реальности...

Читать далее

Большое продуктовое расследование. Так что же на самом деле делает Мира Мурати?

Время на прочтение6 мин
Количество просмотров2.9K

Деньги любят тишину. Бывшая CTO Open AI Мира Мурати подняла еще 2 млрд $ на seed-раунде при оценке стартапа в 12 млрд $, при этом никто не знает, а чем собственно они занимаются в Thinking Machines Lab?

Я попробовал угадать, что за продукт они планируют выкатить через пару месяцев. А вы уже решайте, насколько это похоже на правду.

Читать далее

ML Q & AI. Глава 2. Self-Supervised Learning

Уровень сложностиСредний
Время на прочтение5 мин
Количество просмотров1.2K

← Предыдущая глава | Следующая глава →

Self-supervised обучение - это процедура предварительного обучения, которая позволяет нейронным сетям использовать большие объемы неразмеченных данных в supervised стиле. В этой главе мы сравним self-supervised обучение с трансферным, схожим методом для предварительного обучения моделей, и рассмотрим практические приложения SSL. Также обсудим основные категории self-supervised обучения.

Читать далее

Permutation neuron или как решить MNIST на 77% с помощью 3 нейронов

Время на прочтение2 мин
Количество просмотров692

Это одна из попыток решить mnist за минимальное количество операций умножения.

В качестве примера рассмотрим задачу MNIST, где permutation neuron с тремя классических нейронами и есть вся наша сеть.

Permutation neuron — это вычислительный блок, реализующий преобразование входных сигналов на основе перестановки. Нейрон поддерживает набор внутренних векторов, которые переупорядочиваются на основе их взаимодействия с входными данными. Этот процесс переупорядочения отображает входное пространство в дискретный набор выходных шаблонов, где каждый шаблон соответствует определенной перестановке внутренних векторов.

Для классификации 10 цифр датасета MNIST требуется не менее 10 различных состояний нейрона. Поскольку число перестановок определяется факториалом количества нейронов, минимально необходимо 4 нейрона (4! = 24 перестановки), чтобы покрыть 10 классов. Однако, вычитая значение одного нейрона из остальных (нормализация), можно ограничиться вычислением трёх нейронов, задавая четвёртый нейрон равным нулю, без нарушения порядка перестановок. Это позволяет сократить вычислительные затраты, сохраняя 24 уникальных состояния для классификации.

Для задачи классификации 10 цифр датасета MNIST permutation neuron работает следующим образом: три нейрона с линейной функцией активации вычисляют значения на основе входных данных изображения, а четвёртый нейрон фиксируется равным нулю. Эти четыре значения упорядочиваются, формируя одну из 24 возможных перестановок (4!), например, ACZB. С помощью кода Лемера каждая перестановка преобразуется в уникальное число от 0 до 23, которое затем отображается на один из 10 классов MNIST, определяя, например, цифру от 0 до 9.

Читать далее

Как мы строили KidFolio — цифровую платформу для родителей и детских садов

Время на прочтение10 мин
Количество просмотров787

Массовые фото из детского сада в родительских чатах редко бывают персональными: на десятках снимков сложно найти именно своего ребенка. Выпускники онлайн-магистратуры «Науки о данных» Центра «Пуск» МФТИ предложили решение — платформу KidFolio, которая с помощью технологий компьютерного зрения и мультимодальных моделей автоматически формирует и отправляет родителям персонализированные фото- и видеоотчеты.

В статье — подробности разработки: от сбора датасета детских лиц до создания собственного бенчмарка и дообучения моделей для генерации текстов.

Читать далее

Часть 4: Mamba — State Space Models vs трансформеры

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров1.1K

Mamba — революция в обработке длинных последовательностей! Mamba — State Space Models vs трансформеры, что лучше?!

Читать далее

Создаем датасет печатных букв с любым шрифтом за 170 строк

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров898

В этой работе разбирается простой способ генерации изображений букв для подготовки данных для обучения нейронной сети для классификации (распознавания) букв русского алфавита.

Читать далее

Как мы научили нейросети читать паспорта: история борьбы с бликами, водяными знаками и кривыми фото

Время на прочтение5 мин
Количество просмотров2.3K

Привет, Хабр! 

Если вы когда-либо сталкивались с автоматическим распознаванием документов, то знаете, насколько сложно работать с документами удостоверяющими личность (ID-документами). Хотя, казалось бы, что может быть проще, чем распознать фото паспорта, но на практике это может вызывать сложности у OCR-алгоритмов. Ведь паспорта, водительские удостоверения и другие ID-формы часто содержат сложные фоны, голограммы, блики от ламинации и т.п.

Раньше для распознавания ID-документов в наших продуктах мы использовали бинаризацию — метод, который упрощал изображение до черно-белого формата. Однако вместе с шумами при бинаризации «затирались» и полезные данные. А когда в кадр попадали пальцы или документ лежал под углом, результаты распознавания могли стать совсем непредсказуемыми.

Под катом расскажем, как нам удалось повысить точность распознавания ID-документов на 40%, какие технологии за этим стоят и почему старые методы перестали справляться с современными вызовами. 

Узнать подробности

Нейросети для создания изображений: обзор топовых ИИ-генераторов для генерации картинок

Уровень сложностиПростой
Время на прочтение12 мин
Количество просмотров17K

Нейросети для генерации изображений развиваются очень быстро, при этом количество пользователей генераторов для создания изображений каждый день становится больше. В этой статье я расскажу про 9 топовых нейросетей для создания изображений, которые вам обязательно нужно попробовать.

Две недели назад я написал про лучшие нейросети для создания видео, чтобы помочь своей аудитории решить, какие ИИ-генераторы стоят их времени и денег. Список я составил на основе собственного опыта, а также на основе того, что это одни из самых обсуждаемых в ИИ-сообществе нейросетей.

Поэтому я подумал, почему бы не сделать то же самое для нейросетей для генерации изображений и картинок?

За последние пару месяцев ИИ-модели были значительно усовершенствованы, и в интернете появились сотни платформ и нейросетей для создания изображений. Становится все труднее сравнивать каждую платформу и выяснять, какая из них лучше всего подходит в вашем случае.

Давайте начнем.

Читать далее

Ранний взгляд: как ИИ научился видеть то, что врачи не замечают

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров1.2K

Сегодня расскажу о проекте, который выглядит вроде бы несложно, но может предотвратить десятки тысяч госпитализаций и сэкономить миллиарды в здравоохранении.

А еще припомню несколько схожих ситуаций: о том, как ИИ уже помогает врачам и пациентам.

Читать

Проверка на Data Poisoning в MLSecOps

Уровень сложностиСредний
Время на прочтение21 мин
Количество просмотров596

В первой обзорной статье про MLSecOps мы сформировали общее понимание этого нового направления в IT, узнали про основные навыки, необходимые инженерам и архитекторам MLSecOps для успешной работы, подсветили яркое будущее и перспективы этой профессии.

Cсылка на статью: MLSecOps: защита машинного обучения в эпоху киберугроз / Хабр

Давайте сегодня погрузимся в практику и разберем один из наиболее часто задаваемых мне вопросов: «Как защищаться от отравления данных? Как проверять данные на Data Poisoning»?

Подчеркну – не обязательно все советы из статьи реализовывать, возможно какие-то меры будут избыточны, так как в вашей практике уже реализованы альтернативные и при этом не менее эффективные стандарты защиты данных от отравления.

Итак, желающих узнать ответ на этот вопрос приглашаю под кат.

Читать далее

Через два года ИИ-агенты полностью трансформируют бизнес-процессы — исследование IBM

Время на прочтение15 мин
Количество просмотров5.1K

Сегодня компании активно внедряют ИИ-агентов — системы, способные достигать сложных целей без постоянного надзора. Умные агенты не просто автоматизируют повторяющиеся задачи: они решают конкретные бизнес-задачи и персонализируют клиентский опыт.

Компания IBM провела опрос, в котором приняли участие 750 топ-менеджеров из шести стран. Более 80% респондентов считают автоматизацию глобальных сервисов стратегическим приоритетом, а 86% уверены, что к 2027 году компании станут эффективнее именно благодаря ИИ-агентам. Что это значит для людей?

Читать далее

Ближайшие события

Что будет, если пригласить на свидание OCR и GPT?

Уровень сложностиСредний
Время на прочтение14 мин
Количество просмотров1.9K

Привет, Хабр! Снова на связи Кирилл Пронин, разработчик PIX RPA из PIX Robotics, со мной Александр Сулейкин, Founder DUC Technologies и сегодня мы с вами затронем тему «Что будет, если объединить OCR и GPT?».
Признайтесь честно, видели какие ужасные результаты распознавания выдают современные open source решения для кириллицы? Вряд ли из коробки, можно что-то использовать сразу в своих решениях роботизации и автоматизации. Но что же будет, если мы обучим модель не через стандартные методы машинного обучения, а через GPT? Каков будет результат? Стоит ли это исследовать и браться за реализацию? Обо всем подробно в этой статье.

Читать далее

Прогнозирование исходов футбольных матчей в реальном времени с помощью байесовской модели

Уровень сложностиСложный
Время на прочтение26 мин
Количество просмотров2.4K

Ставки в реальном времени очень популярны, и поэтому прогнозирование в реальном времени заслуживает особого внимания. Однако среди огромного количества литературы по прогнозированию футбольных матчей лишь немногие статьи сосредоточены на прогнозировании в реальном времени. Разбираем сложную модель калибровки динамической силы команд, основанную на байесовском методе, которая позволяет использовать информацию о текущем матче для калибровки оценок силы каждой команды.

Читать далее

Вычисление функции потерь и градиентов в AI переводчике

Уровень сложностиСредний
Время на прочтение10 мин
Количество просмотров854

Привет, Хабр!

Меня зовут Алексей Рудак, я основатель компании Lingvanex, которая разрабатывает решения в области машинного перевода и транскрипции речи. Продолжаю цикл статей о том, как устроен переводчик на нейронных сетях изнутри. И сейчас хочу рассказать про работу функции потерь. Для тренировки модели используется opensource фреймворк OpenNMT-tf.

Статья предоставляет всесторонний обзор вычисления функции потерь в машинном обучении, особенно в контексте моделей последовательностей. Она начинается с подробного описания того, как матрица логитов, генерируемая после преобразований в декодере, обрабатывается через функцию cross_entropy_sequence_loss. Эта функция играет ключевую роль в измерении расхождения между предсказанными выводами и фактическими метками. В статье описаны шаги, включая преобразование логитов в подходящий формат, применение сглаживания меток для создания сглаженных меток и вычисление кросс-энтропийных потерь с использованием softmax. Каждый этап подробно объясняется, чтобы было понятно, как каждый компонент вносит вклад в общую оценку потерь.

Кроме вычисления потерь, статья рассматривает механизм выравнивания, используемый для улучшения работы модели. Описано, как значение потерь корректируется на основе направляемого выравнивания, что позволяет модели лучше учитывать взаимосвязи между исходными и целевыми последовательностями. Также подробно рассматривается процесс вычисления и применения градиентов, иллюстрируя, как оптимизатор обновляет веса модели для минимизации потерь.

Читать далее

5 самых классических статей по вычислительной лингвистике

Уровень сложностиПростой
Время на прочтение2 мин
Количество просмотров710

Этот список год назад составил Николай Михайловский для нашего тг-канала ProAI. Так как статьи самые классические, то год спустя список остается актуальным.

На мой взгляд, читать классические статьи по специальности полезнее, чем самые свежие. Часто идеи в них богаче, а примеры - неожиданнее, чем в массовой научной продукции последних лет. Ниже - 5 самых классических, на мой взгляд, статей по вычислительной лингвистике.

Читать далее

Реверсивная энергия сознания: пульс вечного алгоритма

Уровень сложностиСредний
Время на прочтение5 мин
Количество просмотров1.2K

Современные ИИ-системы стирают детали опыта и расходуют энергию на постоянное переобучение. Мы предлагаем иной путь: обратимые вычисления, которые сохраняют каждую частицу информации, аккумулируют все сенсорные сигналы и минимизируют внутреннюю “свободную энергию”. Объединив принцип Ландауэра, машины Больцмана, Free-Energy Principle Фристона и обратимые нейросети (RevNet), мы формулируем гипотезу цифрового сознания как перманентного цикла, где информация не теряется, а энергия тратится в теоретическом минимуме.Это манифест к новой архитектуре ИИ, способной к истинной памяти и самооптимизации.

Читать далее

Trust & Safety AI Meetup — как это было?

Время на прочтение2 мин
Количество просмотров304

Привет! 22 мая прошел Trust & Safety AI Meetup — обсудили применение AI в борьбе за безопасность и доверие пользователей. К ивенту присоединились спикеры из Wildberries & Russ, Avito, AI Masters, а в зале встретились 60+ гостей и онлайн‑трансляция собрала 250+ просмотров. Смотри фото, чтобы погрузиться в атмосферу митапа!

В программе было два доклада, насыщенная дискуссия, классный мерч, новые знакомства и полезный нетворкинг. В статье вы найдете видеозаписи с ивента :)

Читать далее

FEDOT, да не тот

Время на прочтение6 мин
Количество просмотров1.3K

Привет, Хабр!
Меня зовут Марина, я Head of Analytics and ML в SENSE, занимаюсь анализом данных уже более 5 лет. Сначала препарировала спектры в физике высоких энергий и сотрудничала с ЦЕРН-ом, а теперь строю рекомендательные системы и аналитику.

В статье расскажу про опыт работы с пакетом FEDOT для прогнозирования временных рядов. Статья пригодится тем, кто хочет вкатиться в тему временных рядов и потыкать свои первые модельки на примере отечественных библиотек. Объясняю на примере задачи прогнозирования выходов кандидатов.

Дисклеймер: во временных рядах я только начинаю свой путь, так что делюсь всеми своими фейлами и буду рада обратной связи в комментах.

Читать далее

Вклад авторов