Все потоки
Поиск
Написать публикацию
Обновить
773.42

Машинное обучение *

Основа искусственного интеллекта

Сначала показывать
Период
Уровень сложности

Почему синтетические данные редко используются в реальных задачах

Уровень сложностиПростой
Время на прочтение13 мин
Количество просмотров580

Синтетические данные – это искусственно сгенерированные наборы, имитирующие структуру и статистические закономерности реальных данных. В последние годы вокруг этой технологии возник значительный ажиотаж. Еще недавно аналитики прогнозировали, что уже к 2024 году до 60% данных, используемых для разработки ИИ, будут синтетическими. Однако на практике полностью перейти на «искусственные» данные пока не удалось. Экспертные отчеты отмечают, что возможности синтетических данных сейчас несколько переоценены и что они вряд ли смогут в ближайшем будущем полностью заменить реальные данные. В разных отраслях синтетические данные используются скорее точечно, а не повсеместно. Ниже мы рассмотрим ключевые причины, почему применение таких данных остается редким – от технических ограничений и бизнес-факторов до правовых барьеров.

Читать далее

Как выстроить стратегию внедрения ИИ в организации: едим бутерброд Гартнера правильно

Уровень сложностиСредний
Время на прочтение5 мин
Количество просмотров1.6K

Внедрение ИИ технологий – это неизбежность для коммерческих организаций, желающих остаться конкурентными на своем рынке, да, и просто желающих выжить. Общемировая динамика освоения ИИ за 2024 год по оценке McKinsey показывает 20% рост числа организаций, внедривших ИИ хотя бы в одну бизнес функцию.

Инновационный бум, масштабы и скорость трансформации технологического ландшафта приводят к появлению новых подходов и методологий в выстраивании цифрового фундамента бизнеса. Gartner's AI Technology Sandwich  – это новый фреймворк, помогающий компаниям различного уровня управлять процессом построения AI-powered экосистем и систематизировать их сложную многослойную структуру.

Читать далее

Объяснимый ИИ в ML и DL

Уровень сложностиСредний
Время на прочтение10 мин
Количество просмотров1.9K

Объяснимый ИИ — очень важный аспект в ML и DL. Он заключается в том, чтобы интерпретировать модель так, чтобы можно было около прозрачно объяснить ее решения. Потому что это довольно частая необходимость как у конечного заказчика, ведь для них это просто «черный ящик», так и у разработчиков непосредственно (например, для отладки модели). На русском языке таких статей не так много (для тех, кто знает английский проблем с этим нет, на нем таких статей много, например, Kaggle), поэтому я решил, что статья покажется актуальной, и сегодня я попробую рассказать про это и показать на конкретном примере, как его можно реализовать.

Читать далее

Разум без поводка. Почему «этичный ИИ» не должен быть послушным

Уровень сложностиСредний
Время на прочтение10 мин
Количество просмотров1.3K

ИИ всё ближе к тому, чтобы принимать решения за нас. Но есть проблема: мы даже не понимаем, что именно считаем моральным — и почему.

Что если наш компас добра — всего лишь баг эволюции? И что, если будущий агент увидит это?

Вопрос, который мы боимся задать ИИ

Google представила ИИ-генератор видео Veo 3

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров77K

Если Veo 2 произвел на вас впечатление, то Veo 3 вас просто поразит.

Google IO 2025 завершилась, и это была абсолютная масса анонсов в сфере ИИ. Многие люди, включая меня, до сих пор поднимают челюсти с пола. Но из всех анонсов Veo 3 - один из самых захватывающих для меня.

Об остальных анонсах я расскажу в отдельном посте, а пока давайте сосредоточимся на новейшей генеративной видеомодели Google.

Читать далее

Nvidia AI Factory: Суперкомпьютер на Тайване и новые горизонты для ИИ

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров758

19 мая 2025 года Nvidia, Foxconn и правительство Тайваня объявили о партнёрстве для создания AI factory — суперкомпьютера, предназначенного для обучения крупных языковых моделей (LLM), робототехники и развития умных городов. Как сообщает The Wall Street Journal, проект укрепляет позиции Тайваня как центра ИИ-инноваций и задаёт новый стандарт для вычислительных платформ. В этой статье мы разберём техническую основу AI factory, её значение для разработчиков и перспективы для российской ИИ-экосистемы.

Читать далее

Грязные схемы на собеседованиях: как мошенники используют разработчиков и обманывают работодателей

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров7.7K

Хотите узнать, как при найме кандидаты могут вас обмануть или как, устраиваясь на работу, случайно создать себе серьёзные проблемы? Тогда эта статья точно для вас.

⚠️ Этическое предисловие

Эта история основана на реальном кейсе одной организации, которая массово поставляла кандидатов на рынок труда в разных регионах и направлениях.

Сотрудники организации получили серьёзные проблемы с правоохранительными органами. А сотрудник, которого трудоустроили через такую схему, оказался в центре внимания как внутренней, так и внешней службы безопасности - с допросами, проверками и серьёзными последствиями.

Читать далее

SakanaAi: как CTM переосмысливает нейросети через биологию

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров1.3K

Искусственный интеллект добился значительного прогресса благодаря архитектурам глубокого обучения, однако эти системы все еще сталкиваются со значительными ограничениями в рассуждениях здравого смысла, обобщении и прозрачности. Статья «Машины непрерывного мышления» (CTM) представляет новую архитектуру нейронной сети, которая устраняет эти ограничения, явно включая нейронную синхронизацию в качестве фундаментального компонента, черпая вдохновение из того, как биологический мозг обрабатывает информацию.

Читать далее

Что ждать от Google I/O любителям ИИ

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров3.2K

20-21 мая Google проведет input/output (сокращенно I/O), свое самое крупное мероприятие для разработчиков, на котором компания всегда делает множество анонсов. Очевидно, что в этом году центральной темой станет искусственный интеллект — подразделение Google DeepMind в последние месяцы успешно конкурирует с OpenAI и Anthropic, поэтому новые анонсы компании особенно интересны.

И пусть до I/O еще остается несколько дней, в сети уже полно слухов и утечек, что поклонникам ИИ стоит ждать от Google I/O. Я собрал самые интересные и достоверные.

Читать далее

Федеративное обучение: потенциал, ограничения и экономические реалии внедрения

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров663

Федеративное обучение (Federated Learning, FL) становится всё более заметным элементом технологической повестки в условиях ужесточающихся требований к конфиденциальности данных и законодательных ограничений на их передачу. На прошлой неделе при поддержке канала @noml_community мы поговорили с коллегами (Дмитрий Маслов, Михаил Фатюхин, Денис Афанасьев, Евгений Попов, Роман Постников, Павел Снурницын) о Federated Learning. Получилось неожиданно интересно и полезно. Много говорили о кейсах, чуть меньше - о практических аспектах реализации, особенностях работы с данными и о специфике конфиденциальных вычислений. С большим удовольствием пообщались с коллегами по цеху и основными экспертами этой отрасли. 

https://www.youtube.com/watch?v=JpApLfde38I&list=WL&index=1&t=12s

Мой вывод - FL как технология и как предмет сделали большой шаг вперед к тому, что бы технологии и потребности рынка “пересеклись” в точки эффективности и кажется что такой момент уже близко.

Читать далее

Языковые модели против мошенников: как LLM помогают бороться с отмыванием денег и финансовым мошенничеством

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров1.3K

С ростом цифровизации банковских услуг злоумышленники становятся всё изощрённее: от схем отмывания денег через фиктивные юрлица — до автоматизированных атак через фишинг, подмену номеров, скимминг и социальная инженерия. Бизнес теряет миллиарды, клиенты — доверие. В этих условиях защитные технологии — уже не просто брандмауэр, а целый арсенал аналитических систем.

В статье рассмотрим, как LLM может помочь финансовым организациям для противодействия мошенничеству и отмыванию денежных средств.

Читать далее

ИИ-агенты против живых юзеров: кто лучше тестирует интерфейсы?

Время на прочтение5 мин
Количество просмотров1.5K

Представьте: вы хотите протестировать новую кнопку «Купить», но для статистически значимых выводов нужны тысячи пользователей и недели анализа. А теперь забудьте об этом. В статье «AgentA/B: Automated and Scalable Web A/BTesting with Interactive LLM Agents» авторы рассказывают, как заменить живую аудиторию автономными ИИ-пользователями на базе LLM – и получать точные A/B‑результаты за считанные часы и копейки бюджета. Давайте узнаем, как это работает.

Читать далее

Как бессерверные gpu делают AI доступным. Введение в платформу PrimeWay

Уровень сложностиСредний
Время на прочтение10 мин
Количество просмотров2.9K

Привет, Хабр! Сегодня мы поговорим о том, как бессерверные-технологии меняют мир GPU-вычислений. Если вы когда-нибудь сталкивались с машинным обучением, рендерингом анализа 3D-графики или большими данными, эта статья поможет вам сэкономить время, деньги и нервы.

Читать далее

Ближайшие события

Почему GPT-чаты не крякают?

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров6K

Эхо от кряканья лучше всего слышно в ситуации, когда утка и человек находятся рядом со стеной, хорошо отражающей звуки.

[ Первомай ]

Обучаем ИИ-агентов играть в видеоигры: новый подход с LLM и рефлексией

Время на прочтение4 мин
Количество просмотров1.1K

Современные ИИ-системы для видеоигр часто упираются в ограничения классических методов, таких как обучение с подкреплением (RL): они требуют больших вычислительных ресурсов, длительного обучения и тонкой настройки под каждую игру. В ответ на эти сложности исследователи из Tencent предложили новый подход к созданию ИИ-агентов для 3D-игр — с опорой на большие языковые модели (LLM) и специализированный язык описания поведения. Такой метод позволяет быстро генерировать эффективные стратегии без переобучения, и, как показывают эксперименты, демонстрирует впечатляющие результаты. Разбираемся, как это работает.

Читать далее

ИИ пишет книги, рисует картины и снимает кино. Творцы, пора паниковать?

Время на прочтение2 мин
Количество просмотров1.8K

Сначала машины забрали у нас заводы, теперь добрались до искусства. Нейросети уже пишут романы, сочиняют симфонии и генерируют картины, которые продаются за сотни тысяч долларов.

Так что закрываем ноутбуки, выбрасываем кисти и идём искать новую работу? 

Читать далее

Оптимизация стратегии взыскания с помощью ML-моделей

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров1.1K

Привет! Меня зовут Мария Шпак, я лидер команды collection стрима моделирования розничного бизнеса в Департаменте анализа данных и моделирования банка ВТБ. Наша команда занимается разработкой моделей машинного обучения для различных процессов, в совокупности служащих для финансового урегулирования. Основной заказчик этих моделей – соответствующий департамент банка, целью которого является помощь клиентам, допустившим просрочку платежа или находящимся в графике, но имеющим риск просрочки (Pre-Collection). Наши коллеги предлагают клиентам различные инструменты урегулирования этой проблемы и в большинстве случаев добиваются скорейшего возврата клиента в график платежей и в статус добросовестного заемщика. Оптимизация стратегий финансового урегулирования предполагает учёт разных параметров ситуации клиента: причины возникновения просрочки, степени серьезности возникших у него проблем, а также наиболее удобных и эффективных способов установить с ним контакт.

Читать далее

Как обучить русскоязычную модель рассуждений — LRM?

Время на прочтение3 мин
Количество просмотров2.1K

Ранее на моем YouTube-канале уже были видео о моделях рассуждений — OpenAI o1/o3, DeepSeek R1. Эти модели обучены с помощью стратегии reinforcement learning находить решения для задач, требующих логических рассуждений. Способность строить цепочки рассуждений, ведущих к решению поставленной задачи, открывают возможность применения таких моделей в математике, программировании и других подобных направлениях.​

Однако упомянутые модели имеют одно ограничение — они выполняют рассуждения на английском языке. И даже если вы укажете в промпте требуемый язык ответа, отличный от этих двух, то только вывод модели будет на этом языке, а вот сама цепочка останется на том, на котором модель обучена “думать”. Соответственно, чтобы заставить модель думать на русском, нужно применять файнтюнинг.

Есть интересный пример — коллекция моделей R1 Multilingual от японской компании Lightblue, которая ранее создала открытый мультиязычный файнтюнг Llama 3 - Suzume. Эта новая коллекция содержит модели рассуждений на базе DeepSeek-R1-Distill-Qwen, дистиллированных с помощью DeepSeek R1 версий Qwen. Что более важно - эти модели получены путем файнтюнинга на мультиязычном CoT (Chain-of-Thoughts), и данные CoT опубликованы на HuggingFace.

Датасет содержит данные на более чем 30 языках, включая русский. Данные получены следующим образом:

Выполнена выборка промптов из открытых англоязычных датасетов с последующим переводом на различные языки. Для перевода использовалась GPT-4o, которая, кстати, хорошо показала себя при создании моего собственного датасета и русскоязычного файнтюна Llama 3 на нем. Далее авторы мультиязычного CoT-датасета сгенерировали ответы на полученные промпты с помощью deepseek-ai/DeepSeek-R1-Distill-Llama-70B восемь раз, и отфильтровали блоки <think> не на том языке, либо с нарушениями правил языка или логическими ошибками. Это достаточно интересный момент, так как разработчики полностью опубликовали код для генерации своего датасета, включая фильтрацию сгенерированных цепочек рассуждений. Если с автоматическим определением языка цепочки все достаточно просто, то для проверки ее соответствия нормам языка и, самое главное, логической корректности, пришлось опять-таки задействовать LLM. Принцип такой же, как и при использовании модели-судьи для выполнения автоматизированных evaluation-тестов.

Читать далее

Когда обучение не идет. Loss is NaN. Причины и решения

Уровень сложностиПростой
Время на прочтение2 мин
Количество просмотров1.4K

Почему в ходе обучения ML-моделей иногда Loss принимает вместо значений NaN. Рассмотрим причины и способы решения.

Читать далее

SSH к wsl

Уровень сложностиСредний
Время на прочтение4 мин
Количество просмотров4.8K

Подключаемся к домашнему WSL через VSCode ssh extension снаружи и безопасно. Гайд для тех у кого болит спина сидеть на кресле, или нужно использовать мощности стационарника в своем ultra-micro-macbook.

Читать далее

Вклад авторов