Машинное обучение *

Основа искусственного интеллекта

1 255,63

Рейтинг

СтатьиПостыНовостиАвторыКомпании

ToxaBes 1 час назад

Невыносимая слопность бытия

Средний

30 мин

1.6K

Машинное обучение *

Мнение

Эта статья выросла из одного моего комментария в качестве читателя об ИИ-слопе, возникшей после этого дискуссии с писателями и редакторами, переросшей во взаимное минусение друг-друга с высунутыми языками и последовавшего затем всеобщего успокоения.

Далее мой взгляд на проблему со стороны читателя, попытка перевести все в конструктивное русло и небольшое исследование для технического решения проблемы.

Master_AI 3 часа назад

Gemini 3.6 Flash: модель не стала умнее, но стала гениально дешёвой

Простой

9 мин

3.5K

Блог компании GPTunneLИскусственный интеллектМашинное обучение * Тестирование IT-систем * Исследования и прогнозы в IT *

Обзор

21 июля я сидел, обновлял ленту и ждал Gemini 3.5 Pro – тот самый флагман, который Google пообещала ещё в мае на I/O. «В следующем месяце», – сказали они тогда. Прошло два. Я уже мысленно прикрутил этот релиз к списку «когда-нибудь», но вместо флагмана компания выкатила… три модели тира Flash. Ни одной Pro. Знакомо, да? Как заказать премиум-бургер, а получить три сочных, неожиданно крутых стритфуда.

И вот что интересно: в руки попали не просто «затычки», а модели, которые для 90% реальной работы полезнее ещё одной строчки в таблице интеллектов. Особенно когда выяснилось, что экономия в 17% выходных токенов на самом деле тянет за собой цепочку издержек и способна сделать агентную разработку дешевле почти вдвое. А ещё новая версия местами просела в чтении графиков – и об этом молчат почти все.

Давайте разбираться без корпоративных слайдов: что реально дают эти модели, чем за них придётся заплатить вниманием и как не сломать свой пайплайн, обновляясь на последнюю версию.

itmai 5 часов назад

Можно ли подготовить инженера по Big Data и Machine Learning за один год? Опыт МАИ

Простой

7 мин

4.7K

Блог компании IT-центр МАИМашинное обучение * Анализ и проектирование систем * Образование за рубежом

Мнение

Когда человек впервые слышит про одногодичную магистратуру, обычно возникает один из двух вопросов:

«А так вообще можно?»

«Что из обычной двухлетней программы пришлось выбросить?»

На первый вопрос ответить просто: да, можно. Рассказали про нашу одногодичную программу «Большие данные и машинное обучение».

RaZe-31cs 11 часов назад

Нашёл модель в 8 раз дешевле. Она начала писать иероглифы в русских новостях

Простой

3 мин

Машинное обучение * Python * Natural Language Processing *

Кейс

Recovery Mode

Нашёл модель в 8 раз дешевле. Она начала писать иероглифы в русских новостях

У меня новостной бот, и каждая новость в нём проходит через LLM: категория, перевод, тон, разбор. Выходит около 936 вызовов в сутки, и в какой-то момент мне захотелось платить за это меньше.

Я перебрал все бесплатные модели OpenRouter на живых промптах, нашёл платную в 8 раз дешевле текущей, обрадовался и выкатил в прод.

Через час в ленте появился заголовок: «Как не，让智能手机 перегревать: советы в жару».

HotFixer вчера в 19:30

Смартфон как элемент эшелонированной системы обнаружения БПЛА: архитектура распределенной сенсорной сети

Средний

10 мин

13K

Сетевые технологии * Машинное обучение * Алгоритмы * Анализ и проектирование систем * Краудсорсинг

Аналитика

Представьте, что любой человек, выйдя на улицу или посмотрев в окно, может стать частью распределенной системы раннего обнаружения воздушных угроз. Не как оператор или специалист, а как источник дополнительного сенсорного наблюдения.

Современный смартфон представляет собой доступную COTS‑платформу с набором встроенных датчиков: камерой, GNSS‑приемником, 6-DoF IMU, барометром и микрофонами. По отдельности эти сенсоры ограничены, однако их совместное использование в распределенной сети потенциально позволяет создавать новые подходы к обнаружению низколетящих БПЛА.

Это не задача создания «смартфонного радара», а инженерная задача на стыке краудсорсинга, Edge Computing, машинного обучения и обработки сигналов.

Как превратить множество пользовательских устройств в единую распределенную апертуру? Попробуем рассмотреть возможную архитектуру такой системы.

runaway_llm вчера в 19:25

ИИ, который нервничает и знает больше, чем говорит: разбор системной карты Claude Opus 5

Простой

4 мин

10K

Искусственный интеллектМашинное обучение *

Обзор

Компания Anthropic представила Claude Opus 5: свой новый ИИ уровня Claude Mythos 5/Fable 5, но в два раза дешевле. По традиции самое интересное прячется в системной карте, где разработчики рассказали о том, как проходило тестирование модели и какие инциденты случались.

DashaPasha вчера в 14:42

Отчет Google AI & Economy ATLAS: ИИ уже в 68% профессий, но пока только в 21% задач

Простой

5 мин

6.8K

Блог компании BotHubИскусственный интеллектИсследования и прогнозы в IT * Машинное обучение *

Аналитика

Google опубликовала выпуск AI & Economy ATLAS — исследование о том, как люди используют ИИ в работе и повседневной жизни. ИИ уже присутствует в широком спектре профессий, но чаще помогает с отдельными задачами, чем заменяет их целиком. Разбираемся, почему так и разбираем особенно интересные моменты отчета.

edlost вчера в 12:00

MCP как интерфейс продукта: почему я думаю, что GUI может стать не главным

10 мин

9.9K

Блог компании SelectelИскусственный интеллектМашинное обучение * Управление продуктом * Интерфейсы *

Мнение

Я много лет занимаюсь развитием финтех-продуктов, а сейчас руковожу продуктами биллинговой платформы в Selectel.

За это время я много раз сталкивался с одной и той же проблемой: для решения задачи в графическом интерфейсе почти всегда приходится выбирать между простотой и универсальностью.

Ниже — о том, почему привычный GUI может уступить место ИИ-агентам и как это решает вечную дилемму продуктового дизайна.

+34

spreadingmind вчера в 11:42

RUMBA: русскоязычный бенчмарк для оценки долгосрочной памяти

Простой

13 мин

6.5K

Блог компании СберМашинное обучение * Искусственный интеллект

Обзор

Память стала одной из самых востребованных функций диалоговых и агентных систем. Если пользователь регулярно обращается к ассистенту — для работы, консультаций, планирования, обучения или бытовых задач, — то от системы уже ожидают не просто хорошего общего ответа. От неё ждут, что она будет учитывать прошлые взаимодействия: помнить неизменные факты о пользователе, не терять важный контекст, обновлять устаревшую информацию и понимать, когда именно произошло то или иное событие.

При этом такая память о пользователе обычно не является встроенным свойством самой языковой модели. В прикладных продуктах её чаще добавляют как отдельный слой вокруг LLM: например, через RAG с долговременным хранилищем фактов (векторные или графовые базы памяти, профили пользователя, журналы событий) или агентные схемы — например, локальную файловую систему в духе Obsidian в сочетании с вызовом инструментов.

Из-за этого качество памяти становится не столько вопросом того, насколько хороша модель, сколько вопросом всей архитектуры: как система извлекает факты, что именно сохраняет, как разрешает противоречия, удаляет ли данные по запросу пользователя и как использует временной контекст.

Для русского языка до сих пор не хватало бенчмарка, который проверяет именно такие аспекты долгосрочной памяти в многосессионных диалогах. Поэтому мы сделали RUMBA — Russian User Memory Benchmark: русскоязычный бенчмарк для анализа способности диалоговых систем работать с долгосрочной памятью пользователя в реалистичных разговорных сценариях.

X_ray_ml вчера в 11:23

ИИ для анализа рентген‑снимков грудного отдела

Средний

10 мин

5.9K

Python * Машинное обучение * ЗдоровьеИскусственный интеллектИнженерные системы *

Туториал

Из песочницы

Недавно занимался задачей, которую в медтехе обсуждают часто, а до рабочего прототипа доходят не все: нужно было научить модель смотреть на рентген грудной клетки и выдавать вероятности по нескольким патологиям сразу. Не сегментация, не генерация отчёта — именно мультилейбл‑классификация, чтобы на выходе было что‑то вроде «плевральный выпот 87%, пневмоторакс 12%».

Полный fine‑tune большой сети на арендованной GPU мне не хотелось: дорого, долго, и есть риск переобучиться на паре десятков тысяч снимков. Поэтому пошёл по пути linear probing — взял тяжёлый предобученный энкодер, заморозил его и обучил только небольшую голову. В итоге macro AUC на валидации вышел 0.9025, обучение уложилось в десяток эпох.

Ниже — как устроен пайплайн, где накосячил с путями к датасету, и почему отказался от горизонтального отражения.

b_ernis вчера в 09:57

LLM-судье нельзя верить на слово: как построить надёжный гейт и проверить сами тесты

Средний

12 мин

5.8K

Машинное обучение * Искусственный интеллектPython * Тестирование IT-систем * Программирование *

Кейс

Из песочницы

Как перестать доверять LLM-судье на слово и построить безопасную двухконтурную систему оценки?

Внутри статьи:

Архитектурный паттерн сдерживания: почему у классической нормализации должно быть право вето.

CI-инварианты: как ловить галлюцинации моделей с помощью враждебных фикстур в grounded-judge-gate.

Разбор факапов: три реальных бага проектирования, которые едва не увели систему в ложноположительное пике.

FirstJohn вчера в 09:03

Локальная RAG-система на Go, PostgreSQL и Ollama без облачных API

Простой

16 мин

8.4K

Блог компании FirstVDSМашинное обучение * Программирование * Искусственный интеллектNatural Language Processing *

Туториал

RAG уже стал стандартным способом научить LLM работать с собственными документами без дорогостоящего дообучения. Но за кажущейся простотой скрывается множество практических вопросов: как разбить документы на чанки, где хранить эмбеддинги, как организовать быстрый семантический поиск и какую модель использовать на каждом этапе.

В статье соберем полностью локальную RAG-систему на Go, PostgreSQL и Ollama без облачных API и сторонних сервисов. Разберем весь путь — от индексации документов до получения ответа LLM на основе найденного контекста.

inkedsymon вчера в 08:00

Почему нельзя идеально оптимизировать светофоры: дело не в алгоритмах

Средний

6 мин

19K

Блог компании SelectelНаучно-популярноеАлгоритмы * ТранспортМашинное обучение *

Мнение

Каждый айтишник, который хоть раз стоял «на красном» на пустом перекрестке в три часа ночи, думал одно и то же: «Да я бы это за выходные пофиксил».

Я тоже так ненароком подумал. Потом начал разбираться, как устроено управление светофорами и выяснил кое-что интересное. Оказывается сама постановка задачи «как оптимизировать светофоры» при ближайшем рассмотрении рассыпается на глазах. Неочевидно, но это не задача оптимизации в том смысле, в котором мы привыкли. И самое обидное, что компьютер тут не главное бутылочное горлышко.

Давайте по порядку, потому что путь от «я исправлю это за выходные» до «а, вот почему до сих пор не пофиксили» это, честно, лучшая экскурсия по тому, чем реальная инженерия отличается от академической.

+104

172

ideavi вчера в 07:39

Почему мы не написали ещё один Bad CaRMa

Средний

7 мин

6.6K

Искусственный интеллектМашинное обучение * Программирование * Хранение данных * SQL *

Кейс

«Bad CaRMa» — глава из Dreaming in Code Скотта Розенберга (каламбур на CRM и «карму») про CRM-систему Vision в компании Upstart. Архитектор задумал предельно гибкую схему: одна-единственная таблица DATA, куда сложили все 150+ бизнес-сущностей — 240+ колонок с именами вроде string82 и numeric31, метаданные и данные вперемешку. Схему ведь больше «никогда не придётся менять».

Практики на грани

SecretEditor вчера в 07:01

Как переводить смешанный русский-казахский и не сойти с ума

Средний

8 мин

Блог компании MWS AIБлог компании МТСИскусственный интеллектБазы данных * Машинное обучение *

Обзор

В Казахстане часто смешивают казахский и русский в соцсетях, переписке, быту. Но попробуйте скормить русско-казахскую фразу любой системе машинного перевода (Machine Translation), и она начнёт чудить. Не потому, что она глупая, а потому что данных для обучения моделей переводить такую языковую кашу почти нет.

В этот раз разбираю научную работу коллег из MWS AI и нескольких университетов, в которой они предложили подход для генерации синтетического датасета под эту задачу на базе уже существующих обычных параллельных корпусов на казахском и русском. Да, это синтетические данные, но в условиях, когда альтернативы нет, это спасает. Их модель, обученная на синтетике, обошла известные коммерческие системы (ручная оценка) в узком, но реальном сценарии.

Велком под кат

GoldenGekko вчера в 06:03

Своя GPT-like LLM по WH40K с нуля. Часть 4: Дообучение на вопрос–ответ (SFT)

Простой

8 мин

7.6K

Искусственный интеллектМашинное обучение * Python * Natural Language Processing *

Туториал

Привет, Хабр! Меня зовут Владимир, и это четвёртая часть цикла статей по написанию и обучению небольшой decoder-only LLM с нуля.

Данная статья целиком посвящена этапу SFT - дообучению на датасете “вопрос - ответ”, чтобы модель могла вести диалог с пользователем, а не просто дописывать за него фразы.

runaway_llm 23 июл в 20:22

Как GPT-5.6 и Kimi K3 научились хорошему дизайну — исследование Design Arena

Простой

4 мин

10K

Искусственный интеллектМашинное обучение *

Обзор

За неделю команда бенчмарка Design Arena выпустила два разбора моделей, возглавивших ее дизайн-лидерборды: разбор GPT-5.6 Sol, флагмана OpenAI, и свежий разбор Kimi K3 от китайской Moonshot AI. Исследователи заглянули внутрь генераций и рассуждений моделей и показали, как именно те научились "вкусу". Выяснилось, что универсального рецепта нет: две модели пришли к хорошему дизайну противоположными путями, а третья — прошлый лидер GLM 5.2 — своим, третьим.

PloAl 23 июл в 14:59

«Учиться учиться и еще раз учиться» или дообучение LoRA

2 мин

8.7K

Машинное обучение * 1С *

Всегда нравилось разбираться во всем новом, работал в компаниях с разными видами деятельности: консалтинг, добыча, торговля, услуги. Разбираясь в новых технологиях, не представлял, что буду сам кого то учить.

Обычно дружу с большими локальными Товарищами, от 397B и выше, но решил проапгрейдить компьютер для инференса, добавить к 32Gb еще 48gb VRAM, и появилось желание выйти за пределы инференса и попробовать дообучить модель поменьше, Qwen3.6 27B в Unsloth studio.

Чему можно обучить модель и так способную во многих областях?

runaway_llm 23 июл в 14:47

США пытаются отбить open source у Китая: вышла открытая модель Poolside Laguna S 2.1

Простой

3 мин

10K

Искусственный интеллектМашинное обучение *

Обзор

Стартап Poolside выпустил Laguna S 2.1 — открытую модель для агентного программирования на 118 млрд параметров. Компания называет ее самой мощной открытой моделью Запада: на кодинговых бенчмарках Laguna идет вровень с моделями в разы крупнее себя, а местами обходит их, при этом запускается на настольном компьютере NVIDIA DGX Spark. Веса уже выложены на Hugging Face, причем использовать модель можно в том числе в коммерческих целях.

vsbel 23 июл в 14:11

LLM и психолингвистика: HELPER

Средний

9 мин

8.6K

Блог компании VKBig Data * ЗдоровьеИскусственный интеллектМашинное обучение *

Кейс

Привет, Хабр! На связи Александр Сабко, Виктория Белявская и Сергей Павлухин, из мастерской по прикладному ИИ Инженерно-математической школы НИУ ВШЭ и VK.

Сейчас текстовые данные все чаще рассматриваются как источник информации о психологическом и эмоциональном состоянии человека (автора текста) — это особенно важно для задач, связанных с психологическим консультированием, анализом пользовательских коммуникаций и мониторингом эмоционального состояния. В тексте нам часто важна не просто тональность, а динамика эмоционального состояния автора.

При этом большинство существующих решений в анализе эмоций работают слишком обобщенно — одни определяют общую тональность текста, другие решают задачу бинарной или многоклассовой классификации эмоций на уровне всего текста. Такие подходы плохо подходят, например, для психологически-нагруженных текстов, так как эмоции могут быть динамическими и проявляться в разных фрагментах текста — агрегированная метка не может это показать.

Есть и другая проблема: для обучения моделей, которые смогут улавливать локальные эмоциональные признаки и выявлять динамику их смены, не хватает специализированных русскоязычных корпусов, формализованных схем разметки и воспроизводимых методик оценки качества работы модели. Без этого сложно понять, действительно ли модель научилась распознавать психо-эмоциональные признаки текста или просто угадывает общий эмоциональный фон.

В статье мы расскажем, как мы выстраивали схему разметки на интервью с практикующими психологами, какие источники текстов взяли, что внутри инструмента, и что получилось с дообучением Qwen-3.

Психолингвистика с LLM

+15

2 3 ...

569 570