Обновить
724.05

Машинное обучение *

Основа искусственного интеллекта

Сначала показывать
Порог рейтинга
Уровень сложности

Whisper больше не нужен? Обзор VibeVoice ASR от Microsoft — часовая транскрипция, диаризация, hotwords и портативка

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели4.8K

Всем привет! Команда Microsoft Research выложила в открытый доступ VibeVoice-ASR — нейросетевую модель для распознавания речи с диаризацией (разделением) спикеров. Сегодня хочу рассказать об этой технологии подробнее и поделиться портативной версией.

Читать далее

Новости

Я год доверял ChatGPT в строительстве, а потом он придумал ГОСТы

Время на прочтение6 мин
Охват и читатели11K

Эту историю для моего блога рассказал Алексей Кривоносов

Год назад я начал использовать ChatGPT для работы. Занимаюсь загородным строительством — это основной бизнес. Также веду YouTube-канал компании. Нейросеть помогала генерировать сценарии, составлять контент-планы, оформлять технические отчёты.

Но когда попробовал использовать ChatGPT для работы со строительными нормами — СП, ГОСТами, нормативной документацией — столкнулся с проблемой. Нейросеть придумывала несуществующие пункты нормативов, выдавала цифры, которых не было в документах.

За полгода я с небольшой командой создал свой AI-инструмент — «Цифровой стандарт». Мы вручную обработали строительную нормативную базу, перевели её в векторный формат и настроили алгоритм, который даёт точные ответы без галлюцинаций.

Читать далее

$38 триллионов долга, пузырь ИИ и конец доллара. Крах, который сделает Великую депрессию детской забавой рядом

Уровень сложностиПростой
Время на прочтение9 мин
Охват и читатели5.8K

Этот кризис будет страшнее, чем в 1929-м, 2000-м и 2008-м

Мы живем в самый нестабильный период XXI века. Прямо у нас на глазах разворачивается что-то грандиозное.

Власть переходит из рук в руки, старые институты слабеют, а системы, которые когда-то гарантировали стабильность, больше не вызывают того доверия, что раньше.

То, что мы видим сегодня - это не просто очередной рыночный цикл.

Это переход из одной эпохи в другую.

Читать далее

Книга: «Машинное обучение. Проектирование систем от идеи до реализации»

Время на прочтение3 мин
Охват и читатели6.2K

Привет, Хаброжители! Проектирование и развертывание системы машинного обучения — это сложный многоэтапный процесс, требующий разнообразных компетенций и участия специалистов разных ролей. Независимо от того, интегрируете ли вы ML в существующий проект или проектируете ML-систему с нуля, вам необходимо ориентироваться в огромных датасетах и потоках, определять требования к тестированию и развертыванию, а также учитывать сложности внедрения ML-моделей в продакшен.

Читать далее

59% компаний признались: увольнения списывают на ИИ, чтобы скрыть правду. Вот что на самом деле происходит

Уровень сложностиПростой
Время на прочтение8 мин
Охват и читатели6K

Вы всё ещё верите в сказки про увольнения из-за искусственного интеллекта? Большинство менеджеров по найму честно сознались: это всего лишь удобная легенда для акционеров. Разбираем три сигнала, которые выдают правду, и навыки, которые сделают вас действительно незаменимыми.

История выглядит неизбежной. Свежие данные показывают шокирующую правду: 59% менеджеров по найму прямо признались, что списывают сокращения штата на искусственный интеллект только потому, что это звучит приятнее, чем честное признание финансовых проблем. Сейчас я покажу вам, как читать между строк этого нарратива и выстроить карьеру, которую никакими отговорками не объяснишь.

Знакомая ситуация? Вы профессионал своего дела, и в этом году хоть раз слышали в одной корпоративной рассылке слова «ИИ» и «оптимизация структуры». То самое чувство тревоги в животе. Или вот: соискатель блестяще проходит все этапы собеседования, отлично общается с командой за обедом — а потом неделями ловит гробовое молчание. Это гнетущее ощущение, что правила игры переписали, а вам забыли выдать новый учебник.

Заголовки сами пишутся: 59% компаний открыто признают, что сваливают увольнения на ИИ, потому что так проще.

Вот она, ключевая мысль. Но задумайтесь: а что, если самая разрушительная сила сейчас — это вовсе не технология, а история, которую о ней рассказыв��ют?

Читать далее

MLOps — дитя DevOps и ML

Уровень сложностиСредний
Время на прочтение12 мин
Охват и читатели5.7K

Один ML-проект в проде вам или два другому? Внедрение машинного обучения в производственную среду остаётся одной из главных проблем индустрии. По статистике, 80% ML-проектов никогда не доходят до продакшена. Однако хитрые опсы и тут решили выделиться, и в результате появился MLOps — методология, которая поможет вам сократить путь от эксперимента до деплоя с месяцев до дней. В этой статье мы пройдёмся по верхам MLOps и посмотрим на фундаментальные принципы и конкретные инструменты.

Читать далее

Обзор Open Source моделей для задачи TTS

Уровень сложностиСредний
Время на прочтение12 мин
Охват и читатели6.4K

Задача Text‑to‑Speech (TTS) она же задача синтеза речи — заключается в том, чтобы озвучить заранее подготовленный текст голосом спикера. Данная задача является одной из важных в системах взаимодействия человека и компьютера. Конечно, такая задача генерации речи встречается гораздо реже, чем, например, задача генерации или обработки текста, тем не менее, сферы ее применения со временем только увеличиваются в своих масштабах и становится все более востребованной.

Привет, Хабр, меня зовут Музафаров Данил, я работаю DS инженером в компании Raft и сегодня мы рассмотрим существующие Open Source модели и репозитории, которые решают задачи TTS для русского языка.

Читать далее

Что смогут ИИ-агенты к 2030-му году

Время на прочтение9 мин
Охват и читатели4.3K

Привет! На связи команда Research & Insights Центра стратегии цифровых продуктов МТС. В прошлом году мы подготовили исследование мирового и российского рынка ИИ-агентов. Перед вами четвертая часть статьи об исследовании. В первой мы рассказали про интересные факты из него, во второй — про виды агентов, в третьей— про ситуацию в мире и России. А в этой раскроем детали будущего агентного ИИ: каким его видят исследователи и респонденты.

Читать далее

ИИ-агенты без оркестрации и роутинга

Уровень сложностиСредний
Время на прочтение5 мин
Охват и читатели3.4K

Если у вас мультиагентная система или сложный RAG, то с большой вероятностью вы используете жесткий роутинг или оркестрацию.

Например, в мультиагентной системе могут быть сложные разветвления и в каждой точке, в зависимости от результата предыдущего агента, нужно пойти налево (запустить ветку агентов A) или направо (запустить ветку агентов Б). Это жесткий роутинг.

Или приходит запрос от пользователя и нужно его классифицировать, вы отправляете его в LLM, получаете ответ, что запрос про A или про Б, и направляете к агенту RAG, который отвечает за область A или Б. Это оркестрация.

Читать далее

EMNLP 2025 глазами аналитика из Яндекса: мировые тренды и наши решения

Время на прочтение10 мин
Охват и читатели4.5K

Всем привет! Меня зовут Катя Еникеева, я руковожу командой аналитики перевода в Яндексе. Мы занимаемся оценкой качества машинного перевода — моделей, которые работают в Яндекс Переводчике, Браузере, Поиске и во множестве других сервисов.

Качество перевода можно измерять по‑разному, но можно выделить два основных направления: экспертная разметка и автоматические метрики. В последние годы автометрики всё чаще строятся поверх LLM: фактически это отдельный пайплайн, который анализирует исходный текст и полученный перевод. Поэтому нас интересует не только способность моделей переводить, но и их умение анализировать качество перевода, что может быть заметно сложнее. 

Под катом вас ждёт обзор самых интересных решений, представленных на конференции EMNLP 2025.

Наша команда перевода приехала на EMNLP 2025 не только слушать, но и рассказывать о своей работе. В этом году у нас приняли две статьи: одну — в Findings основной конференции, вторую — на WMT. О них я тоже подробно расскажу.

Читать далее

DGCompass: что мы узнали, проанализировав 4000 российских стартапов

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели4K

Привет, Хабр! Меня зовут Никита Трофимов, я старший менеджер Цифрового консалтинга Т1. Мы провели исследование российского стартап-ландшафта и хотим поделиться тем, что нашли. Не столько самим инструментом (хотя о нём тоже расскажу), сколько конкретными данными и технологическими решениями, которые обнаружили в процессе.

В основе исследования — реальные финансовые и операционные данные российских компаний за 2024 год, собранные и проанализированные в единой методологической рамке. Такой подход позволяет не спорить о частных случаях, а смотреть на рынок целиком и выявлять устойчивые закономерности.

Читать далее

Действительно ли ИИ заменит программистов через 12 месяцев?

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели21K

Человеческий фактор, который все упускают

Когда Дарио Амодеи, генеральный директор Anthropic, сказал, что нас отделяет всего 6-12 месяцев от ИИ-систем, способных делать всё, что делают программисты, мне пришлось остановиться.

Это не "в будущем". Это практически следующий год.

В то же время Anthropic представила тесты производительности своей новой модели Claude Opus 4.5, показывающие значительные улучшения в кодировании, рассуждении и обработке сложных задач. Цифры выглядят действительно впечатляюще.

И я начал задаваться вопросом: действительно ли эти тесты означают, что разработка программного обеспечения вот-вот будет полностью автоматизирована? Позвольте мне разобрать, что, на мой взгляд, на самом деле происходит.

Читать далее

NEWAVE. Делаем интеллектуальный ретривал музыки

Уровень сложностиСредний
Время на прочтение12 мин
Охват и читатели4.9K

Двуэнкодерные нейросети, контрастивное обучение, десять датасетов и late fusion. Как мы строили ML-систему ретривала, понимающую человеческий язык вместо фильтров

Ну и как же?

Ближайшие события

Как я пытался сжимать смыслы вместо байтов

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели5.9K

Написал прототип SemanticZip: сжатие текста в 14 раз за счет удаления «выводимой» информации. Теория информации, Колмогоровская сложность. В теории все работало...
Разбор полетов: почему нельзя сжимать смыслы и почему красивые метафоры проигрывают скучному RAG

Читать далее

̶К̶у̶п̶а̶н̶и̶е̶ тестирование «красного» ̶к̶о̶н̶я̶ представителя GPU от АМД с приставкой ИИ — RADEON AI PRO R9700

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели6.6K

Тестировать друг за другом видеокарты от NVIDIA надоедает, благо разница в последнем поколении только в мощностях процессоров семейства Blackwell, объеме памяти и ширине шины. А вот посмотреть, что предлагают конкуренты, а тем более громко называя это «ИИ», уже интересней. Мы проверили Radeon AI PRO R9700 с 32 Гб памяти на реальных задачах: LLM, генерация графики и видео, 3D-рендеринг, и сравнили с NVIDIA.

Читать далее

Вам лгали про увольнения из-за ИИ. Oxford Economics раскрыл правду — и она вас удивит

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели9.2K

ИИ не забирает вашу работу.

Мы все читали заголовки и слышали этот нарратив. Компании заявляют, что ИИ позволил им уволить тысячи сотрудников. Чат-боты, как сообщается, уже заполняют все начальные позиции, затрудняя выпускникам поиск работы. Генеральные директора из мира технологий проповедуют, что ИИ революционизирует экономику, и вам нужно включиться в этот процесс или остаться позади. Но насколько всё это правда? Что на самом деле показывают данные? Что ж, если копнуть глубже искажённой пропаганды олигархии Больших Технологий, вы обнаружите, что этот нарратив - почти полная выдумка и не может быть дальше от истины. Возьмите недавний отчёт Oxford Economics (OE), который обнаружил, что компании «не заменяют работников ИИ в значительном масштабе», а вместо этого предполагает, что они используют нарратив об увольнениях из-за ИИ, чтобы прикрыть собственные недостатки.

Отчёт развенчивает эту отраслевую пропаганду в четырёх основных шагах. Давайте углубимся.

Читать далее

Нейросети в Телеграм: полезные боты и сервисы с нейросетями и ИИ-инструментами

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели5K

Нейросети так плотно вошли в жизнь практически каждого человека всего за какие-то 2-3 года. Однако далеко не все доступны напрямую российским пользователям. Однако наши разработчики не растерялись и создали полезные и многофункциональные боты с нейросетями в Telegram, а некоторые — еще и полноценные веб-агрегаторы, работа которых не зависит от Telegram.

В сегодняшней мини-подборке я не буду рассказывать обо всех Telegram-ботах, а расскажу про те, с которыми довелось работать и с которыми понравилось работать. Плюс к этому, в подборку я также включил ботов, которые развиваются, а не стоят на месте. Итак, начнем.

Читать далее

Машинное обучение для работы с текстами: подборка бесплатных курсов и материалов

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели5.3K

Привет! Это Данила Ляпин, наставник курса «Специалист по Data Science». Собрал подборку материалов по обработке естественного языка — она охватывает путь от базовых концепций NLP до трансформеров и BERT. Все материалы бесплатны и проверены на практике. Главное — двигаться последовательно, не пропускать основы и обязательно практиковаться на реальных задачах.

Читать далее

MiniMax Agent 2.0: уборка файлов без терминала и альтернатива Claude Cowork и Moltbot (Clawdbot) — мой опыт

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели6.4K

Последние недели все обсуждают агентов для компьютера: кто-то ставит опенсорсный Moltbot (бывший Clawdbot), кто-то ждет, когда работать в Claude Cowork станет дешевле, а кто-то хочет просто нажать кнопку и получить результат - без всяких серверов, портов и онбординга в терминале.

Я протестировала MiniMax Agent 2.0 на самом понятном кейсе: навести порядок в папках на компе, и делюсь тем, что получилось со всеми нюансами и со стоимостью, а так же своим мнением, что мне больше понравилось использовать.

Читать далее

Как мы создали open-source кодового агента, работающего с любыми локальными моделями

Уровень сложностиПростой
Время на прочтение18 мин
Охват и читатели15K

Можно ли сделать кодового агента уровня Claude Code, но бесплатного и для локальных моделей? Мы разобрали архитектуру конкурентов, нашли слабые места и написали PocketCoder — CLI-ассистент с Agent Loop, XML-контекстом и памятью. Работает даже с qwen-7b, хотя и с приколами.

Читать далее
1
23 ...

Вклад авторов