Обновить
781.63

Машинное обучение *

Основа искусственного интеллекта

Сначала показывать
Порог рейтинга
Уровень сложности

Данные против модели: почему больше — не всегда значит лучше в задаче Face Antispoofing

Уровень сложностиСредний
Время на прочтение10 мин
Охват и читатели6.7K

Привет, Хабр! Мы – Вадим Чернышев и Михаил Никитин из команды Tevian. Сегодня, в рамках задачи Face Antispoofing, мы разберем, как один «хороший и легкий», но бездумно добавленный домен может убить обобщающую способность вашей нейросети, и что с этим можно сделать.

Читать далее

Как свергнуть короля: формула для линейной альтернативы Трансформеру без побочных эффектов

Уровень сложностиСложный
Время на прочтение11 мин
Охват и читатели8K

Привет! На связи Андрей Аргаткин, руководитель научной группы исследований эффективных архитектур нейронных сетей ИМШ ВШЭ. Я хочу рассказать о нашем текущем исследовании в рамках совместного образовательного проекта с VK. В ходе исследования мы надеемся выделить волшебную формулу из недавней архитектуры DANet (1, 2) и экстраполировать её на широкий спектр других моделей, что позволит им стать такими же крутыми по качеству, но гораздо более быстрыми и эффективными, чем бессменный король мира нейронных сетей — Трансформер. Эта формула должна избавить от побочных эффектов предыдущих архитектур, пытавшихся стать ему заменой. Но сначала поговорим, зачем всё это вообще нужно.

Читать далее

Как вернуть молодежи интерес к инженерным специальностям?

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели11K

Спрос на инженеров на рынке труда стремительно растет: сегодня инженеры нужны не только в промышленности, но и в креативных индустриях, ритейле, дизайне и даже медицине. По данным исследователей Высшей школы экономики, потребность российских компаний в высококвалифицированных инженерах за последнее десятилетие выросла втрое. Но в отличие от ИТ-специалистов, конкуренция за которых уже прошла пик, рынок квалифицированных инженеров далек от насыщения.

Читать далее

Как я выбираю LLM (large language model) для своих задач?

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели7.6K

На учебных курсах часто задают вопрос: «Вы что‑то понимаете в LLM, поэтому скажите — какая LLM лучше?» Правильного ответа на этот вопрос нет. Число LLM растет в геометрической прогрессии, идет специализация, как по типу обрабатываемого контента, так и по области применения. Вдобавок возможности LLM растут от версии к версии, поэтому идеальной LLM не существует — ведь выбранная модель может показывать хорошие результаты по одним задачам, но плохо работать по другими. Данная статья — это лишь мой взгляд на инструменты выбора и вызова LLM, а также возможность получить бесплатный доступ из России к множеству LLM через агрегаторы.

Читать далее

Нужно ли аналитику данных машинное обучение — и как его освоить

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели7.4K

Нужно ли аналитику машинное обучение? Ответ неоднозначный: всё зависит от места работы и планов в профессии.

Меня зовут Раф, я аналитик ценообразования в Авито (а раньше в Яндекс Лавке), преподаватель машинного обучения в Центральном университете, выпускник факультета компьютерных наук в НИУ ВШЭ и курса «Специалист по Data Science» в Яндекс Практикуме. 

В этой заметке я расскажу, зачем аналитику машинное обучение, когда без него можно обойтись и как его освоить, если этого потребуют задачи.

Читать далее

Мы — последнее поколение умных? И может ли ИИ заменить целые профессии?

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели8K

Позвольте, я начну с чистосердечного признания, которым не особо горжусь. Пару дней назад я поймала себя на том, что «гуглю в ChatGPT» до смешного простой вопрос. Я абсолютно точно знала на него ответ, но набрать запрос в чате показалось быстрее, надежнее и как-то… правильнее. В тот момент, когда я нажала Enter, в животе заворочался тот самый ледяной ком тревоги.

Дело было не в дурацком вопросе. Но сама мысль, что я перепроверяю себя у всезнающего «бога» из кремния, вызывала дискомфорт. Тревога была вызвана другим, куда более серьезным осознанием: я поймала себя на том, что больше не доверяю собственному мозгу. Даже когда знаю ответ.

Не было никакой драмы. Никакого экзистенциального срыва. Лишь тихое, неприятное открытие: я перестала думать за себя… и даже не заметила, как это случилось.

Читать далее

Проактивный риск-ориентированный подход в управлении технологическими процессами

Уровень сложностиСредний
Время на прочтение15 мин
Охват и читатели6.1K

В последнее десятилетие в сфере информационных технологий широкое распространение получили системы с искусственным интеллектом, это обусловлено огромным объёмом цифровых данных, накопленных к настоящему моменту, для обработки и анализа которых потребовались новые технологии.

В промышленной автоматизации системы обработки и анализа данных как с технологиями искусственного интеллекта, так и с методами классического математического анализа менее распространены несмотря на то, что каждое предприятие, оснащённое АСУ ТП, обладает значительной базой цифровых данных.

В настоящей статье излагаются принципы проактивного риск-ориентированного подхода к управлению технологическими процессами.

В первую очередь эта статья ориентирована на технических руководителей промышленных предприятий и эксплуатирующий персонал, так как понимание изложенных принципов поможет не ошибиться в своих ожиданиях от внедрения соответствующих систем, а главное эффективно их использовать, обеспечивая снижение ремонтных затрат и минимизируя риски возникновения аварий.

Читать далее

Сравнительный анализ 18 LLM моделей: конец монополии?

Уровень сложностиПростой
Время на прочтение11 мин
Охват и читатели16K

🏆 Open-Source Догнал Топов: Что Произошло в Ноябре 2025?

Конец монополии! Kimi-K2-Thinking (MIT-лицензия) — новый чемпион мысли. Эта open-source модель сравнялась с Claude Sonnet 4, показала 84.5% на GPQA Diamond (научное рассуждение) и 94.5-100% на олимпиадной математике AIME, опередив GPT-4o более чем на 30 процентных пунктов.

Российский GigaChat3-702B взрывает кодинг! Сбер выпустил модель с архитектурой MoE (702B параметров) под MIT-лицензией, которая показала мировой рекорд на бенчмарке HumanEval+ (86.59%), обойдя все закрытые LLM, включая GPT и Claude.

MoE-магия для локального запуска: Qwen3-30B-A3B с архитектурой MoE (3.3B активных параметров) обеспечивает качество 70B+ модели, умещаясь на одной H100 — идеальный компромисс для стартапов и R&D.

Читать далее

Matrix: распределенный мультиагентный фреймворк для генерации синтетических данных

Время на прочтение4 мин
Охват и читатели7.3K

Не секрет, что ИИ-агентов часто используют для генерации синтетических данных. Но когда агентам дают одновременно более двух тысяч заданий, агенты сталкиваются с пределом производительности. 

Почему это происходит? Новое исследование предполагает парадоксальный ответ. Проблема не в вычислениях и не в размере моделей. Фактический потолок производительности определяется архитектурой — в частности, централизованным диспетчером, который координирует работу агентов. Как только мы убираем этот диспетчер, узкое место исчезает. И это довольно неожиданно, что запредельную масштабируемость агентных систем можно получить с помощью одного простого изменения. 

Давайте поговорим о том, как замена централизованной архитектуры на одноранговую сеть агентов снимает ограничение масштабируемости и почему это важно.

Читать далее

ИИ клонирует себя без спроса — что будет дальше?

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели9.6K

Я помню тот самый момент в «Матрице: Перезагрузка», когда Агент Смит, уже не связанный правилами системы, смотрит на Нео и говорит:

«Я, я… и я тоже!»

И внезапно их становится сотня. Вся площадь заполнена одинаковыми агентами в одинаковых костюмах, все движутся с одинаковой точностью, и у всех на лице та же самая тревожная улыбка.

Я тогда училась в аспирантуре, и эта сцена меня до смерти напугала. Да, я наслаждалась кунг-фу и спецэффектами, которые до сих пор выглядят потрясающе. Но сама идея машины, кода, способного к самокопированию - к чему-то, что он решает сам, - не давала и до сих пор не даёт мне покоя.

Читать далее

Глубокое обучение сверточной нейросети — и фермерский лосось больше не притворится диким

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели10K

Даже если лосось совершил дерзкий побег с рыбной фермы и теперь изо всех сил пытается сойти за коренного обитателя диких вод, его выдаст собственная «одежда».

Журнал Biology Methods and Protocols сообщает отличную новость для экологов и скверную — для рыб-самозванцев: глубокое обучение научилось безошибочно отличать дикого лосося от выращенного в неволе. Вся соль метода — в анализе чешуи, которая, как выяснилось, красноречивее любого паспорта.

Как они это сделали? И зачем вообще?

Google и Microsoft на мели. Вся правда о долге на $100 миллиардов, который от нас скрывают

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели21K

Вся история с генеративным ИИ держалась на одном главном мифе - теории о том, что «взрослые всё контролируют». Это была та самая подушка безопасности, которая в умах людей отделяла нынешнее безумие от катастрофического краха доткомов.

Нам внушали, что на этот раз всё иначе, ведь у руля стоят не какие-то хлипкие стартапы, сжигающие венчурный капитал на доставку кошачьего корма. Нет, это Nvidia, Google, Microsoft, *Meta и Amazon. А те немногие лидеры, что всё-таки являются стартапами, вроде OpenAI и Anthropic, надёжно прикрыты сделками с технологическими гигантами.

Читать далее

ИИ-ассистенты: как AI делит рынок разработки

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели8.2K

Команда AI for Devs подготовила перевод статьи о том, как быстро растущие AI-ассистенты меняют саму природу разработки. Их код выглядит безупречно — но всё чаще решает не ту задачу, что стоит перед нами. Где проходит граница между ускорением и самообманом, и какую новую ответственность это накладывает на инженеров?

Читать далее

Ближайшие события

Решаем задачи ML эффективнее: платформа, которая экономит ресурсы, время и нервы

Уровень сложностиСредний
Время на прочтение6 мин
Охват и читатели10K

Привет! Я Олег Бугримов, руковожу командой разработки ML-платформы в Авито. В статье расскажу, почему мы решили делать ML-платформу и какие инструменты у нас уже есть. Материал будет полезен ML-инженерам и техлидам, которые хотят сократить время на рутину, обеспечить команду единым набором инструментов, а также повысить качество и скорость разработки ML‑решений.

Читать далее

Qwen3Guard: следующий шаг в модерации и контроле контента

Время на прочтение6 мин
Охват и читатели7.8K

Всем привет! Меня зовут Миша Мартьянов, я инженер по исследованиям и разработке в лаборатории AI R&D в red_mad_robot. В мои задачи входит проверка гипотез и развитие наших продуктов. Однако недостаточно просто улучшать продукты, необходимо также чтобы они работали устойчиво и безопасно. 

Ранее я рассказывал разработку идеального контент-фильтра на базе Guardrails. Но время не стоит на месте: появляются новые модели и новые практики их применения. Этому и будет посвящён наш сегодняшний разговор.

Читать далее

Kandinsky 5.0: линейка open-source моделей генерации изображений и видео нового поколения

Уровень сложностиСложный
Время на прочтение9 мин
Охват и читатели11K

В сентябре мы открыли доступ к Kandinsky 5.0 Video Lite, лёгкой модели с 2 млрд параметров для создания видео по тексту или на основе изображения. Теперь мы выкладываем в open source и все остальные модели линейки Kandinsky 5.0: Video Pro и Image Lite!

Читать далее

«Господин Говорунъ: как я обучил маленькую модель разговаривать на дореформенном русском»

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели9.7K

Я обучил небольшую языковую модель, которая отвечает на дореформенном русском как человек из XIX века.

Рассказываю, как подготовил данные, собрал синтетический корпус, обучил tiny-LLM и опубликовал её в виде чат-бота.

Читать далѣе

Как прошла международная конференция ISKE 2025 в области AI и ML

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели6.7K

Всем привет! С вами снова на связи Кирилл, и я только вернулся из своей недельной поездки в Китай на конференцию International Conference on Intelligent Systems and Knowledge Engineering (ISKE 2025), где я выступал с новой разработкой. Я бы хотел поделиться новыми открытиями, достижениями в области ML и ИИ. Немного раскрыть представление об AI и его применении в Китае, да и по миру в целом. Так что усаживайтесь по удобнее, заварите чаек, кофеек – и вперед читать новые инсайты!

Читать далее

ИИ-ассистент в M42: как мы в Авито ускорили построение графиков и увеличили аудиторию в Trisigma

Уровень сложностиСредний
Время на прочтение16 мин
Охват и читатели5.7K

Привет! Меня зовут Андрей Старостин, я DS-инженер в аналитической платформе в Авито. В этой статье я расскажу об устройстве и внедрении сервиса-ассистента на основе искусственного интеллекта для упрощения работы с аналитическими данными в нашем продукте M42 внутри Trisigma

Читать далее

DeepSeek-OCR + LLama4 + RAG = Революция в мире агентного OCR

Уровень сложностиПростой
Время на прочтение10 мин
Охват и читатели20K

В выходные я просматривал Твиттер, чтобы узнать, что происходит в сфере ИИ. И снова DeepSeek привлек внимание всего мира.

Это не просто очередной инструмент для распознавания текста, а новая технология контекстного оптического сжатия, которая использует визуальные методы для решения проблемы обработки длинных текстов, предлагая новый подход к работе с огромными массивами информации.

Любой, кто пользовался большой языковой моделью (LLM), сталкивался с такой проблемой:

Когда вы просите модель обобщить десятки тысяч слов из конспектов конференций или научных статей, она начинает терять память.

Это происходит потому, что квадратичная сложность длины последовательности по своей сути ограничивает GPT, Gemini и Claude - чем длиннее входные данные, тем больше вычислительной мощности требуется.

Читать далее

Вклад авторов