Все потоки

Машинное обучение *

Основа искусственного интеллекта

СтатьиПостыНовостиАвторыКомпании

Neurosonya 1 час назад

ИИ-помощники для Python: как выбрать между чат-песочницей, IDE-ассистентом, агентами и open-source

Простой

9 мин

145

Python * Текстовые редакторы и IDE * Машинное обучение * GitHub * Open source *

Обзор

Recovery Mode

В 2025-м помощники для Python распались на 4 класса: онлайн-чаты с изолированной песочницей, IDE-плагины, автономные агенты и локальные/открытые модели. Разбираемся, что чем отличается, где уместно, сколько стоит и на что смотреть разработчикам при выборе. А так же примеры кода.

Читать далее

0

alkons 1 час назад

Контролируемый вайб-кодинг: как делать это правильно

7 мин

248

Блог компании Cloud.ruIT-инфраструктура * Искусственный интеллектПрограммирование * Машинное обучение *

По-моему, вайб-кодинг — полезная фича, но я знаю, что многие его недолюбливают и считают, что AI генерит чушь, а не нормальный код. Ну тут я могу сказать как в той рекламе с гепардом: «Ты просто не умеешь их готовить».

Я начал заниматься вайб-кодингом 2 года назад (привет первая версия GPT Engineer), то есть еще до того, как ввели сам термин (он появился только в этом году). За это время у меня накопился опыт, который я переложил в небольшие рекомендации, возможно они помогут начинающим вайб-кодерам.

Вообще вайб-кодинг, это, конечно, огромная тема. Думаю, сделать серию из нескольких статей: здесь начну с теории, а потом покажу практику, как я настраиваю окружение и вообще весь процесс.

Читать дальше

-2

Sivchenko_translate 4 часа назад

BERT — это всего лишь одноэтапная диффузия текста

9 мин

298

Машинное обучение * Natural Language Processing * Искусственный интеллектПрограммирование *

Перевод

Некоторое время назад компания Google DeepMind представила Gemini Diffusion — экспериментальную языковую модель, генерирующую текст методом диффузии. В отличие от традиционных моделей, написанных в стиле GPT и генерирующих слово за словом, Gemini создаёт текст целыми блоками, пошагово уточняя случайный шум.

Я прочитал статью «Large Language Diffusion Models» — и с удивлением узнал, что дискретная диффузия языка представляет собой просто обобщение метода генерации пропущенного токена (MLM), практикуемого уже с 2018 года. Я сразу подумал: «А можно ли тонко настроить BERT-подобную модель так, чтобы приспособить её к генерации текста?» Из чистого любопытства решил наскоро набросать проверку концепции.

Примечание: уже после того, как написал эту статью, я наткнулся на исследование DiffusionBERT, где сделано практически то же самое, что и у меня, но проект гораздо тщательнее протестирован. Посмотрите этот пост, если тема вас заинтересовала.

Читать далее

+6

admitrya 4 часа назад

Как автоматизировать тестирование батч-моделей? Гайд

Средний

8 мин

119

Блог компании Альфа-БанкТестирование IT-систем * Машинное обучение *

Туториал

Всем привет, меня зовут Дмитрий, я — MLE в Альфа-Банке, занимаюсь автоматизацией процессов и оптимизацией моделей, ищу в моделях проблемы и решаю их.

В прошлом году ко мне пришли ребята из отдела тестирования и задали два вопроса: «Как тестирование батч-моделей можно автоматизировать?» и «Что для этого нужно?». Коллеги поделились наболевшей историей, что в большинстве моделей выполняемые проверки повторяются. Выслушав весь запрос, я спроектировал и реализовал систему автоматического тестирования, о чём и расскажу в этой статье. Также здесь будут технические детали реализации, архитектурные решения и полученные результаты.

Статья будет полезна не только специалистам по автоматизации процессов тестирования, а и ML-инженерам, MLOps-специалистам и командам разработки, занимающимся поддержкой продакшн-систем машинного обучения.

Читать далее

+5

andre_dataist 14 часов назад

Агентная операционная система — новая парадигма взаимодействия человека и машины

4 мин

1K

Машинное обучение * Искусственный интеллект

Обзор

Раньше голосовой ассистент в телефоне был просто еще одной кнопкой — попросил включить будильник, получил результат и разговор закончен. Но мобильные интерфейсы усложнились: привычные сценарии часто ломаются, если что-то изменилось на экране. На практике выясняется, что ИИ-агенты, даже самые продвинутые, часто путаются в простых вещах — теряют суть задачи, не могут учесть предпочтения человека и забывают свои же действия спустя пару шагов.

Исследователи показали, что дело не столько в размере моделей, сколько в том, как они учатся рассуждать и адаптироваться к реальному взаимодействию. Вместо агента, который просто кликает за пользователя, появился агент, который держит контекст, реально пытается понять, что именно нужно, и даже сам уточняет детали по ходу сценария.

В этом обзоре посмотрим, как шаг за шагом учат такие модели быть ближе к человеку — помнить, ошибаться и учиться на своих ошибках, идти навстречу даже в нестандартных ситуациях. Это меняет представление о будущем ИИ-систем и показывает, на что они будут способны буквально завтра.

Читать далее

0

gametwix 22 часа назад

Как я экономлю на инференсе LLM-модели в облаке и не теряю в качестве

7 мин

1.5K

Блог компании Cloud.ruIT-инфраструктура * Машинное обучение * Искусственный интеллектОблачные сервисы *

Если вы читаете этот текст, скорее всего, вы уже пробовали запустить LLM самостоятельно. И, вполне вероятно, столкнулись с одной из типичных проблем:

«Заказал GPU, загрузил модель, а она не влезла, хотя по расчетам памяти должно было хватить».

«Платим за A100, а реально используем лишь 30% ее мощности».

Привет, я Павел, ML-инженер в Cloud.ru. И я прошел через эти проблемы сам, поэтому не понаслышке знаю, как это может раздражать.

Сегодня на примере настройки фреймворка VLLM покажу, как запускать крупные языковые модели без переплат за GPU. Мы разберемся, как VLLM распределяет vRAM, какие его параметры действительно влияют на потребление памяти и производительность, и как с их помощью гибко управлять балансом между затратами, скоростью и качеством модели.

Читать далее

+6

Maxim_Santalov 22 часа назад

Джун глазами синьора: 5 ошибок в резюме, которые снижают ваши шансы попасть в ML

Простой

6 мин

5K

Блог компании Первая грузовая компания (ПГК)Карьера в IT-индустрииМашинное обучение *

Мнение

Привет! Я Максим Катрушенко, главный специалист по анализу данных и машинному обучению в ПГК Диджитал. И я тот самый человек, который просматривал десятки резюме каждый день во время поиска стажёра или джуна на позицию в нашу компанию. Из 56 кандидатов до оффера дошло два человека. И знаете, что? Большинство отсеялось именно на этапе первичного просмотра резюме — не потому что кандидаты слабые, а потому что не могут правильно себя презентовать.

Важный момент: на позицию джуна мы не искали готового специалиста — иначе искали бы мидла. Нам был нужен человек, который:

- может показать, что он делал своими руками, а не просто "изучал теорию";

- понимает, почему выбрал конкретный подход к решению задачи;

- осознаёт, что ML — это на 80% работа с данными и только на 20% — модели.

Сила резюме начинающего специалиста — в умении показать свой потенциал через конкретные действия, даже если опыта пока немного. Прошли курс? Покажите проект после него. Написали модель? Объясните ход мыслей.

Давайте разберём типичные ошибки на реальных примерах. Имена изменены, ситуации — настоящие.

Читать далее

+3

Wonderlove 23 часа назад

Нейро-дайджест: ключевые события мира AI за 4-ю неделю октября 2025

Простой

6 мин

677

Блог компании Timeweb CloudИскусственный интеллектБудущее здесьIT-компанииМашинное обучение *

Дайджест

Привет! Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.

Неделя выдалась интересной: Anthropic выкатили лёгкую Claude Haiku 4.5, Suno 4.5 открыли бесплатно, Microsoft включила голосового агента в Windows 11, а OpenAI показали ИИ-браузер ChatGPT Atlas, пока ИИ уже пишет половину текстов в сети.

Всё самое важное — в одном месте. Поехали!

Читать дайджест →

+15

kmamonov вчера в 11:02

Что такое шопсы? И как мы размечаем shoppable-контент

Средний

7 мин

246

Блог компании VKМашинное обучение * Искусственный интеллектСоциальные сетиУправление e-commerce *

Кейс

Недавно ВКонтакте запустила новый формат контента — шопсы. Это публикации с карточками товаров или ссылками, по которым можно быстро оформить покупку. Формат появился не с нуля: в соцсети уже давно органически росла доля публикаций, где в кадре так или иначе фигурировали какие‑то товары. Однако не каждая такая единица контента способна стимулировать к покупке. Как выявить нужный и сделать так, чтобы человек видел не просто красивую картинку с товаром, а интересный, кликабельный и вовлекающий контент, который действительно ведёт к покупке? Ответ — в правильной разметке.

В этой статье расскажем, как мы искали оптимальное определение shoppable, как работает наш классификатор, зачем мы подключили генеративные модели и каких результатов уже добились.

Материал подготовили Святослав Васильев, менеджер продукта ВКонтакте, и Кирилл Мамонов, руководитель предиктивной аналитики AI VK.

Читать далее

+11

kucev вчера в 11:00

Плюсы и минусы платформы автоматизации рабочих процессов n8n

17 мин

3K

Data Mining * Искусственный интеллектМашинное обучение * Big Data * Data Engineering *

Перевод

Бизнес всегда стремится к большей эффективности — делать больше, затрачивая меньше времени и ресурсов. Один из способов достичь этого — использование программ для автоматизации рабочих процессов, которые берут на себя повторяющиеся и трудоемкие задачи, от поддержки клиентов до формирования отчетов.

Среди множества доступных решений n8n привлекает внимание своей гибкостью, открытым исходным кодом и способностью справляться со сложными процессами. Но, как и любой мощный инструмент, он имеет сильные и слабые стороны. В этой статье мы подробно рассмотрим плюсы и минусы использования n8n, чтобы помочь вам решить, подходит ли он для ваших задач по автоматизации.

Читать далее

+6

akakunin вчера в 09:36

Как я распознавание лиц к Yandex Disk-у прикручивал

Средний

25 мин

628

JavaScript * Машинное обучение *

Туториал

«Крошка сын к отцу пришел и спросила крошка...»

Ну не сын на самом деле, а дочка, но пришла и спросила: «Паааап, у подруги тут ДР, вытащи мне из фотоархива все фото где мы с ней вместе». Да легко!

Читать далее

+1

ph_piter вчера в 09:31

Книга: «Строим LLM с нуля»

3 мин

6.2K

Блог компании Издательский дом «Питер»Профессиональная литература * Программирование * Машинное обучение * Искусственный интеллект

Привет, Хаброжители! Говорят, что физик Ричард Фейнман однажды сказал: «Я не понимаю того, чего не могу создать». Основываясь на этом же важном принципе, автор бестселлеров Себастьян Рашка шаг за шагом ведет вас к созданию LLM в стиле GPT, которую вы сможете запустить на своем ноутбуке. Это увлекательная книга, которая охватывает каждый этап процесса — от планирования и кодирования до обучения и тонкой настройки.

Читать далее

+11

full_moon вчера в 08:43

Проблема «черного ящика»: как заставить ИИ объяснять свои решения

20 мин

462

Блог компании Magnus TechИскусственный интеллектМашинное обучение * Исследования и прогнозы в IT *

Начну с реального случая: в 2023 году американский юрист Стивен Шварц использовал ChatGPT для подготовки судебного иска. Система уверенно создала юридический документ с многочисленными ссылками на прецеденты. С одним нюансом — все цитируемые дела оказались полностью выдуманными. Более того, когда юрист попросил ChatGPT проверить достоверность источников, система с той же уверенностью «подтвердила» подлинность несуществующих судебных решений.

И это не единичный случай. Современные нейронные сети стали настолько сложными, что мы перестали понимать, как они принимают решения. Почему беспилотный автомобиль внезапно поворачивает не туда? По какой причине система медицинской диагностики пропустила опухоль на рентгеновском снимке? В таких критических случаях простого «доверия» к ИИ недостаточно — важно понимать, почему система принимает то или иное решение. Именно об этом и поговорим в статье.

Читать далее

+9

kpshinnik вчера в 07:55

Gemini за полчаса решила то, что не осилили топовые программисты мира

Простой

4 мин

14K

HabrИскусственный интеллектМашинное обучение * Программирование * Спортивное программирование *

Мнение

Привет, Хабр! Меня зовут Кирилл Пшинник, я научный сотрудник Университета Иннополис и CEO онлайн-университета zerocoder.ru. Поговорим о прорыве, совершенном Google DeepMind, и о том, можно ли это вообще считать прорывом.

В сентябре нейросети «обскакали» студентов на Международной студенческой олимпиаде по программированию в Баку. Они были во внеконкурсе, но если бы участвовали на общей основе, то GPT-5 заняла бы первое место, решив 12 заданий из 12, а Gemini 2.5 Deep Think — второе с 10 заданиями из 12. И самое интересное: всего за полчаса «гугловская» нейросеть справилась с задачей «C», которую не смогла решить ни одна из человеческих команд.

Читать далее

-9

MaximML вчера в 07:02

Как создать AI-аналитика во время учебы: кейс выпускного проекта студентов Школы аналитиков данных МТС

7 мин

1.2K

Блог компании МТСМашинное обучение * Учебный процесс в ITКарьера в IT-индустрии

Кейс

Привет, Habr! На связи Максим Шаланкин из команды Школы аналитиков данных МТС. Каждый год наши студенты в качестве итогового проекта решают реальные бизнес-задачи, и этот не стал исключением. Четверо выпускников — Анна Шестакова, Григорий Суханов, Михаил Футьянов, Алексей Жданов — создали InsightFinder, мультиагентную систему для автоматического анализа данных (EDA). Этот проект автоматизирует EDA и бизнес-интерпретацию данных, сокращая рутинный процесс с нескольких часов до пяти минут.

Добавление бизнес-интерпретации повышает вариативность использования: проект становится полезным инструментом как для специалистов Data Scientist или Data Analyst, так и для менеджеров, которые занимаются развитием продуктов и которым нужна быстрая проверка гипотез.

В этом материале я не только покажу результат работы ребят, но и дам подробное руководство, как создать такое решение самостоятельно. Это будет полезно всем, кто интересуется применением LLM в аналитике, мультиагентными системами и следит за развитием анализа данных.

Читать далее

+13

etydovprek вчера в 01:06

Генеративный ИИ как штатный инженер техподдержки: настройка, внедрение, реальные ошибки

Сложный

3 мин

1.1K

Искусственный интеллектМашинное обучение * Системное администрирование * DevOps *

Кейс

Эксперимент, начавшийся как попытка автоматизировать ответы на тикеты, закончился созданием почти самостоятельного "сотрудника" службы поддержки. В статье рассказываю, как мы внедряли генеративную модель в техподдержку, как настраивали контекст, ловили баги. Много практики, немного самоиронии и код, который заставил rethink-нуть наш пайплайн поддержки.

Читать далее

-1

cognitronn 22 окт в 13:35

Нейросеть для генерации текста (изи райтер на ботхабе)

Простой

3 мин

1.2K

Блог компании BotHubИскусственный интеллектМашинное обучение * Будущее здесьНаучно-популярное

Обзор

Ещё пару лет назад искусственный интеллект ассоциировался с чем угодно, только не с творчеством. Его использовали в банках, аналитике, промышленности. Но сегодня ИИ всё чаще появляется там, где важен не расчёт, а идея.

Да, на Хабре вы не привыкли доверять таким инструментам, я все понимаю. Здесь делятся статьями, которые написаны вручную. Но давайте не будем торопиться с выводами. ИИ не заменит хорошего писателя, но, возможно, станет вашим помощником.

Приятного прочтения!

Читать далее

+10

RuslanTsitser 22 окт в 10:54

Когда важна каждая миллисекунда: оптимизация съёмки для CV и AR

Средний

12 мин

1.6K

Блог компании 2ГИСFlutter * Dart * Машинное обучение * Искусственный интеллект

Кейс

2ГИС Ситискан — это мобильное приложение для автоматизированной съёмки городской среды. Оно устанавливается на смартфон, закреплённый в автомобиле, и во время движения делает снимки, собирает координаты, скорость и другие параметры. Эти данные обрабатываются с помощью ИИ, чтобы находить проблемы в инфраструктуре: ямы, мусор, повреждённые объекты и другое.

Одна из ключевых задач приложения — снимать изображения с высокой частотой, особенно при объездах сложных участков. Но на практике оказалось, что стандартный метод съёмки takePicture во Flutter может занимать до 3 секунд на один кадр. Это делает невозможной съёмку даже 1 кадра в секунду, не говоря уже о 4 кадрах, которые нам нужны для точного анализа.

В этой статье мы — Руслан Цицер и Арген Жукеев @zhukeev— расскажем, как исследовали узкие места, перепробовали разные подходы — от RepaintBoundary до нативной обработки на C и Java — и в итоге добились стабильной съёмки с минимальной задержкой. Наш кейс будет полезен Flutter-разработчикам, которым необходима высокая частота съёмки (до 4 fps и выше) для своих приложений и инженерам в области компьютерного зрения и машинного обучения или разработчики AR/VR-решений на Flutter, где важны каждая миллисекунда и каждый пиксель.

Читать далее

+12

andre_dataist 22 окт в 09:52

Эпоха автономных аналитиков: как ИИ меняет науку о данных

4 мин

1K

Машинное обучение * Искусственный интеллект

Обзор

Мы думали, что аналитика с помощью ИИ сможет освободить нас от рутинных задач, но она оказалась бессильна перед неожиданными ситуациями. Даже самые совершенные ИИ-агенты не справляются, когда дело касается задач, выходящих за рамки заранее установленных сценариев. Агенты сталкиваются с трудностями при выполнении задач, требующих адаптивности и самостоятельного мышления. В то время как разговорные модели демонстрируют впечатляющие успехи, «автоматический дата саентист» почему-то не может преодолеть этот барьер и достичь полной самостоятельности.

Последнее исследование привнесло неожиданный поворот: эффективность не определяется размером модели или набором жестких правил, а обусловлена самой конструкцией ее рассуждений. Модель освоила не просто последовательное выполнение отдельных задач, но и гибкое управление анализом данных. Она научилась понимать ход событий, планировать действия, корректировать подход в процессе, экспериментировать с новыми подходами, допускать ошибки и учиться на собственном опыте, при этом все меньше полагаясь на вмешательство человека.

Что лежит в основе этой «встроенной интуиции»? Давайте разберемся в возможностях модели DeepAnalyze-8B и методах ее обучения, а также рассмотрим, как это может повлиять на сферу продвинутой аналитики и искусственного интеллекта.

Читать далее

0

ph_piter 22 окт в 08:56

Передовые алгоритмы глубокого обучения

29 мин

2K

Блог компании Издательский дом «Питер»Машинное обучение * Алгоритмы * Python *

Привет, Хаброжители! Мы хотим поделиться с вами главой из книги «Алгоритмы машинного обучения» , которую уже можно предзаказать на нашем сайте.

В этой главе

1.Вариационные автоэнкодеры для обнаружения аномалий временных рядов

2.Сети смешанной плотности, использующие амортизированный вариационный вывод

3.Механизм внимания и трансформеры

4.Графовые нейронные сети

5. Исследования в области ML: глубокое обучение

Читать далее

+5

1

2 3 ...