Все потоки

Машинное обучение *

Основа искусственного интеллекта

СтатьиПостыНовостиАвторыКомпании

kmamonov 23 окт в 11:02

Что такое шопсы? И как мы размечаем shoppable-контент

Средний

7 мин

6.7K

Блог компании VKМашинное обучение * Искусственный интеллектСоциальные сетиУправление e-commerce *

Кейс

Недавно ВКонтакте запустила новый формат контента — шопсы. Это публикации с карточками товаров или ссылками, по которым можно быстро оформить покупку. Формат появился не с нуля: в соцсети уже давно органически росла доля публикаций, где в кадре так или иначе фигурировали какие‑то товары. Однако не каждая такая единица контента способна стимулировать к покупке. Как выявить нужный и сделать так, чтобы человек видел не просто красивую картинку с товаром, а интересный, кликабельный и вовлекающий контент, который действительно ведёт к покупке? Ответ — в правильной разметке.

В этой статье расскажем, как мы искали оптимальное определение shoppable, как работает наш классификатор, зачем мы подключили генеративные модели и каких результатов уже добились.

Материал подготовили Святослав Васильев, менеджер продукта ВКонтакте, и Кирилл Мамонов, руководитель предиктивной аналитики AI VK.

Читать далее

+40

kucev 23 окт в 11:00

Плюсы и минусы платформы автоматизации рабочих процессов n8n

17 мин

11K

Блог компании Data Feeling School | ИИ агенты и автоматизация на n8nData Mining * Искусственный интеллектМашинное обучение * Big Data *

Перевод

Бизнес всегда стремится к большей эффективности — делать больше, затрачивая меньше времени и ресурсов. Один из способов достичь этого — использование программ для автоматизации рабочих процессов, которые берут на себя повторяющиеся и трудоемкие задачи, от поддержки клиентов до формирования отчетов.

Среди множества доступных решений n8n привлекает внимание своей гибкостью, открытым исходным кодом и способностью справляться со сложными процессами. Но, как и любой мощный инструмент, он имеет сильные и слабые стороны. В этой статье мы подробно рассмотрим плюсы и минусы использования n8n, чтобы помочь вам решить, подходит ли он для ваших задач по автоматизации.

Читать далее

+10

akakunin 23 окт в 09:36

Как я распознавание лиц к Yandex Disk-у прикручивал

Средний

25 мин

6K

JavaScript * Машинное обучение *

Туториал

«Крошка сын к отцу пришел и спросила крошка...»

Ну не сын на самом деле, а дочка, но пришла и спросила: «Паааап, у подруги тут ДР, вытащи мне из фотоархива все фото где мы с ней вместе». Да легко!

Читать далее

+1

ph_piter 23 окт в 09:31

Книга: «Строим LLM с нуля»

3 мин

14K

Блог компании Издательский дом «Питер»Машинное обучение * Программирование * Профессиональная литература * Искусственный интеллект

Привет, Хаброжители! Говорят, что физик Ричард Фейнман однажды сказал: «Я не понимаю того, чего не могу создать». Основываясь на этом же важном принципе, автор бестселлеров Себастьян Рашка шаг за шагом ведет вас к созданию LLM в стиле GPT, которую вы сможете запустить на своем ноутбуке. Это увлекательная книга, которая охватывает каждый этап процесса — от планирования и кодирования до обучения и тонкой настройки.

Читать далее

+12

full_moon 23 окт в 08:43

Проблема «черного ящика»: как заставить ИИ объяснять свои решения

20 мин

6.4K

Блог компании Magnus TechИскусственный интеллектМашинное обучение * Исследования и прогнозы в IT *

Начну с реального случая: в 2023 году американский юрист Стивен Шварц использовал ChatGPT для подготовки судебного иска. Система уверенно создала юридический документ с многочисленными ссылками на прецеденты. С одним нюансом — все цитируемые дела оказались полностью выдуманными. Более того, когда юрист попросил ChatGPT проверить достоверность источников, система с той же уверенностью «подтвердила» подлинность несуществующих судебных решений.

И это не единичный случай. Современные нейронные сети стали настолько сложными, что мы перестали понимать, как они принимают решения. Почему беспилотный автомобиль внезапно поворачивает не туда? По какой причине система медицинской диагностики пропустила опухоль на рентгеновском снимке? В таких критических случаях простого «доверия» к ИИ недостаточно — важно понимать, почему система принимает то или иное решение. Именно об этом и поговорим в статье.

Читать далее

+11

kpshinnik 23 окт в 07:55

Gemini за полчаса решила то, что не осилили топовые студенты-программисты на олимпиаде

Простой

4 мин

24K

Искусственный интеллектМашинное обучение * Программирование * Спортивное программирование *

Мнение

Привет, Хабр! Меня зовут Кирилл Пшинник, я научный сотрудник Университета Иннополис и CEO онлайн-университета zerocoder.ru. Поговорим о прорыве, совершенном Google DeepMind, и о том, можно ли это вообще считать прорывом.

В сентябре нейросети «обскакали» студентов на Международной студенческой олимпиаде по программированию в Баку. Они были во внеконкурсе, но если бы участвовали на общей основе, то GPT-5 заняла бы первое место, решив 12 заданий из 12, а Gemini 2.5 Deep Think — второе с 10 заданиями из 12. И самое интересное: всего за полчаса «гугловская» нейросеть справилась с задачей «C», которую не смогла решить ни одна из человеческих команд.

Читать далее

-8

MaximML 23 окт в 07:02

Как создать AI-аналитика во время учебы: кейс выпускного проекта студентов Школы аналитиков данных МТС

7 мин

6.4K

Блог компании МТСМашинное обучение * Учебный процесс в ITКарьера в IT-индустрии

Кейс

Привет, Habr! На связи Максим Шаланкин из команды Школы аналитиков данных МТС. Каждый год наши студенты в качестве итогового проекта решают реальные бизнес-задачи, и этот не стал исключением. Четверо выпускников — Анна Шестакова, Григорий Суханов, Михаил Футьянов, Алексей Жданов — создали InsightFinder, мультиагентную систему для автоматического анализа данных (EDA). Этот проект автоматизирует EDA и бизнес-интерпретацию данных, сокращая рутинный процесс с нескольких часов до пяти минут.

Добавление бизнес-интерпретации повышает вариативность использования: проект становится полезным инструментом как для специалистов Data Scientist или Data Analyst, так и для менеджеров, которые занимаются развитием продуктов и которым нужна быстрая проверка гипотез.

В этом материале я не только покажу результат работы ребят, но и дам подробное руководство, как создать такое решение самостоятельно. Это будет полезно всем, кто интересуется применением LLM в аналитике, мультиагентными системами и следит за развитием анализа данных.

Читать далее

+28

cognitronn 22 окт в 13:35

Нейросеть для генерации текста (изи райтер на ботхабе)

Простой

3 мин

9.7K

Блог компании BotHubИскусственный интеллектМашинное обучение * Будущее здесьНаучно-популярное

Обзор

Ещё пару лет назад искусственный интеллект ассоциировался с чем угодно, только не с творчеством. Его использовали в банках, аналитике, промышленности. Но сегодня ИИ всё чаще появляется там, где важен не расчёт, а идея.

Да, на Хабре вы не привыкли доверять таким инструментам, я все понимаю. Здесь делятся статьями, которые написаны вручную. Но давайте не будем торопиться с выводами. ИИ не заменит хорошего писателя, но, возможно, станет вашим помощником.

Приятного прочтения!

Читать далее

+10

RuslanTsitser 22 окт в 10:54

Когда важна каждая миллисекунда: оптимизация съёмки для CV и AR

Средний

12 мин

8.3K

Блог компании 2ГИСFlutter * Dart * Машинное обучение * Искусственный интеллект

Кейс

2ГИС Ситискан — это мобильное приложение для автоматизированной съёмки городской среды. Оно устанавливается на смартфон, закреплённый в автомобиле, и во время движения делает снимки, собирает координаты, скорость и другие параметры. Эти данные обрабатываются с помощью ИИ, чтобы находить проблемы в инфраструктуре: ямы, мусор, повреждённые объекты и другое.

Одна из ключевых задач приложения — снимать изображения с высокой частотой, особенно при объездах сложных участков. Но на практике оказалось, что стандартный метод съёмки takePicture во Flutter может занимать до 3 секунд на один кадр. Это делает невозможной съёмку даже 1 кадра в секунду, не говоря уже о 4 кадрах, которые нам нужны для точного анализа.

В этой статье мы — Руслан Цицер и Арген Жукеев @zhukeev— расскажем, как исследовали узкие места, перепробовали разные подходы — от RepaintBoundary до нативной обработки на C и Java — и в итоге добились стабильной съёмки с минимальной задержкой. Наш кейс будет полезен Flutter-разработчикам, которым необходима высокая частота съёмки (до 4 fps и выше) для своих приложений и инженерам в области компьютерного зрения и машинного обучения или разработчики AR/VR-решений на Flutter, где важны каждая миллисекунда и каждый пиксель.

Читать далее

+12

andre_dataist 22 окт в 09:52

Эпоха автономных аналитиков: как ИИ меняет науку о данных

4 мин

5.6K

Машинное обучение * Искусственный интеллект

Обзор

Мы думали, что аналитика с помощью ИИ сможет освободить нас от рутинных задач, но она оказалась бессильна перед неожиданными ситуациями. Даже самые совершенные ИИ-агенты не справляются, когда дело касается задач, выходящих за рамки заранее установленных сценариев. Агенты сталкиваются с трудностями при выполнении задач, требующих адаптивности и самостоятельного мышления. В то время как разговорные модели демонстрируют впечатляющие успехи, «автоматический дата саентист» почему-то не может преодолеть этот барьер и достичь полной самостоятельности.

Последнее исследование привнесло неожиданный поворот: эффективность не определяется размером модели или набором жестких правил, а обусловлена самой конструкцией ее рассуждений. Модель освоила не просто последовательное выполнение отдельных задач, но и гибкое управление анализом данных. Она научилась понимать ход событий, планировать действия, корректировать подход в процессе, экспериментировать с новыми подходами, допускать ошибки и учиться на собственном опыте, при этом все меньше полагаясь на вмешательство человека.

Что лежит в основе этой «встроенной интуиции»? Давайте разберемся в возможностях модели DeepAnalyze-8B и методах ее обучения, а также рассмотрим, как это может повлиять на сферу продвинутой аналитики и искусственного интеллекта.

Читать далее

+2

ph_piter 22 окт в 08:56

Передовые алгоритмы глубокого обучения

29 мин

5.7K

Блог компании Издательский дом «Питер»Машинное обучение * Алгоритмы * Python *

Привет, Хаброжители! Мы хотим поделиться с вами главой из книги «Алгоритмы машинного обучения» , которую уже можно предзаказать на нашем сайте.

В этой главе

1.Вариационные автоэнкодеры для обнаружения аномалий временных рядов

2.Сети смешанной плотности, использующие амортизированный вариационный вывод

3.Механизм внимания и трансформеры

4.Графовые нейронные сети

5. Исследования в области ML: глубокое обучение

Читать далее

+5

antipov_dmitry 22 окт в 07:38

Большое сравнение архитектур LLM

Сложный

33 мин

14K

Искусственный интеллектМашинное обучение * Big Data * Анализ и проектирование систем *

Перевод

Это перевод классной статьи с детальным обзором архитектур главных опенсорсных LLM: очень структурировано, доходчиво и с изумительными картиночками. И такой обзор просто обязан быть на русском языке. Поговорим про DeepSeek V3/R1, OLMo 2, Gemma 3, Mistral Small 3.1, Llama 4, Qwen3, SmolLM3, Kimi K2, GPT-OSS, Grok 2.5, GLM-4.5, Qwen3-Next.

Ну а дальше слово автору:

Прошло семь лет с момента разработки оригинальной архитектуры GPT. На первый взгляд, оглядываясь назад на GPT-2 (2019) и вперед на DeepSeek-V3 и Llama 4 (2024-2025), можно удивиться тому, насколько структурно похожими остаются эти модели.

Однако я считаю, что все еще есть большая ценность в изучении структурных изменений самих архитектур, чтобы увидеть, чем занимаются разработчики LLM в 2025 году.

Читать далее

+14

beatwad 22 окт в 07:33

Как я автоматизировал поиск работы на LinkedIn при помощи LLM

Простой

7 мин

6.9K

Машинное обучение * Python * Карьера в IT-индустрии

Кейс

Эта статья по сути является продолжением моей прошлогодней статьи, в которой я автоматизировал отклики на hh.ru. Кстати, если кому это интересно, тот проект до сих пор живой, недавно проверял :-)

В этой статье я расскажу о том, как я сделал тоже самое, но для LinkedIn, и как тоже самое можете сделать вы, потратив примерно полчаса своего времени и 0 рублей (при соблюдении определенных условий, разумеется).

Итак, недавно у меня появилась желание поискать работу на зарубежном рынке, ведь перспектива валютной удаленки выглядит весьма заманчивой, хоть и достаточно смутной в свете последних сокращений в зарубежном IT. В качестве первого ресурса для поиска работы был выбран сайт LinkedIn, а в качестве приложения для автоматизации этого поиска - проект AiHawk, который и вдохновил меня в прошлом году на создание аналогичного приложения для hh.ru. Но вот незадача - проект уже почти год как неактивен а последняя найденная версия не работоспособна. Поэтому было решено переписать данный проект, чтобы он снова мог работать.

Читать далее

+6

daniilshat 21 окт в 21:47

Вышел браузер ChatGPT Atlas: тестируем нейропоиск и пробуем онлайн-покупки в агентском режиме

Простой

4 мин

20K

БраузерыИскусственный интеллектСофтМашинное обучение *

Обзор

OpenAI выпустила браузер ChatGPT Atlas с интегрированными языковыми моделями. Приложение уже можно скачать на macOS, а позже появятся версии для Windows и мобильных платформ. В этой статье проверяем, что умеет очередной ИИ-браузер и пробуем заказать товар в онлайн-магазине с помощью агента.

Читать далее

+11

Sivchenko_translate 21 окт в 17:09

Что именно ИИ-чатботы делают «под капотом»

10 мин

11K

Машинное обучение * Искусственный интеллектNatural Language Processing * Математика * Научно-популярное

Перевод

Среди друзей я пользуюсь репутацией «ты ж программист», поэтому у меня нередко интересуются, как именно работают «под капотом» такие известные инструменты как ChatGPT, Claude, Grok или DeepSeek. Со временем я отточил ответ на этот вопрос — и потому, что нашёл способы лучше на него отвечать, и потому, что научился сам создавать большую языковую модель с нуля. Поэтому и сам понимать большие языковые модели я стал гораздо лучше.

В этой статье я попытаюсь простыми словами описать, что именно в них происходит. Пост состоит из серии объяснений, причём каждое последующее из них основано на предыдущих, но немного уточняет их. Так мы постепенно дойдём до такого объяснения, которое будет совершенно строгим и верным, но могло бы немного вас ошеломить, если выдать его без подготовки.

Если вы — технарь, и читаете эту статью, чтобы больше узнать об ИИ, то настоятельно рекомендую вам дочитать её до конца. Если вы открыли ссылку просто из интереса, то можете смело читать до тех пор, пока вам будет интересно. Возможно, вы станете более уверенно понимать, что происходит в трансформерах, даже если не уловите всех мелких деталей.

Читать далее

+24

zm_llill 21 окт в 17:04

Дракончик учится летать: Brain-like Dragon Hatchling простыми словами

Средний

16 мин

9.1K

Искусственный интеллектRust * Машинное обучение * Open source * Научно-популярное

Перевод

Искусственные нейросети научились распознавать лица и писать тексты, но до сих пор не умеют учиться на лету. Что если создать ИИ, который адаптируется к новому опыту прямо во время работы — как живое существо?

Менее месяца назад несколько инженеров и ученых выпустили научную статью по машинному обучению и нейросетям, предложив интересные идеи для изменения существующих архитектур. А говоря проще, они предложили новую архитектуру искусственной нейронной сети.

Читать далее

+8

ph_piter 21 окт в 12:51

Книга: «Математика и архитектура глубокого обучения»

3 мин

15K

Блог компании Издательский дом «Питер»Профессиональная литература * Математика * Машинное обучение * Python *

Привет, Хаброжители! Узнайте, что происходит внутри черного ящика! Для использования глубокого обучения вам придется подготовить данные, выбрать правильную модель, обучить ее, оценить качество и точность и предусмотреть обработку неопределенности и изменчивости в выходных данных развернутого решения. Эта книга шаг за шагом знакомит с основными математическими концепциями, которые пригодятся вам как специалисту по данным, – с векторным исчислением, линейной алгеброй и байесовским выводом, представляя их с точки зрения глубокого обучения.

Читать далее

+13

21 окт в 12:30

Какие они, типичные DS-специалисты, и как часто ИИ пишет за них код: результаты совместного опроса Хабра и Авито

10 мин

241K

Искусственный интеллектМашинное обучение * Программирование *

Хабр и технологическая платформа Авито решили заглянуть в мир ИИ и понять, кто всё это создаёт. Мы провели опрос среди пользователей Хабра, чтобы лучше узнать, кто такие современные дата-сайентисты и какие у них привычки, есть ли у них ИИ-любимчики, какие ИИ-инструменты они используют в работе. Около 500 разработчиков в сфере ML/DS ответили на самые разные вопросы — не только про свою профессиональную деятельности и нейросети, но и про увлечения и общение с родственниками.

Заглянуть в мир ИИ

+14

semolina_channel 21 окт в 11:35

Как RuStore читает мысли пользователей (и причём тут теги)

Простой

6 мин

6.5K

Блог компании VKПоисковые технологии * Алгоритмы * Машинное обучение *

Обзор

Когда пользователь открывает RuStore и вводит запрос вроде «тренировки дома» или «обои с кошками», он ищет не конкретное приложение, а способ решить задачу. Наша цель, как стора, — понять, какое приложение действительно поможет ему это сделать.

За этим стоит сложный ML-пайплайн: сначала модель отбирает кандидатов по смысловой близости запроса, затем ранжирует их по релевантности. А поисковые теги помогают системе уловить контекст — в каких ситуациях и по каким запросам ваше приложение должно оказаться в топе выдачи.

Меня зовут Анастасия Войцешко, я продакт-менеджер в RuStore. В этой статье расскажу, как устроен поиск внутри стора, какую роль теги играют и как подобрать их так, чтобы повысить шансы приложения попасть в релевантную выдачу.

Читать далее

+45

verasobol 21 окт в 10:53

T-LoRA: дообучить диффузионную модель на одной картинке и не переобучиться

Сложный

10 мин

7.3K

Блог компании AIRIМашинное обучение * Алгоритмы * Обработка изображений * Искусственный интеллект

Кейс

Вы когда‑нибудь мечтали стать лучшей версией себя? Моложе, красивее, идеальнее… А вот LoRA уже стала!

Меня зовут Вера Соболева, я научный сотрудник лаборатории FusionBrain Института AIRI, а также стажер‑исследователь Центра глубинного обучения и байесовских методов НИУ ВШЭ. Cегодня я расскажу про наше свежее исследование T‑LoRA: Single Image Diffusion Model Customization Without Overfitting. Мы с коллегами придумали эффективный способ как файнтюнить диффузионные модели с помощью LoRA всего по одной картинке.

Представьте такую ситуацию: вы хотите, чтобы модель генерировала вашу кошечку узнаваемой и в самых разных сценариях, но у вас нет времени или желания собирать обширный разнообразный датасет. А может, у вас вообще есть всего одна фотография (с хозяевами кошек так обычно не бывает, но допустим).

Хорошая новость: эту задачу можно решить, копнув поглубже в свойства диффузии! В этой статье я расскажу, как это сделать.

Читать далее

+10

1 2 ...

22

23 24 ...