Обновить
789.69

Машинное обучение *

Основа искусственного интеллекта

Сначала показывать
Порог рейтинга
Уровень сложности

Как запустить свою LLM для инференса. Руководство по запуску: Ollama, vLLM, Triton, LM Studio, llama.cpp, SGLang

Уровень сложностиСредний
Время на прочтение11 мин
Охват и читатели16K

В этой статье будет приведено практическое руководство по базовой настройке и запуску следующих инструментов для работы с LLM: Ollama, LM Studio, vLLM, Triton, llama.cpp, SGLang.

🔥 Начинаем? 🔥

Как DS-инженеры совершенствуют автогенерацию описаний и пополняют индекс объявлений Авито

Время на прочтение6 мин
Охват и читатели8K

Привет! Я Сергей Кляхандлер, техлид в команде LLM Авито. В 2024 году мы разработали и выпустили ML-модель, которая автоматически генерирует описания для объявлений из категории «Одежда, обувь, аксессуары». В этом году автогенерацию усовершенствовали, а подход переиспользовали — подробнее о том, как мы это сделали, расскажу в статье. Материал будет полезен DS-инженерам, которые работают с мультимодальными LLM-моделями.

Читать далее

Нейро-дайджест: ключевые события мира AI за 3 неделю сентября 2025

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели5K

Привет! Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.

Неделя выдалась интересной: Alibaba показала Qwen 3 Next, Mistral получила $1,5 млрд инвестиций, а в Абу-Даби презентовали K2-Think. Replit выпустил Agent 3, ElevenLabs добавили Voice Remixing, а Google наконец сделали вертикалки в Veo 3. ИИ уже назначают министра в Албании и помогают выбирать премьера в Непале, а новые AirPods научились переводить в реальном времени.

Всё самое важное — в одном месте. Поехали!

Читать дайджест ⮕

Как дорожные знаки попадают на карты Яндекса: применяем ML в картографии

Время на прочтение11 мин
Охват и читатели17K

Важное свойство любых карт — их актуальность. Чтобы Яндекс Карты максимально точно отражали дорожную обстановку, мы постоянно мониторим изменения в реальном мире. Один из факторов, который необходимо отслеживать, — это установка или демонтаж знаков дорожного движения.

Меня зовут Владимир Быстрицкий, я руковожу группой AI-картографирования. В этой статье расскажу о процессе детектирования дорожных знаков в картопроизводстве Яндекса: с чего всё началось, как развивалось, какие технологии использовались. Ну и попробую ответить на самый, на мой взгляд, главный вопрос в любой ML-задаче: как собрать датасет и не разориться?

Читать далее

Топ-12 бесплатных нейросетей для создания видео и оживления картинок

Уровень сложностиПростой
Время на прочтение13 мин
Охват и читатели165K

Когда вы в последний раз поднимали взгляд к звёздам и думали: «А вдруг где-то там действительно есть жизнь?»

Космос всегда был для нас не только загадкой, но и сценой для фантазий. Учёные ищут ответы в телескопах и формулах, а мы решили погнаться за модой и спросить у нейросети.

Сегодня достаточно пары слов — и алгоритмы нарисуют целые миры. Теперь режиссёром становится ваше воображение, которое неплохо так заправлено искусственным интеллектом.

Мы протестируем 12 сервисов и посмотрим, смогут ли они превратить безмолвный космос в оживший пейзаж и заселить его инопланетными героями.

Да пребудет с тобой Сила, нейросеть… и пусть твои звёзды не рендерятся сутками!

Приятного чтения!

Читать далее

Что выяснили про ChatGPT: первые реальные данные несколько удивляют

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели17K

OpenAI впервые раскрыла реальную статистику использования ChatGPT: 73% запросов не связаны с работой

Компания OpenAI опубликовала первое масштабное исследование поведения пользователей ChatGPT, проанализировав 1,5 миллиона реальных диалогов за период с мая 2024 по июнь 2025 года. Результаты оказались неожиданными и развенчали многие мифы об использовании ИИ.

Ключевые выводы:

700 млн пользователей в неделю - каждый десятый взрослый житель планеты

73% запросов личные, только 27% связаны с работой (год назад было 50/50)

Женщины обогнали мужчин - 52% vs 48% пользователей

Программирование - всего 4,2% от всех запросов (а не основное применение, как многие думали)

Три главные категории: практические советы (29%), поиск информации (24%), создание текстов (24%)

Неожиданные факты:
→ В развивающихся странах ChatGPT растет в 4 раза быстрее, чем в богатых
→ 10% всех обращений - это обучение и репетиторство
→ Больше половины "письменных" задач - редактирование существующих текстов, а не создание нового контента

Исследование показало, что ChatGPT превратился из нишевого инструмента для программистов в массовый помощник для повседневных задач - от рецептов до домашних заданий.

Читать далее

Рекомендации историй ВКонтакте: от простой эвристики до ML-системы

Уровень сложностиСредний
Время на прочтение15 мин
Охват и читатели7.5K

Привет, Хабр! Я Степан Малькевич, руковожу командой рекомендации ленты ВКонтакте, AI VK. Сегодня расскажу, как мы за последний год прокачали алгоритмы рекомендаций для историй. Это был путь от MVP с простыми эвристиками до ML‑системы с моделированием авторов, поведенческими фичами и прицелом на онлайновые реакции.

Читать далее

Что такое эмбеддинги и как с ними работать. Вводная для начинающих

Уровень сложностиСредний
Время на прочтение13 мин
Охват и читатели15K

В этой статье будет рассказано об эмббедингах и методах работы с ними. Расскажу немного математики и приведу много примеров на Python.

🔥 Начинаем? 🔥

Локальные LLM модели: обзор и тестирование

Уровень сложностиСредний
Время на прочтение33 мин
Охват и читатели26K

В ★5УГЛОВ мы часто работаем с языковыми моделями — как облачными, так и локальными. И если про онлайн‑сервисы знают все, то локальные LLM до сих пор остаются недооцененным инструментом. Я решил поделиться личным опытом: какие модели можно запускать прямо на ПК, чем они полезны и зачем их вообще использовать в реальных проектах.

Большие языковые модели (Large Language Model, LLM) уже давно не являются громоздкими программными продуктами, закрытыми от пользовательских доработок и требующими огромных вычислительных мощностей. Многие ИИ можно скачать и запустить на обычном компьютере без интернета. Популярны так называемые «дистиллированные» модели — сжатые версии основных нейросетей, имеющие меньше параметров. Они требуют меньше ресурсов и могут работать даже на не самых мощных настольных ПК или ноутбуках. За последнее время локальные ИИ заметно улучшились: они стали быстрее, стабильнее и качественнее. Если раньше многие из них стремились отвечать по‑китайски (если явно не указать язык), то сегодня выбор значительно шире и работать с ними удобнее. Попробуем оценить самые популярные на разных задачах и выбрать лучшую.

Читать далее

Промптинг и суеверия. Что (не) надо добавлять к запросу в ChatGPT

Уровень сложностиПростой
Время на прочтение28 мин
Охват и читатели44K

Американцы обожают играть на деньги и смотреть красочное шоу. Это самое примитивное и оттого ошибочное объяснение популярности программы The Price Is Right. Если вы никогда не видели эту передачу дневного американского телевидения, представьте себе многолетнюю светскую церемонию потребления, где зрителей зовут на сцену и награждают за умение ориентироваться в ценниках. Зритель из зала слышит заветную фразу «Come on down!», выбегает к подиуму и соревнуется в угадывании стоимости бытовых товаров.

Впервые формат появился в 50-х годах прошлого века, а в 1972 году The Price Is Right подобновили и начали транслировать днём по будням на канале CBS. Но идёт передача не в прайм-тайм, а в 10:00 или 11:00 утра. Несмотря на её странное время показа, знакома она всем американцам. Смотрят её не только пенсионеры и домохозяйки, её хотя бы раз видели затемпературившие дети, которые вместо школы остались дома.

Реальный секрет долгожительства программы — смешение доброжелательности ведущих, простоты правил с бытовой темой и разнообразные мини-игры. Одна из таких — Plinko, которая выглядит как детская забава. Участник получает плоские жетоны и, стоя наверху большой вертикальной доски со штырьками, сбрасывает их в прорези сверху. Жетон, ударяясь о штырьки, хаотически меняет траекторию и внизу попадает в одну из девяти ячеек с разными суммами.

Читать далее

Нейро-дайджест: ключевые события мира AI за 2 неделю сентября 2025

Уровень сложностиСредний
Время на прочтение6 мин
Охват и читатели5.8K

Привет! Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.
Меня зовут Вандер, и каждую неделю я обозреваю новости о нейросетях и ИИ.

Неделя выдалась интересной:: Qwen показали модель MAX на 1 трлн параметров, Anthropic собрали рекордные инвестиции, а в ChatGPT проекты стали бесплатными. На рынке появились новые агенты, звуковые модели и сервисы для создания приложений. Warner Bros. пошли в суд с Midjourney, а британские врачи тестируют стетоскоп с ИИ.

Всё самое важное — в одном месте. Поехали!

Читать дайджест ⮕

Современные генеративные модели и приложения на их основе

Время на прочтение7 мин
Охват и читатели6.1K

Привет, Хабр! Меня зовут Айбек Аланов. Я руковожу группой Controllable Generative AI в FusionBrain Lab Института AIRI и Центром глубинного обучения на байесовских методах в Институте искусственного интеллекта и цифровых наук НИУ ВШЭ и занимаюсь GenAI: работаю с cutting-edge-моделями и помогаю им стать частью прикладных решений.

В последние годы это одно из самых горячих направлений в машинном обучении. Нейросети не просто понимают данные, но и создают что-то новое: от картинок и видео до сложных 3D-объектов или дизайна молекул.

В этом материале по мотивам моего доклада с True Tech Day я расскажу, что происходит в этой области прямо сейчас. Какие архитектуры используются? На что способны современные модели? И самое главное, как все это применить в реальных задачах.

Читать далее

Куда инвестирует великий программист Джефф Дин

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели21K

Легендарный Джеффри Дин не нуждается в дополнительном представлении: именно он спроектировал и запрограммировал некоторые ключевые сервисы для Google, в том числе распределённую БД Spanner, систему хранения полуструктурированных данных Bigtable, систему обработки данных в кластерах MapReduce, NoSQL-хранилище LevelDB, библиотеку машинного обучения TensorFlow и др.

Как и другие известные разработчики, Джефф Дин сейчас работает в области ML. Для него это естественное направление, поскольку он ещё с университета специализировался на машинном обучении.

Кроме основных занятий, ведущий исследователь Google также инвестирует в стартапы. Новое поколение стартапов, которые появляются как грибы после дождя.

Читать далее

Ближайшие события

Вывести EdTech из кризиса: сыграет ли ставка на AI

Время на прочтение10 мин
Охват и читатели7.1K

Привет, Хабр! Наверняка вы помните успех онлайн-школ во время пандемии — тогда каждый или кого-то учил, или чему-то учился. Однако за пять лет технологии шагнули вперед, а EdTech остался на том же уровне — и это привело к упадку. Зачем платить за курс, если нейросеть может научить чему угодно бесплатно (хоть к качеству обучения и возникают очевидные вопросики)? 

В онлайн-школе IBLS смогли превратить ML из конкурента в союзника, и с его помощью осовременить процесс обучения для всех участников. Как это получилось — рассказываю под катом. 

Читать далее

ИИ — просто мешок слов. Как перестать видеть интеллект там, где его нет

Уровень сложностиСредний
Время на прочтение11 мин
Охват и читатели14K

Когда к ИИ-инструменту привыкают, его порой начинают воспринимать как разум — будто за ответами скрывается личность с намерениями и логикой. Но это не что иное как ловушка антропоморфизма: мы приписываем моделям человеческие качества и потом удивляемся, когда они выдают банальности или абсурдные советы. В статье предлагается более честная и полезная метафора — «мешок слов». Она объясняет, почему LLM предсказуемо сильны в одних задачах и столь же предсказуемо сыплются в других, а главное — почему сравнивать их с людьми изначально неправильно.

Читать далее

Как мы внедряли семантический поиск по сообществам ВКонтакте: про раков, астрологию и затянувшийся таймлайн проекта

Уровень сложностиСредний
Время на прочтение9 мин
Охват и читатели7.8K

Представьте ситуацию: вам захотелось заказать раков. Что будете делать? Есть несколько вариантов, один из них — поискать подходящее заведение с доставкой в социальных сетях. Там можно найти локальную компанию с хорошими отзывами и приемлемыми ценами. Вы заходите ВКонтакте, открываете поиск по сообществам, вбиваете запрос «заказ раков» и получаете... подборку сообществ по астрологии. Совпадение по тексту есть, паблики популярные, можно сказать, что алгоритмы справились. Вы узнали о влиянии планет на вашу судьбу, но остались без раков.

Казалось бы, запрос звучал очевидно, но для классического текстового поиска это задача со звёздочкой. На помощь приходит семантический поиск — технология, которая обещает понять не только буквы в запросе, но и смыслы, стоящие за ними.

Меня зовут Арсений Расов, я тимлид ML-инженеров в команде поиска AI VK. В этой статье расскажу, как мы с командой внедряли семантический поиск по сообществам ВКонтакте и почему задача, рассчитанная на два месяца, заняла полгода. Рассмотрим современные NLP-технологии в продакшене и поговорим про непредсказуемость проверенных алгоритмов за пределами Jupyter Notebook.

Читать далее

Что слепой знает о мире? Большие языковые модели и география

Уровень сложностиПростой
Время на прочтение17 мин
Охват и читатели9.4K

Изображение выше принято рекомендовать как древнюю карту мира римского географа Помпония Мелы. Это не совсем так. Собственно оригинал вряд ли бы сохранился — Мела умер около 45 года нашей эры. До нас дошёл только древний трактат «Описательная география» (De chorographia, также его называют De situ orbis), то есть текстовое описание ойкумены без координат и без графической схемы.

Карту выше в 1898 году реконструировал немецкий картограф Конрад Миллер. Картинка обрезана, там должен быть текст «Orbis habitabilis ad mentem Pomponii Melae» («Обитаемая часть мира по мысли Помпония Мелы»). Лист с картой вышел в шестом выпуске серии Миллера «Mappae mundi. Древнейшие карты мира» (Mappaemundi. Die ältesten Weltkarten) с подзаголовком «Реконструированные карты» (Rekonstruierte Karten), таблица 7.

Карты как распространённый жанр родились в позднесредневековых и в ранненововременных изданиях благодаря появлению ксилографии и гравюр на меди. Мела же занимался описательной хорографией — писал рассказы про территории. Упомянутый трактат — это перипл про разные части света, без координатной сетки, меридианов и параллелей. Грубо говоря, Помпоний Мела составлял текстовый портрет территории, а не рисовал картинки. Как же из этого получился вот этот рисунок?

Читать далее

Как аналитики Авито с помощью ML помогают людям выбирать хорошие авто с пробегом

Уровень сложностиСредний
Время на прочтение13 мин
Охват и читатели9.1K

Привет! Меня зовут Илья Комутков, я старший аналитик в Автотеке Авито — сервисе по проверке истории автомобилей с пробегом. В статье расскажу, как мы улучшаем проверку машин и создаём алгоритм рекомендаций по дальнейшим действиям для покупателей. Текст будет интересен начинающим или middle-аналитикам, которые уже умеют работать с SQL, python, ML, но ещё не решали многоэтапные задачи, влияющие на бизнес, и ищут способы применить свои навыки в работе.

Читать далее

5 задач, которые UX-исследователи Авито решают с помощью нейросетей

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели8.7K

Привет! Меня зовут Маша Московкина, я UX-исследователь в Авито Работе. В UX часть задач — это рутина, а ИИ отлично справляется с однообразными задачами. Поэтому иногда с его помощью мы упрощаем работу себе и коллегам из других функций. В статье поделюсь идеями, как вы тоже сможете использовать ИИ в работе, а также покажу 5 примеров наших рабочих промптов. Статья будет интересна исследователям и дизайнерам, которые хотят использовать в работе искусственный интеллект.

Читать далее

Объяснимые нейросети (XAI): почему ИИ должен быть прозрачным?

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели6K

Всем привет. Сегодня хочу затронуть важную и интересную тему объясняемых нейросетей (XAI). 

«Почему ИИ принял такое решение?» — вопрос, который всё чаще задают не только разработчики, но и обычные пользователи. Нейросети уже помогают ставить диагнозы, одобрять кредиты, управлять автомобилями и даже вершить правосудие. Но как можно доверять системе, если никто — включая её создателей — не понимает, как она работает?

Современные модели машинного обучения, особенно глубокие нейросети, напоминают «чёрные ящики»: данные входят, ответ выходит, а что происходит внутри — загадка. И если для рекомендации фильма это не страшно, то в медицине, финансах или безопасности непрозрачность ИИ может стоить денег, репутации и даже жизней.

Именно поэтому на сцену выходит Explainable AI (XAI) — объяснимый искусственный интеллект.

Читать далее

Вклад авторов