Как стать автором
Поиск
Написать публикацию
Обновить
776.52

Машинное обучение *

Основа искусственного интеллекта

Сначала показывать
Порог рейтинга
Уровень сложности

Машины могут видеть. Что показали и рассказали на конференции MCS 2025 в Дубае

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров1.1K

ICLR 2025 — это крупнейшее событие весны в мире машинного обучения, на которое я… не поехал, в отличие от моих коллег из лаборатории FusionBrain AIRI. Почему? Потому что я посетил конференцию Machines can see 2025, которая проходила примерно в эти же дни в Дубае. О том, что это за мероприятие и что я там увидел, — в репортаже ниже.

Читать далее

Математическая оптимизация для бизнеса. Часть 2. Прогнозирование спроса, оптимизация ценообразования/промо/ассортимента

Уровень сложностиСредний
Время на прочтение11 мин
Количество просмотров1.3K

Продолжая ежегодную серию статей про эффективное применение математической оптимизации в бизнесе, хотелось бы рассказать про сферу ритейла и FMCG, а именно про задачи, основанные на моделировании прогнозирования спроса и ценовой эластичности. Среди задач я постараюсь раскрыть подробности применения математического моделирования и оптимизации для динамического регулярного ценообразования, оптимизации промо и ассортимента. В чём заключаются главные задачи этих решений? Оптимизационный движок динамического регулярного ценообразования необходим для формирования рекомендаций по оптимальным ценам на товары для максимизации экономических показателей. Оптимизация промо используется для получения наиболее эффективных рекомендаций по скидкам на товары или на иные механики промо. Оптимизация ассортимента нужна для поиска лучших ассортиментных матриц с учётом влияния наличия одних товаров на наличие других.

Основной целью статьи будет системная, местами субъективная формализация подходов к вышеуказанным задачам, основанная на личном опыте разработки решений в международных вендорах и совокупном опыте компании Axenix. За рамками статьи останутся не менее важные задачи управления цепочками поставок, управления запасами, размещения товаров на полках, так как каждая из задач заслуживает отдельной объёмной статьи.

Читать далее

Вы не любите LLM — вы в просто не умеете их готовить

Уровень сложностиПростой
Время на прочтение2 мин
Количество просмотров3.5K


Инквизиторы нового времени

Или размышления на тему LLM и тех, кто их не читает, но осуждает

Вчера вечером, листая ленту, наткнулся на статью. Из тех, что нынче зовутся «LLM-порождениями». Написана складно, по делу. Местами даже с огоньком. И вдруг — комментарий под ней, строгий и важный, как проверяющий с утра:

«Опять этот LLM-мусор…»

«Как же надоели эти LLM-статьи…»

И всё бы ничего. Да не в первый раз я вижу этого комментатора. Он вечно появляется. Он — вечный. Он — инквизитор нейросетей.

Кто вы, судари?

Читать далее

Экзоскелет с функцией диагностики: помогает не только больным с ДЦП

Время на прочтение5 мин
Количество просмотров465

21 мая в лабораторном корпусе РосНОУ на Авиамоторной прошёл пресс‑завтрак на тему «Реабилитация детей с ДЦП и другими нарушениями опорно‑двигательного аппарата».

Как отметила во вступительном слове первый проректор РосНОУ Елена Владиславовна Лобанова, количество детей с ДЦП в мире неуклонно растёт, и нашей цивилизации предстоит найти какое‑то решение этой глобальной проблемы, тем более что данное заболевание относится к неизлечимым. И тут на помощь должны прийти новые технологии, в частности, искусственный интеллект.

Читать далее

Я устал править за нейросетью — теперь пишу промпты по-другому

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров35K

Устал от багов нейросети. Решил разобраться в алгоритмах ИИ-галлюцинаций, как они влияют на работу, и в конце оставил гайд с рекомендациями по написанию промптов для генерации кода, текста и изображений.

Читать далее

Как все рынки мира оказались уязвимы конкуренции с любым умным айтишником

Уровень сложностиСредний
Время на прочтение18 мин
Количество просмотров14K

История о том, как в текущем моменте истории, по сути любой разработчик может в одиночку задизраптить любой вертикальный рынок и даже отрасль

Читать далее

О ужас, это текст от LLM

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров5.6K

Привет всем! В этой статье я лишь немного выскажусь на тему комментаторов, а именно таких, что я назвал бы их «инквизиторов LLM».

Кто это? Это такие люди, что находят жптшные статьи или другие и пишут под ними что‑то в стиле.

Читать далее

Как обойти детекторы текста, сгенерированного ИИ

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров7K

Провел небольшой ресерч как быстро хакнуть детекторы плагиата / детекторы текста написанного ChatGPT/LLM. Если вкратце, то 100% рабочего варианта нет, существует масса различных сервисов, которые под собой использую нейросетки обученные классифицировать текст на степень его "человечности"

Читать далее

Генерация видео: Обзор интересных подходов | Text-2-video | Part 2

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров2.2K

Освечу базовые концепты из области генерации видео, в этой части разберем уже более современные модели 2025 года, и парочку моделей, с которых все начиналось. Все кратко и четко, только самое основное.

Посмотрим на устройство современных топовых SOTA моделей для генерации видео: Wan2.1, Hunyuan video, недавно вышедший подход к облегчению вычислетильных требования FramePack.

Читать далее

Как алгоритм Recovering Difference Softmax (RDS) делает рекомендации и уведомления точнее и эффективнее

Уровень сложностиСредний
Время на прочтение5 мин
Количество просмотров1.3K

Алгоритм Recovering Difference Softmax (RDS) — полноценный подход к оптимизации уведомлений и контента для повышения вовлеченности пользователей. Алгоритм выбирает единственно лучший вариант, удерживая пользователей дольше и возвращая их чаще.

Если коротко, улучшает работу алгоритмов машинного обучения, особенно когда нужно делать выбор из нескольких вариантов.

Как RDS превращает простые сигналы в рост вовлечённости? Разбираемся в статье!

Читать далее

В 10 раз больше роликов с субтитрами: как VK Видео делает контент доступнее

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров1.4K

В феврале 2025 года команда VK Видео в 10 раз увеличила количество роликов с субтитрами и точность расшифровки речи. Теперь субтитры есть в 90% контента — со знаками препинания, заглавными буквами и всеми особенностями специализированной лексики и неологизмов.

В этой статье расскажем, как перестраивали систему, оптимизировали архитектуру ML-модели, и поделимся результатами, которые помогли улучшить пользовательский опыт и сделать контент доступнее для миллионов зрителей. 

Читать далее

Stack Overflow умирает? Как ИИ вытесняет живые сообщества разработчиков

Время на прочтение6 мин
Количество просмотров9.7K

Stack Overflow, некогда главная платформа для программистов, переживает кризис: за два года трафик упал почти на 90%. Что стало причиной — изменившиеся привычки пользователей или ошибки самой платформы? Давайте попробуем разобраться в происходящем. А еще посмотрим, что администрация делает для спасения и что ждет сообщества разработчиков в новой реальности, где ответы на вопросы находятся быстрее, чем успеваешь их задать.

Читать далее

Код, железо, стратегия: в чем секрет победителей ML-соревнований?

Уровень сложностиСредний
Время на прочтение12 мин
Количество просмотров2.5K

Кто из вас участвовал в соревнованиях по машинному обучению? А кто выигрывал? В мире ML олимпиады, хакатоны и прочие состязания — это не просто способ проверить свои навыки. Это полигон, где рождаются и проверяются новые подходы к решению сложных задач.

В 2024 году прошло более 400 таких соревнований с общим призовым фондом свыше $22 миллионов. Но кто же эти люди, которые выиграли этот куш? И что такого они сделали, чтобы обойти других?

Мы проанализировали отчет The State of Machine Learning Competitions 2024 и выделили из него самые ценные моменты для практикующих разработчиков. Если хотите узнать, что на самом деле отличает победителей от остальных участников, то этот материал для вас.

Читать далее

Ближайшие события

Есть ли у AMD перспективы в AI/ML/DL. Часть 2

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров4.3K

Привет, Хабр! Это снова Ефим Головин, все еще старший MLOps-инженер в Selectel. В прошлой статье в попытках оценить перспективы AMD в ML мы внезапно погрузились в дебри документации NVIDIA. А теперь пора взглянуть на то, что происходит, собственно, у AMD. Забегая вперед, могу сказать, что во многом «красные» оперируют очень похожими терминами. Это вполне понятно и логично, поскольку и NVIDIA их не из воздуха взяли. Все это так или иначе корнями уходит в идеи, появившиеся и описанные задолго до появления терминов «CUDA», «SM», архитектуры Tesla и т. д.
Читать дальше →

Работает ли «Нейроэксперт». Проверяем в деле на инструкциях, договорах и телеграм-чатах

Время на прочтение4 мин
Количество просмотров2.5K

Яндекс тут недавно выкатил сервис, в котором обещает адекватный поиск нужной информации в файлах, ссылках, таблицах, презентациях и аудио, суммаризацию и ответы на сложные вопросы. На первый взгляд, смахивает на аналог NotebookLM от Google, который недоступен в РФ. Я решил проверить, как он на самом деле работает с файлами и ссылками.

Что умеет, судя по описанию — пересказывать содержание, сравнивать данные, выводить ключевые мысли и быстро искать цифры из отчетов. Я потестил «Нейроэксперта» (так и называется) в разных ситуациях: от сравнения характеристик блендера до анализа статей с arXiv. В некоторых случаях сервис показал себя полезным, в других — бета-версии явно не хватает точности.

Если вы используете нейронки для описанных выше задач, вам может пригодиться мой опыт. Он под катом.

Читать далее

Что у меня за распределение

Уровень сложностиСредний
Время на прочтение14 мин
Количество просмотров2.2K

Привет! Меня зовут Василий, я ML инженер центра ML-экспертизы в обслуживании. В Т-Банке мы прогнозируем нагрузку на колл-центр: сколько придет обращений, какой длительности и некоторые другие характеристики. 

Нужно уметь переводить эту нагрузку в количество людей на линии. Для этого мы реализовали симулятор колл-центра. Для работы симулятора нужно понимать, как распределены те или иные случайные величины, и иметь численные характеристики соответствия наблюдаемых значений теоретическим распределениям. Это называется задачей (критериями) согласия: к какому теоретическому распределению вероятностей принадлежит данная выборка.

«Используй Колмогорова — Смирнова, да и все тут», — скажут мне. В принципе, да, но нет. Мы пойдем чуть дальше и попытаемся разобраться, как все устроено и какие есть ограничения. Расскажу, почему нельзя просто так применять критерии согласия, к каким это приводит ошибкам и как с этим быть.

Читать далее

Поддержка RUTUBE 2.0: как мы научили бота не ломаться на сложных вопросах

Время на прочтение19 мин
Количество просмотров2.3K

Как у нас в RUTUBE ИИ и служба клиентского сервиса работают сообща, вместе справляются ростом сервиса и мгновенно адаптируются к изменениям — рассказываем в этой статье. Делимся рецептом RAG-системы, которая за первые три месяца эксплуатации уже отвечает почти на 70% запросов пользователей и никогда не врёт про «космических зайцев». 

Читать далее

Нейро-дайджест: ключевые события мира AI за 12–19 мая 2025

Уровень сложностиСредний
Время на прочтение15 мин
Количество просмотров1.8K

Привет! 👋
Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта.

Меня зовут Вандер, и каждую неделю я делаю обзор новостей о нейросетях и ИИ.

Неделя выдалась насыщенной: OpenAI выкатила помощник для программистов Codex и добавила GPT-4.1, Grok вульгарно высказывается в Twitter,  Tencent показала генератор изображений в реальном времени, а DeepMind представила агента, который сам изобретает алгоритмы.  Всё самое важное — в одном месте. Поехали!

Читать прошлый выпуск

Читать далее

AI-пузырь: когда стартапы получают миллионы за обёртку над чужим ИИ

Уровень сложностиПростой
Время на прочтение2 мин
Количество просмотров2.3K

Пока инвесторы заливают миллионы в AI-стартапы, за красивыми интерфейсами часто скрывается лишь интеграция чужих моделей. Почему проекты вроде Cursor AI — это не прорыв, а симптом надвигающегося пузыря?

Читать далее

Как мы учили по-доброму шутить LLM и у нас получилось (почти)

Время на прочтение6 мин
Количество просмотров2.3K

Способность открытых LLM шутить, причем по-доброму, могла бы расширить применение ИИ во многих сферах – образовании, терапии, обслуживании клиентов. Так что мы с коллегами из Лаборатории естественного языка НИУ ВШЭ задались этим вопросом и попытались разработать собственную методологию курирования (фильтрации и аннотирования) наборов данных для генерации доброго юмора на малых LM. По всем научным канонам мы ее описали и оценили в этом препринте. А здесь я постараюсь рассказать о ней чуть короче и менее научно.

Читать далее

Вклад авторов