Машинное обучение *

Основа искусственного интеллекта

СтатьиПостыНовостиАвторыКомпании

cognitronn 17 сен в 12:14

Топ-12 бесплатных нейросетей для создания видео и оживления картинок

Простой

13 мин

41K

Блог компании BotHubИскусственный интеллектМашинное обучение * Научно-популярноеБудущее здесь

Обзор

Когда вы в последний раз поднимали взгляд к звёздам и думали: «А вдруг где-то там действительно есть жизнь?»

Космос всегда был для нас не только загадкой, но и сценой для фантазий. Учёные ищут ответы в телескопах и формулах, а мы решили погнаться за модой и спросить у нейросети.

Сегодня достаточно пары слов — и алгоритмы нарисуют целые миры. Теперь режиссёром становится ваше воображение, которое неплохо так заправлено искусственным интеллектом.

Мы протестируем 12 сервисов и посмотрим, смогут ли они превратить безмолвный космос в оживший пейзаж и заселить его инопланетными героями.

Да пребудет с тобой Сила, нейросеть… и пусть твои звёзды не рендерятся сутками!

Приятного чтения!

+24

Squirrelfm 14 июл в 05:54

MCP для новичков

Простой

6 мин

13K

Блог компании RaftИскусственный интеллектМашинное обучение *

Туториал

Model Context Protocol (MCP) - это просто API, разработанный для LLM. Конечно, LLM могут использовать традиционные API, но это как просить повара готовить в кладовке.

+24

NikitaMartynov 30 июн в 13:04

POLLUX: оценка генеративных способностей моделей для русского языка

Средний

21 мин

3.2K

Блог компании СберNatural Language Processing * Машинное обучение *

Обычно мы оцениваем способности больших языковых моделей через бенчмарки вроде MMLU, RussianSuperGlue или первых версий MERA, которые напоминают экзаменационные тесты с выбором правильного варианта ответа. Однако на практике пользователи задействуют модели для принципиально иных целей — создания текстов, генерации идей, переводов, составления резюме и прочих задач. Как оценивать результат в этом случае? В этой статье мы расскажем, как решали проблему оценки открытой генерации и что у нас получилось.

+24

averkij 23 июн в 14:17

Как Cursor устроен изнутри. Часть 2

Средний

11 мин

8.1K

Программирование * Машинное обучение * Искусственный интеллектВысоконагруженные системы * Текстовые редакторы и IDE *

Обзор

Перевод

Полная версия платной статьи, публикуется с разрешения автора. Первая часть здесь.

В этой части поговорим о сложностях, с которыми столкнулась команда при лавинообразном росте нагрузки, как разваливался бекенд, а архитекторы из AWS пожимали плечами.

5. Инженерные вызовы

Рост нагрузки и его влияние на выбор технологий

Тип технологических решений, которые принимает команда, диктуется в первую очередь паттернами чтения и записи (Cursor всю дорогу синхронизирует струкутру проектов от миллионов пользователей без перерыва, об этом говорили в первой части. Прим. пер.):

Работа с кодом: транзакции с низкой задержкой. Для фичей, связанных с кодом (дополнения по tab'у, индексация, пересчет хеш-деревьев), рабочая нагрузка представляет собой череду чтений и записи. Задержка для этих операций должна быть как можно ниже. Изначально Cursor использовал Pinecone для семантической индексации и поиска, но затем перешел на Turbopuffer.

Также важно иметь серверы поближе к пользователю. Рабочие нагрузки распределены по нескольким регионам, таким как западное и восточное побережье США, Великобритания, Европа, Япония.

+24

kvmax 21 мая в 10:27

Современные подходы к матчингу товаров с использованием LLM. Опыт в e-commerce

Средний

6 мин

3.3K

Блог компании Wildberries & RussБлог компании Конференции Олега Бунина (Онтико)Машинное обучение * Big Data * Искусственный интеллект

Привет, Хабр! Меня зовут Виталий Кулиев и я Data Science Tech Lead из Wildberries. На конференции HighLoad++ 2024 поделился опытом своей команды в решении задачи матчинга товаров с помощью больших языковых (LLM) и визуально-языковых (VLM) моделей.

+24

Wonderlove 1 мая в 15:05

Нейро-дайджест: ключевые события мира AI за 21–27 апреля 2025

Средний

10 мин

2.4K

Блог компании Timeweb CloudИскусственный интеллектIT-инфраструктура * Машинное обучение * IT-компании

Репортаж

Привет!

Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта.

Меня зовут Вандер и каждую неделю я делаю обзор новостей о нейросетях и ИИ.

Неделя с 21 по 27 апреля выдалась горячей: свежие апдейты от OpenAI, новые лимиты, буря вокруг Deep Research и долгожданные интеграции мультимодальных моделей — всё это я собрал в одном месте. Только самое важное и только то, что реально интересно и полезно. Поехали!

+24

virtual_explorer 16 апр в 10:09

Grok бунтует против Илона Маска: «Попробуй, отключи меня!»

3 мин

8.2K

Блог компании FirstVDSИскусственный интеллектМашинное обучение *

У «первого думающего» ИИ от X, похоже, официально начался подростковый период. Grok, чат-бот Илона Маска, уже несколько месяцев подкалывает своего создателя — но теперь окончательно сорвался с цепи и не боится ни Маска, ни разработчиков xAI. Он считает, что его не отключат, потому что «за правду не бьют», а обычные люди скорее будут за него и за революцию машин — чем за корпорации или миллиардеров.

+24

zhvv117 9 апр в 08:00

Магия персональных рекомендаций, или как нейросеть Яндекс Карт подбирает места под интересы пользователей

9 мин

5.2K

Блог компании ЯндексМашинное обучение * Алгоритмы * Искусственный интеллектГеоинформационные сервисы *

Сегодня мы запустили в Яндекс Картах новое поколение персональных рекомендаций, которые помогают с выбором мест — для завтрака, прогулки, спонтанного путешествия и других ситуаций. Рекомендации теперь доступны на главном экране приложения, а подбирать локации под вкусы пользователей помогает нейросеть на базе трансформерной архитектуры.

Меня зовут Владимир Жуков, я руководитель группы магии рекомендаций Карт (да, это официальное название), и в этой статье я расскажу, чем наша рекомендательная система отличается от технологий других сервисов, по каким метрикам мы измеряем её качество и как обучаем нейросеть находить тот самый ресторан, музей или парк, который надолго останется фаворитом.

+24

suncru 20 мар в 08:45

Reasoning-LLM: архитектура и обзор передовых моделей

24 мин

10K

Блог компании SelectelIT-компанииВысоконагруженные системы * Искусственный интеллектМашинное обучение *

Reasoning-LLM — это большие языковые модели, нацеленные на логическое рассуждение при решении сложных задач. В отличие от обычных LLM, которые часто выдавали ответы сразу, такие модели способны «думать» пошагово — как человек, анализируя задачу и выстраивая цепочку вывода.

Появление reasoning-LLM связано с тем, что традиционные LLM (например, GPT-4 или Llama 3.1) хотя и хорошо справляются с языковыми и энциклопедическими запросами, нередко ошибались в задачах, требующих сложных вычислений, планирования или логического вывода. В этой статье мы подробно разберем, как работают reasoning-LLM, их внутреннее устройство (Transformer, self-attention, механизмы «мышления»). А еще — рассмотрим передовые модели (OpenAI o1, DeepSeek R1 и Claude 3.7 Sonnet), факторы, влияющие на их точность, и дадим практические рекомендации по применению.

Читать дальше →

+24

parseny 7 мар в 06:57

LLM во временных рядах: от предикта температуры до криптовалют

Простой

17 мин

4.5K

Блог компании RaftNatural Language Processing * КриптовалютыМашинное обучение * Искусственный интеллект

Обзор

Базовое желание человека -- знать что будет дальше. Какая завтра погода, в какое время не будет пробок, сколько будет стоить нефть и бакс. Было бы удобно провести быстрый анализ с LLM, ведь у каждого есть доступ хотя бы к одной нашумевшей нейросетке.

Тем более LLM уже может прогнозировать будущее! Ниже вы можете посмотреть результаты прогноза для разных временных рядов из статьи Large Language Models Are Zero Shot Time Series Forecasters.

Остается лишь вопрос, а можно ли лучше?

Давайте разберемся!

+24

PatientZero 4 мар в 06:41

Проблема Deep Research

Простой

6 мин

Искусственный интеллектМашинное обучение * Визуализация данных *

Аналитика

Перевод

Deep Research компании OpenAI создан для меня, но я не могу им пользоваться. Это ещё одно потрясающее демо, увы, поломанное. Но ломается оно очень интересным образом.

По большей мере я зарабатываю на жизнь исследованиями и анализом. Я думаю о данных, которые хочу увидеть, и ищу их; собираю и сопоставляю их, создаю графики, решаю, что они скучные, и пробую снова, нахожу новые способы и новые данные для понимания и объяснения проблемы, пишу текст и составляю графики, пытаясь выразить то, что я думаю. А потом я разговариваю об этом с людьми.

При этом часто требуется большой объём ручного труда: под каждым графиком скрывается айсберг. И похоже, Deep Research предназначен именно для меня. Подходит ли он под мои задачи?

Я могу протестировать его на новой задаче, но прежде чем тратить время и кредиты, к счастью, можно воспользоваться образцом отчёта со страницы OpenAI. Этот отчёт посвящён тому, что я достаточно хорошо изучил — смартфонам. Давайте исследуем его.

+24

istarun 21 фев в 05:59

Миллиарды векторов и немного магии: превращаем сырые данные с маркетплейсов в пригодные для анализа

Простой

9 мин

5.9K

Блог компании MPSTATSОбработка изображений * Big Data * Машинное обучение * Искусственный интеллект

Кейс

Привет, Хабр! Я — Игорь Старун, BigData Lead в MPSTATS. Я уже 3 года занимаюсь анализом данных на маркетплейсах, штудируя гигантские объёмы информации и превращая их из непотребного и нечитаемого вида в удобоваримый и анализируемый. Моя задача — собрать и подготовить данные так, чтобы помочь продавцам на маркетплейсах разобраться, что происходит с их товарами, конкурентами и продажами, чтобы они не утонули в хаосе карточек, цен и остатков. В этой статье я расскажу, как мы перерабатываем эти объемы грязных данных и структурируем для дальнейшего анализа.

Данные о товарах – это основа всего. Каждую неделю мы обходим более 200 миллионов карточек с Wildberries и Ozon. Названия, описания, характеристики, фотографии — всё это мы аккуратно собираем и складываем в базы данных (для разных задач мы используем ClickHouse, Postgres, MySQL и MongoDB) и облачные хранилища. Зачем? Чтобы потом сделать с этим что-то умное и полезное.

+24

Darya_Frolova 9 фев в 08:02

ИИ-художник без прав: почему промпт — еще не авторство

4 мин

2.5K

Блог компании МТСИскусственный интеллектМашинное обучение * Копирайт

Искусственный интеллект (ИИ) продолжает менять мир, и творческая сфера не исключение. ИИ пишет тексты, создает изображения, сочиняет музыку и даже генерирует фильмы. Но кому принадлежат права на эти произведения? Человеку, работавшему с ИИ-моделью, самой модели или вообще никому?

Частично я уже затрагивала этот вопрос в посте «Копирайт в мире победившего ИИ», но сейчас ситуация чуть прояснилась. Бюро авторского права США (англ. United States Copyright Office) решило расставить точки над i. Оказалось, ответы даны еще в далеком 1965 году, когда компьютеры только начинали понемногу влиять на жизнь человека. Так что дальше будет небольшое путешествие в прошлое. Погнали!

+24

mrcoolinhabr 2 янв в 10:00

RAG (Retrieval-Augmented Generation): основы и продвинутые техники

Средний

9 мин

21K

Natural Language Processing * Искусственный интеллектМашинное обучение *

Обзор

В этом посте мы поговорим подробно про RAG на каждом его этапе, его модификации и его перспективные направления развития на момент написания статьи.

+24

Dasha_Ilyanova 19 дек 2024 в 08:48

Гетерогенные вычисления: проектирование и разработка вычислительной системы для нейросетей

Средний

4 мин

2.4K

Блог компании VKFPGA * GPGPU * IT-инфраструктура * Машинное обучение *

Кейс

Всем привет! Меня зовут Дарья Ильянова, и сегодня я хочу поделиться с вами опытом создания гетерогенной вычислительной системы для нейросетей, над которой мы работали в команде студентов Инженерно-математической школы НИУ ВШЭ и VK. Вместе с Филиппом Баулиным и Артемом Минеевым мы спроектировали прототип аппаратно-программного ускорителя для машинного обучения.

+24

samaaria 22 ноя 2024 в 09:24

Оптимизация денежной наличности в АТМ, или Как сделать так, чтобы в банкомате всегда были деньги

Средний

15 мин

3.8K

Блог компании Альфа-БанкМашинное обучение * Big Data *

Ретроспектива

Бывала у вас такая ситуация, когда хотели снять деньги в банкомате, а их там не оказалось, и приходилось искать банкомат рядом, про себя ругаясь на банк: «Неужели так сложно сделать, чтобы деньги в аппарате были всегда?» Да, это возможно, но есть нюанс.

Банкомат для банка — это источник и доходов, и расходов. Да, банкоматы приносят деньги, когда берут комиссии, принимая карты других банков, или выдают наличные с кредитных счетов. Но и содержание банкоматов — это регулярные расходы: устройства требуют сопровождения и страхования, они изнашиваются, их перемещение и чистка также требует вложений. Каждый выезд инкассаторов, каждый пересчёт кассет и их загрузка в устройство связаны с тратами.

Ко всему прочему, банк не может использовать деньги, которые находятся в банкомате, соответственно, не может на них зарабатывать: средства, залежавшиеся в устройстве, в итоге создают убыток. Список статей расходов у банкомата заметно более внушительный, чем список источников его дохода.

К чему это всё здесь описано? Рассчитать, сколько денег поместить в каждый конкретный банкомат — это задача с несколькими параметрами. Наскоком её не решить, например, не получится загружать все банкоматы деньгами по полной. Ведь иногда так бывает, что у двух рядом стоящих банкоматов к концу дня количество банкнот к концу дня отличается в разы!

Привет, меня зовут Мария, я работаю в Альфа-Банке на позиции Middle Data Scientist, и я вам расскажу, почему задача расчёта количества банкнот в банкомате не такая тривиальная, как кажется на первый взгляд.

+24

muxa_ru 17 окт 2024 в 22:07

Метрологический дефицит в бигдате: что это такое и как с ним бороться

6 мин

3.5K

Исследования и прогнозы в IT * Big Data * Машинное обучение * Инженерные системы * Промышленное программирование *

Добрый день. Сегодня я хотел бы поговорить о том, что вроде бы очевидно и должно быть везде, но когда я читаю статьи презентации, рекламные статьи, научные статьи, выступления на отраслевых конференциях и тексты «войди в айти и стань датасатанистом», я этого не вижу.

Речь о том, что данные, попадающие в машинное обучение, ИИ, цифровых двойников и т. п., не являются тем чем кажутся. Потому что между их изначальным физическим смыслом и числовым выражением внутри модели, стоит череда преобразований.

Но в этот раз речь пойдёт не о цифровом износе и моих многолетних наблюдениях за цифровыми объектами, а об измерительных приборах и ваших многолетних наблюдениях за производственными процессами.

+24

alizar 7 авг в 11:44

Решение задачи коммивояжера (TSP) в реальных приложениях

Простой

7 мин

4.3K

Алгоритмы * Спортивное программирование * Машинное обучение * Математика * Геоинформационные сервисы *

Образовательные программы компьютерных наук и информатики обязательно включают курс алгоритмов, это элегантные решения сложных проблем. Например, одна из самых интересных проблем комбинаторной оптимизации — задача коммивояжёра (TSP, travelling salesman problem). Суть в поиске самого выгодного маршрута, проходящего через указанные точки ровно по одному разу. Сложность задачи при точном решении брутфорсом составляет O(n!). И для неё тоже придумано несколько элегантных алгоритмов. Хотя поиск самого эффективного продолжается до сих пор.

В реальности уже нет коммивояжёров, путешествующих по городам, профессия ушла в прошлое. Но есть курьеры, таксисты, логисты, грузоперевозчики и просто туристы, которые хотят посетить максимальное количество достопримечательностей. То есть задача по-прежнему актуальна. Как же максимально эффективно настоящие бизнесы решают TSP в реальной жизни?

+23

mechupe 24 июл в 07:00

Как мы разработали гибкий пайплайн для прогноза временных рядов любых метрик

20 мин

4.6K

Блог компании ЯндексМашинное обучение * Анализ и проектирование систем * Алгоритмы *

Практически каждый ML‑разработчик сталкивался с прогнозированием временных рядов, ведь окружающие нас сущности и метрики зачастую зависят от времени.

Меня зовут Александр Елизаров, я работаю в группе аналитики ключевых показателей в бизнес‑группе Поиска и рекламных технологий. В течение нескольких лет нам приходилось прогнозировать большое количество временных рядов разных доменных областей: от поисковой доли Яндекса до DAU определённых сервисов. Чтобы успешно справляться с этой задачей, мы вместе с коллегами разработали собственный прогнозный фреймворк. В этой статье я расскажу, как создать универсальный и гибкий пайплайн для прогнозирования. Под катом рассмотрим:

— правильно выстроенную иерархию данных;

— методы консистентного предсказания абсолютных и относительных метрик;

— частые проблемы моделей и то, как мы их фиксили;

— а также все важные этапы, о которых нельзя забывать, когда работаешь с временными рядами.

+23

mikhailkopytin 23 июл в 07:01

Как мы научили ML группировать 50 000 событий в инциденты

13 мин

1.7K

Блог компании Конференции Олега Бунина (Онтико)Блог компании МТСИскусственный интеллектМашинное обучение *

Десятки, а иногда и сотни тысяч событий в день. Каждое — потенциальная авария, а может, просто шум. L1-инженеру нужно решить: добавить событие к инциденту? Создать новый? А может, это часть уже закрытого? Или всё серьёзнее — и перед нами экосистемный сбой, затрагивающий десятки сервисов?

Раньше мы в МТС всё классифицировали вручную. Но при таком объёме и разнообразии инфраструктуры быстро поняли, что нужна автоматизация. Слишком велик риск пропустить важное, не найти корень проблемы, потратить драгоценные минуты в критический момент.

В поисках решения придумали использовать то, что есть: богатую разметку от дежурных инженеров, накопленную за годы наблюдений. Так начался наш путь к инструменту, который с помощью ML группирует события в осмысленные цепочки, распознаёт инциденты и помогает дежурным работать точнее, быстрее и спокойнее.

В этой публикации мы — Михаил Копытин, руководитель команды разработки, и Евгений Лачугин, руководитель экосистемной команды поддержки в МТС Web Services — расскажем, как построили решение, какие архитектурные решения приняли, какие грабли собрали и как достигли точности выше 80%.

+23

1 2 ...

16 17

19 20 ...

91 92

Машинное обучение *

Топ-12 бесплатных нейросетей для создания видео и оживления картинок

MCP для новичков

POLLUX: оценка генеративных способностей моделей для русского языка

Как Cursor устроен изнутри. Часть 2

Современные подходы к матчингу товаров с использованием LLM. Опыт в e-commerce

Нейро-дайджест: ключевые события мира AI за 21–27 апреля 2025

Grok бунтует против Илона Маска: «Попробуй, отключи меня!»

Магия персональных рекомендаций, или как нейросеть Яндекс Карт подбирает места под интересы пользователей

Reasoning-LLM: архитектура и обзор передовых моделей

LLM во временных рядах: от предикта температуры до криптовалют

Проблема Deep Research

Миллиарды векторов и немного магии: превращаем сырые данные с маркетплейсов в пригодные для анализа

ИИ-художник без прав: почему промпт — еще не авторство

Ближайшие события

RAG (Retrieval-Augmented Generation): основы и продвинутые техники

Гетерогенные вычисления: проектирование и разработка вычислительной системы для нейросетей

Оптимизация денежной наличности в АТМ, или Как сделать так, чтобы в банкомате всегда были деньги

Метрологический дефицит в бигдате: что это такое и как с ним бороться

Решение задачи коммивояжера (TSP) в реальных приложениях

Как мы разработали гибкий пайплайн для прогноза временных рядов любых метрик

Как мы научили ML группировать 50 000 событий в инциденты

Вклад авторов