Машинное обучение *

Основа искусственного интеллекта

СтатьиПостыНовостиАвторыКомпании

s231644 8 ноя 2024 в 13:50

Понимают ли большие языковые модели данные из таблиц?

Средний

7 мин

Блог компании SberDevicesМашинное обучение * Natural Language Processing *

Кейс

Всем привет! С вами команда IDP. Сегодня расскажем о том, как мы оцениваем языковые модели для ответов на вопросы по таблицам.

Наша команда занимается интеллектуальной обработкой документов, и мы нередко сталкиваемся с документами, содержащими таблицы. Человек обычно анализирует их, опираясь на геометрию и визуал (границы ячеек, выделение заголовков, выравнивание текстов в ячейках). Таблицы — это двумерные объекты, языковые модели же работают с одномерными последовательностями токенов. Это наталкивает на вопрос: а насколько хорошо LLM справляются с анализом таблиц в документах?

Мы заинтересовались этой темой неслучайно — в одном из проектов мы работали над вопросно‑ответной системой для технической документации. Большинство вопросов относилось именно к таблицам, причем таблицы были достаточно сложными, с длинными названиями столбцов, формулами и многоуровневыми заголовками. В один момент мы уперлись в потолок по метрикам и тогда решили провести более тщательное исследование.

+26

Nikolay_Pervukhin 4 окт 2024 в 11:18

Внешняя видеокарта backend-разработчика, или как заставить лучшего друга перестать тупить и начать помогать (часть 1)

Простой

7 мин

9.6K

Блог компании Ozon БанкМашинное обучение *

Туториал

Всем привет! Меня зовут Николай Первухин. Я увлеченный разработчик на GoLang, работаю в Ozon Банке в группе разработки сервисов ЗСК (KYC).

Большинство статей о внешней видеокарте посвящены погоне за FPS в играх. Здесь же я хочу сконцентрироваться на том, как заставить её приносить пользу разработчику.

+26

maksimov_m 20 сен в 19:31

Как запустить свою LLM для инференса. Руководство по запуску: Ollama, vLLM, Triton, LM Studio, llama.cpp, SGLang

Средний

11 мин

13K

Машинное обучение * Python * DevOps *

Туториал

В этой статье будет приведено практическое руководство по базовой настройке и запуску следующих инструментов для работы с LLM: Ollama, LM Studio, vLLM, Triton, llama.cpp, SGLang.

🔥 Начинаем? 🔥

+25

aibrain 11 сен в 07:22

Современные генеративные модели и приложения на их основе

7 мин

2.2K

Блог компании AIRIБлог компании МТСМашинное обучение * Искусственный интеллект

Обзор

Привет, Хабр! Меня зовут Айбек Аланов. Я руковожу группой Controllable Generative AI в FusionBrain Lab Института AIRI и Центром глубинного обучения на байесовских методах в Институте искусственного интеллекта и цифровых наук НИУ ВШЭ и занимаюсь GenAI: работаю с cutting-edge-моделями и помогаю им стать частью прикладных решений.

В последние годы это одно из самых горячих направлений в машинном обучении. Нейросети не просто понимают данные, но и создают что-то новое: от картинок и видео до сложных 3D-объектов или дизайна молекул.

В этом материале по мотивам моего доклада с True Tech Day я расскажу, что происходит в этой области прямо сейчас. Какие архитектуры используются? На что способны современные модели? И самое главное, как все это применить в реальных задачах.

+25

VIzvekov 28 авг в 10:54

Как и зачем мы в YADRO сделали свою MLOps-платформу

Средний

13 мин

5.2K

Блог компании YADROМашинное обучение * Искусственный интеллектIT-инфраструктура * Высоконагруженные системы *

Обзор

В нашей компании есть много проектов, связанных с AI. Всем им нужны ресурсы для работы с моделями на GPU. «Хотим, чтобы только мы имели доступ к оборудованию», — это лишь одно из требований инженеров из AI-дивизиона, а еще нужно оптимизировать использование GPU-ресурсов, вести их учет и быстро подготавливать оборудование к передаче другой команде.

Привет, Хабр! Меня зовут Вадим Извеков, я руководитель группы сопровождения платформы машинного обучения в YADRO. Сегодня расскажу, почему мы решили создать свою MLOps-платформу, как она устроена и для чего используется.

+25

cognitronn 24 авг в 11:32

Топ-5 нейросетей и AI-сервисов для перевода текста: лучшие переводчики 2025 года

Простой

9 мин

20K

Блог компании BotHubИскусственный интеллектМашинное обучение * Научно-популярноеБудущее здесь

Обзор

Когда-то перевод был медленным и мучительным. Только вспомните… словари, справочники, стопки заметок и десятки открытых вкладок. В своё время мы даже бегали к соседям, которые хоть немного знали нужный язык, и слушали их как настоящих мудрецов. Теперь же у нас появились алгоритмы.

Вы бросаете в них страницу текста и она тут же возвращается обратно, словно прошла через языковой портал. Пока вы ломаете голову над одним выражением, нейросеть успевает проглотить целую книгу.

Сегодня мы откроем пять таких порталов и посмотрим, как они справятся с двумя испытаниями: строгим научным текстом, отрывком художественного произведения и стихом.

Приятного чтения!

+25

Wonderlove 14 авг в 14:05

Нейро-дайджест: ключевые события мира AI за 2 неделю августа 2025

Средний

8 мин

Блог компании Timeweb CloudИскусственный интеллектМашинное обучение * Будущее здесьIT-компании

Дайджест

Привет! Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.

Неделя выдалась насыщенной: OpenAI выпустили GPT-5 и открытые LLM, Anthropic представили Claude Opus 4.1, а Google анонсировали игровой ИИ-движок Genie 3. o3 уничтожила Grok 4 на шахматном турнире, а Премьер Швеции признался, что советуется с ChatGPT.

Всё самое важное — в одном месте. Поехали!

Читать дайджест

+25

trashchenkov 11 авг в 06:00

Современный ReAct-агент: подробное руководство по созданию с помощью LangGraph

Средний

18 мин

9.6K

Блог компании СберМашинное обучение * Искусственный интеллект

Туториал

Привет, на связи команда GigaChain!

ReAct — фундаментальный паттерн, с которого началась эра LLM-агентов. Но как его реализовать сегодня, используя всю мощь function-calling и графовую логику? Разбираем эволюцию концепции, проводим чёткую грань между LangChain и LangGraph и пошагово разбираем создание гибкого ReAct-агента на современном стеке. Никакой магии, только воспроизводимый код и понятная теория.

+25

olegnazarov 24 июл в 11:05

За неделю от ночных кошмаров до спокойного сна: как я автоматизировал защиту от AI-хакеров

Средний

12 мин

5.1K

Искусственный интеллектИнформационная безопасность * DevOps * Python * Машинное обучение *

Никто не любит быть тем парнем, который говорит «а давайте еще и защиту поставим». Особенно когда речь идет о блестящем новом AI‑продукте, который должен был запуститься «еще вчера». Но когда твой корпоративный чат‑бот начинает выдавать системные промпты направо и налево, а в 2 ночи тебе в Telegram прилетают сообщения «СРОЧНО! Хакеры взломали бота!» — понимаешь, что без брони в бой идти нельзя.

+25

cognitronn 12 мая в 13:05

Топ-5 бесплатных нейросетей для анимации картинок

Простой

16 мин

83K

Блог компании BotHubИскусственный интеллектМашинное обучение * Компьютерная анимация * Будущее здесь

Обзор

Технологии развиваются настолько быстро, что не успеваешь моргнуть глазом, и вот уже глазами моргают статичные фотографии прошлого века. Да‑да, мы говорим об анимации изображений. Если ещё пару лет назад это казалось чем‑то «на грани фантасмагории», то сегодня это настолько въелось в нашу жизнь, что обычный пост с анимированным изображением уже не вызывает эффекта «ВАУ, как это сделали?». Картинки не только шевелятся, моргают и улыбаются — они живут своей жизнью и даже коллабятся с другими!

Сегодня мы решили проверить возможности нейросетей. Насколько далеко они шагнули? Смогут ли они не просто заставить лицо моргнуть или улыбнуться, а действительно вдохнуть жизнь в статичные картинки?

А чтобы сделать эксперимент интереснее, мы выбрали для испытаний культовых персонажей мировой истории. Что скажете, если Юлий Цезарь улыбнётся вам с экрана? Всё увидите сами — не переключайтесь!

Приятного Вам прочтения!

+25

BaDInMe 5 мая в 09:03

ML-обработка видео в web-браузере для видеоконференций SaluteJazz

Средний

14 мин

748

Блог компании Конференции Олега Бунина (Онтико)Работа с видео * Машинное обучение *

Кейс

Нейросеть, сегментирующая изображение человека в кадре: как ускорить её в четыре раза?

Привет, Хабр! Это Дмитрий Балиев из SberDevices. В этой статье речь пойдёт о том, как мы обрабатываем алгоритмами видео в Web-браузерах для сервиса конференции SaluteJazz.

Расскажу про контекст и ограничения, сам движок и особенности его реализации. Раскрою тайну, как мы работаем с графами вычислений, как инферим нейросети, и как затем всё это собираем, оптимизируем и тестируем. В конце — несколько полезных советов, как делать нейросети удобнее для встраивания.

+25

shwars 22 апр в 07:00

«Чистый берег»: как нейросеть в облаке помогает с уборкой побережья Камчатки и Арктики

13 мин

2.2K

Блог компании ЯндексБлог компании Yandex Cloud & Yandex InfrastructureМашинное обучение * Искусственный интеллектЭкология

Ежегодно в Мировой океан попадает более 11 млн тонн пластика — его накопление в водоёмах угрожает не только отдельным видам птиц и животных, но и целым природным экосистемам. В России эта проблема проявляется не столь остро, как, например, в странах Юго‑Восточной Азии, но тем не менее морской мусор встречается регулярно.

В 2024 году команда специалистов Дальневосточного федерального университета (ДВФУ), Кроноцкого заповедника, Центра технологий для общества Yandex Cloud и Школы анализа данных Яндекса (ШАД) запустила проект «Чистый берег», результатом которого стала разработка нейросети, обученной распознавать определённые виды мусора на побережье, что, в свою очередь, позволяет определить его массу и объём.

Меня зовут Дмитрий Сошников, и в этом проекте я выступил в качестве научного руководителя студентов ШАД. В статье расскажем, как готовили данные и обучали нейросеть, какие технологии для этого использовали и как приложения на основе ML помогают планировать работу исследователей и волонтёров.

+25

AleksandrPimanov 21 апр в 12:07

Новые LLM от Google в 2025 году: генерация идей, голосов, картинок… и песни дельфинов

5 мин

1.7K

Блог компании МТСИскусственный интеллектIT-компанииМашинное обучение *

Привет, Хабр! Меня зовут Саша Пиманов, в МТС я занимаюсь разработкой. Мне нравится следить за глобальными трендами в области, и сегодня хочу обсудить новые LLM от Google. На конференции Google Cloud Next 2025 в Лас-Вегасе компания показала, как усовершенствовала модели Gemini, и представила новые инструменты для создания музыки, видео и изображений. Было много идей для бизнеса, творческого комьюнити и защиты окружающей среды. А еще — необычные проекты вроде анализа вокализаций дельфинов.

+25

tmilovanov 4 апр в 14:00

Как мы пишем ML-приложения с использованием паттерна пайплайнов

Средний

10 мин

3.9K

Блог компании Т-БанкGo * Программирование * Машинное обучение *

Кейс

Привет, Хабр! Я Тимофей Милованов, ведущий Golang-разработчик в команде VoiceKit, где мы занимаемся голосовыми технологиями. Мы разрабатываем сервисы по распознаванию и синтезу голоса, преобразованию одного голоса в другой, а еще голосовой биометрией.

Расскажу о том, почему структура этих сервисов похожа на пайплайн, почему Golang отлично подходит для реализации пайплайнов и как мы написали свою библиотеку для этих пайплайнов.

+25

Pahandrovich 31 мар в 11:02

Как мы учили нейросеть разбираться в сложных документах: задача семантического поиска

Средний

17 мин

4.9K

Блог компании YADROИскусственный интеллектПоисковые технологии * Машинное обучение *

Привет! Меня зовут Павел Яковлев, я инженер по разработке ПО искусственного интеллекта в YADRO. В команде GenAI мы занимаемся умными продуктами на основе корпоративных баз данных.

В проектах мы часто используем современные генеративные модели и энкодеры. В статье расскажу, как мы в компании разрабатываем и оптимизируем семантический поиск по сложным документам: PDF, HTML и DOCX.

+25

DenisBerezutskiy 18 мар в 10:13

«Ошибка на миллиард» в ИИ: боремся с галлюцинациями в LLM по аналогии с NullPointerException

Средний

20 мин

4.6K

Блог компании YADROИскусственный интеллектМашинное обучение * Big Data *

Привет! Меня зовут Денис Березуцкий, я старший инженер по разработке ПО искусственного интеллекта в YADRO. В ML-команде мы разрабатываем системы, которые облегчают работу нашим заказчикам с помощью текстовых генеративных нейросетей: реализуем RAG, создаем чат-ботов, агентные системы и другие решения.

Как и многие в индустрии, мы сталкиваемся с проблемами галлюцинаций LLM, которые портят ответы виртуальным ассистентам и способны подорвать доверие к ним. В статье я расскажу об одном не совсем стандартном методе, перенесенном из «классического» программирования, который мы применяем для борьбы с галлюцинациями и улучшения поисковой выдачи.

+25

took_the_lead 30 янв в 06:09

Мануал по запуску полной модели DeepSeek-R1 локально (бюджет ~6k$)

4 мин

61K

Компьютерное железоDevOps * Машинное обучение * Искусственный интеллект

Туториал

Давеча наткнулся в экс-~~Твиттере~~ на интересный тред (https://x.com/carrigmat/status/1884244369907278106?s=52) о том, как запустить самую мощную (на сегодня) ИИ reasoning модель DeepSeek-R1 прямо у себя под столом.

DeepSeek-R1 — это одна из топовых моделей (из Китая), наделавших много шума (и не только), для задач логики, математики и программирования. Она настолько умная, что может (с некоторыми оговорками) "конкурировать" с решениями от OpenAI, но при этом её можно запустить локально, без интернета, ~~без смс~~ и полностью контролировать весь процесс.

Почему это круто?
* все данные остаются с вами, никакие сторонние сервисы не получат доступ к вашим запросам.
* запуск на своём железе избавляет от затрат на облачные сервисы.
* модель способна решать сложные задачи и выдавать результаты на уровне профессионалов.

В статье я расскажу:
* какое оборудование нужно для запуска DeepSeek-R1.
* чем локальный запуск отличается от серверного.
* какие возможности открывает эта модель и как она может быть полезна.
* как сохранить безопасность и приватность при работе с ИИ.

В этом мануале описано, как настроить локальный запуск модели DeepSeek-R1 Q8, сохраняя максимальное качество и производительность без дистилляции или уменьшенной квантизации. Общая стоимость сборки составит около ~$6,000, и ниже приведены все необходимые ссылки на компоненты и инструкции.

+25

interned 25 сен в 12:47

Ускорение инференса ML-моделей без лишних трат

Средний

15 мин

1.6K

Блог компании ДомкликМашинное обучение * Искусственный интеллект

Туториал

Всем хорошего дня! На связи с вами Домклик и Денис Захаров из команды чат-ботов. В этой статье я расскажу вам, как можно ускорить нейронки, не прибегая к закупке дорогостоящего оборудования. Статья написана по мотивам моего выступления на конференции HighLoad++ 2024.

+24

cognitronn 17 сен в 12:14

Топ-12 бесплатных нейросетей для создания видео и оживления картинок

Простой

13 мин

40K

Блог компании BotHubИскусственный интеллектМашинное обучение * Научно-популярноеБудущее здесь

Обзор

Когда вы в последний раз поднимали взгляд к звёздам и думали: «А вдруг где-то там действительно есть жизнь?»

Космос всегда был для нас не только загадкой, но и сценой для фантазий. Учёные ищут ответы в телескопах и формулах, а мы решили погнаться за модой и спросить у нейросети.

Сегодня достаточно пары слов — и алгоритмы нарисуют целые миры. Теперь режиссёром становится ваше воображение, которое неплохо так заправлено искусственным интеллектом.

Мы протестируем 12 сервисов и посмотрим, смогут ли они превратить безмолвный космос в оживший пейзаж и заселить его инопланетными героями.

Да пребудет с тобой Сила, нейросеть… и пусть твои звёзды не рендерятся сутками!

Приятного чтения!

+24

Squirrelfm 14 июл в 05:54

MCP для новичков

Простой

6 мин

13K

Блог компании RaftИскусственный интеллектМашинное обучение *

Туториал

Model Context Protocol (MCP) - это просто API, разработанный для LLM. Конечно, LLM могут использовать традиционные API, но это как просить повара готовить в кладовке.

+24

1 2 ...

15 16

18 19 ...

91 92

Машинное обучение *

Понимают ли большие языковые модели данные из таблиц?

Внешняя видеокарта backend-разработчика, или как заставить лучшего друга перестать тупить и начать помогать (часть 1)

Как запустить свою LLM для инференса. Руководство по запуску: Ollama, vLLM, Triton, LM Studio, llama.cpp, SGLang

Современные генеративные модели и приложения на их основе

Как и зачем мы в YADRO сделали свою MLOps-платформу

Топ-5 нейросетей и AI-сервисов для перевода текста: лучшие переводчики 2025 года

Нейро-дайджест: ключевые события мира AI за 2 неделю августа 2025

Современный ReAct-агент: подробное руководство по созданию с помощью LangGraph

За неделю от ночных кошмаров до спокойного сна: как я автоматизировал защиту от AI-хакеров

Топ-5 бесплатных нейросетей для анимации картинок

ML-обработка видео в web-браузере для видеоконференций SaluteJazz

«Чистый берег»: как нейросеть в облаке помогает с уборкой побережья Камчатки и Арктики

Новые LLM от Google в 2025 году: генерация идей, голосов, картинок… и песни дельфинов

Ближайшие события

Как мы пишем ML-приложения с использованием паттерна пайплайнов

Как мы учили нейросеть разбираться в сложных документах: задача семантического поиска

«Ошибка на миллиард» в ИИ: боремся с галлюцинациями в LLM по аналогии с NullPointerException

Мануал по запуску полной модели DeepSeek-R1 локально (бюджет ~6k$)

Ускорение инференса ML-моделей без лишних трат

Топ-12 бесплатных нейросетей для создания видео и оживления картинок

MCP для новичков

Вклад авторов