Как стать автором

Машинное обучение *

Основа искусственного интеллекта

СтатьиПостыНовостиАвторыКомпании

runaway_llm 10 июл в 05:17

В два раза лучше ChatGPT o3. Представлен Grok 4

Простой

2 мин

20K

Машинное обучение*Искусственный интеллект

Обзор

Компания xAI представила свои новые ИИ‑модели — Grok 4 и Grok 4 Heavy, в котором несколько агентов работают над проблемой параллельно. По утверждениям xAI, это позволило добиться значительного роста в производительности.

Читать далее

+17

cognitronn 9 июл в 13:01

Midjourney Video: как превратить картинку в видео в 2025 году?

Простой

8 мин

6.3K

Блог компании BotHubМашинное обучение*Будущее здесьРабота с видео*Искусственный интеллект

Обзор

Казалось бы, только мы отдохнули от разбора второй волны нейросетей для генерации видео, как без объявления войны выходит она. Midjourney, та самая платформа, которая годами оставалась в стороне от видео-движухи, делает свой первый аккуратный, но амбициозный шаг. Встречайте: Midjourney Video V1, первая версия анимации, встроенной прямо в интерфейс.

Сегодня расскажем, как работает новая функция, что там с платформой и ценообразованием, чем отличаются режимы движения, и, конечно, как писать грамотные промпты для этой нейросети.

Приятного чтения!

Читать далее

+16

art_pro 9 июл в 11:44

Need for speed: оценка ошибок измерений в футбольной аналитике. Часть 1

Средний

11 мин

5.9K

Машинное обучение*Искусственный интеллектПрограммирование*Работа с видео*

Кейс

Привет! Меня зовут Артем, и я занимаюсь разработкой систем компьютерного зрения в сервисе Яндекс Спорттех. Среди основных задач нашей команды — футбольная аналитика и работа со статистическими данными.

Яндекс Спорттех обеспечил интеграцию технологических решений в РПЛ — все стадионы участников чемпионата были оборудованы камерами 6К, для клубов организована передача в режиме онлайн фитнес-данных и продвинутых данных на стыке технико-тактических действий. С помощью современных методов компьютерного зрения мы осуществляем детекцию игроков и мяча, ведём их трекинг, а также вычисляем различные ключевые спортивные метрики — пройденные дистанции, максимальные скорости, спринты и рывки, а также экстренные торможения и другие фитнес-показатели, важные как для аналитиков, так и для тренеров и поклонников игры.

В этих двух статьях мы подробно рассмотрим, почему точное измерение скорости движения и пройденной дистанции игроков критически важно для качественного анализа футбольных матчей. Расскажем, почему любые систематические ошибки и неточности могут весьма существенно исказить выводы и рекомендации для тренерского штаба и аналитиков.

А ещё поделимся нашим опытом, расскажем о типичных источниках ошибок, возникающих при расчёте скорости и пробега, и опишем подходы, которые позволяют уменьшить их влияние.

Читать далее

+12

LukichevaPolina 9 июл в 10:43

Как мы улучшили режим ночной съемки в планшетах KVADRA_T

Средний

7 мин

1.8K

Блог компании YADROОбработка изображений*Машинное обучение*Искусственный интеллект

Привет, Хабр! На связи Полина Лукичева, инженер команды AI ML Kit в компании YADRO. В первой статье я рассказала о проблемах режима ночной съемки и методах их решения. Сегодня перехожу к практике — проведу предметное сравнение алгоритмов, выберу наиболее подходящие и покажу, как они работают в реальных условиях на планшетах KVADRA_T.

Для наших заказчиков качественные снимки в условиях низкой освещенности — рабочая необходимость. Планшет поможет снять показания со счетчика в темном подвале или сфотографировать паспорт клиента в коридоре с минимальными шумами и максимальной четкостью.

Читать далее

+21

Sber 9 июл в 05:53

На пути к эмоциональному искусственному интеллекту

Средний

7 мин

2K

Блог компании СберМашинное обучение*Искусственный интеллект

Обзор

Привет, Хабр. Меня зовут Андрей Савченко, я научный директор Sber AI Lab. Когда речь заходит про эмоциональность и принятие решений у ИИ, нужно задать себе вопрос: «А как это устроено у людей?» Наверняка почти каждый из вас ответил бы, что он принимает решение рационально, а остальные, зачастую, иррационально.

Нейропсихологи проводили исследования и выяснили, что большинство решений люди принимают эмоционально. С одной стороны, это экономит ресурсы мозга, а с другой — позволяет быстрее принимать решения. И поэтому очень важно учитывать нашу эмоциональность при взаимодействии с другими и при создании имитации людей или сообществ с помощью современных генеративных моделей. Условно это можно назвать эмоциональным искусственным интеллектом.

Читать далее

+16

Sber 8 июл в 07:53

Google I/O 2025: Gemini, Google Beam, умные очки и другие ключевые анонсы

Простой

6 мин

1.9K

Блог компании СберМашинное обучение*Искусственный интеллектБраузерыAR и VR

Обзор

В мае этого года прошла конференция Google I/O 2025, где компания представила целый ряд технологических новинок и обновлений своих флагманских продуктов. В этой статье подробно пройдёмся по ключевым анонсам мероприятия.

Читать далее

+13

pavel_babin 8 июл в 07:50

Скучная правда про LLM: эффект дают не громкие слова, а простые сценарии с очевидной ценностью

6 мин

7.8K

Блог компании МТСМашинное обучение*Управление продуктом*Анализ и проектирование систем*

Обзор

Привет, Хабр! Вы, наверное, часто слышали, как топы западных ИТ-компаний хвалятся: «Сейчас внедрим LLM вместо сотрудников и будем только смотреть, как за нас работают видеокарты». Спешу вас расстроить — к сожалению (или к счастью), этого не случится.

Меня зовут Павел Бабин, я CPO облачной платформы MWS GPT — сервиса, через который можно работать с open source LLM и моделями от МТС. В этом материале по мотивам моего доклада с True Tech Day я расскажу, что реальное применение LLM не такое крутое, как кажется по новостям, пестрящим заголовками типа «новая супер-мульти-гига-мега-агентная система сделает все за вас». На самом деле кейсы, которые дают заметные бизнес-эффекты, начинаются с простых вещей. Я приведу несколько таких примеров без сложных пайплайнов и кастомных моделей, но с понятной ценностью.

Читать далее

+39

KuznetsovRS 8 июл в 05:41

Вот так подкрути геймификацию и мотивация болеть не будет

Простой

5 мин

8K

Блог компании Альфа-БанкМашинное обучение*Big Data*Управление персоналом*

Кейс

В учебнике обществознания за 9 класс есть определение экономики как науки: «Экономика — наука о том, как люди удовлетворяют свои постоянно растущие потребности в условиях ограниченности ресурсов». Точно так и в разметке — нам нужно удовлетворить свои постоянно растущие потребности в объёмах и качестве разметки, а бюджет ограничен. Помочь нам в этом может система мотивации.

Привет! Меня зовут Кузнецов Роман. Я занимаюсь разметкой и модерацией данных в Альфа-Банке. В этой статье хочу поднять извечную задачу — как мотивировать разметчиков делать много и качественно, но при этом за те же деньги (вместо разметчиков поставьте своё). Расскажу, как мы в банке нематериально мотивировали ребят, ввели геймификацию и даже повысили их творческую активность!

Читать далее

+15

Flcktr 7 июл в 15:39

Опыт миграции DWH и сложности, которые при этом возникают

Простой

5 мин

1.5K

Блог компании FlocktoryМашинное обучение*Облачные сервисы*

Обзор

Привет, меня зовут Владимир, я работаю во Flocktory дата-инженером и расскажу о том, как мы в процессе переезда с одного облака на другое построили фиче-стор, управленческую отчетность и о проблемах, с которыми мы столкнулись.

В 2022 году у нас появилась задача — нужно было перебраться на новое облако, перетащить порядка петабайта данных и начать использовать новые инструменты. И на фоне этого были еще две задачи:

Читать далее

+11

dmitrifriend 7 июл в 15:22

Топ LLM для задач text‑to‑SQL: результаты теста DeepSeek R1-0528, Gemini 2.5 Pro, o3 (и ещё трёх моделей)

Средний

13 мин

5.7K

Блог компании BotHubМашинное обучение*Искусственный интеллектБазы данных*Программирование*

Обзор

В первой части мы разобрали теорию text‑to‑SQL: как LLM заменяют разработчиков, почему RAG и CoT спасают от галлюцинаций и зачем Scale AI дообучает ChatGPT-4. Но теория неполна без практики! В этом материале — жёсткое тестирование моделей (ChatGPT o3-mini‑high, ChatGPT 4.1, Claude Sonnet 4, ChatGPT o3, Gemini 2.5 Pro, DeepSeek R1–0528) на бенчмарке LiveSQLBench.

6 моделей, 10 задач, сложность от ★★ до ★★★★★★★★★★. Проверим, как они считают лунные помехи, генерируют SQL для криптобирж и ищут артефакты в музеях.

Читать далее

+18

dmitrifriend 7 июл в 12:03

Современные подходы «из текста в SQL»: RAG, CoT и другие хитрости

Средний

12 мин

4.8K

Блог компании BotHubБазы данных*Искусственный интеллектМашинное обучение*Программирование*

Обзор

Как превратить текст «Сколько было продано камер в прошлом месяце?» в осмысленный SQL‑запрос? Это и есть задача text‑to‑SQL (ее ещё называют NL2SQL). Для многих компаний сейчас очень важна возможность задавать вопросы к данным обычным языком, без изучения SQL. Для этой задачи написаны десятки инструментов, но суть одна — генерация корректного запроса из фразы на человеческом языке.

Требование проясняется примером: бизнес‑пользователь хочет узнать: «Какие топ-5 товаров по выручке за вчерашний день?» — а система превращает это в SELECT product, SUM(revenue) ... LIMIT 5 и выдаёт результат. До недавнего времени требовались сложные пайплайны или ручное кодирование, а сейчас на сцене — большие языковые модели (LLM) и всякие прокачанные методы достучаться до них.

В этой статье мы пробежимся по ретро‑ и ультрасовременным подходам к text‑to‑SQL. Плюс обзору добавим практических инсайтов.

Читать далее

+13

GiantLynx 7 июл в 10:27

KoboldCpp — нейросеть для развлечений и работы у нас дома

Простой

16 мин

12K

СофтИскусственный интеллектМашинное обучение*

Туториал

Представьте, что вы развернули у себя дома полноценную языковую модель — не платного чат-бота из облака с его фильтрами, задержками и цензурой, а вполне безлимитную LLM, которая может быть и надёжным помощником по работе, и вашей вайфу… на абсолютно любую тему. И в 2025 году это уже работает неожиданно хорошо.

Ещё год назад за достойное ролевое общение приходилось платить подиской Character.AI или бороться с ограничениями, но теперь — всё иначе. Домашний чатбот не только не уступает по качеству, но и во многом выигрывает: всего за 5 минут можно добавить генерацию изображений, озвучку (TTS), понимание речи (STT) и полную автономность — без облаков, логов и подписок.

Читать далее

+35

alizar 7 июл в 09:01

Георгий Герганов, автор llama.cpp и звукового кейлогера

6 мин

15K

Блог компании RUVDS.comМашинное обучение*СофтИскусственный интеллектNatural Language Processing*

Многие пользуются YouTube, Netflix, но не подозревают о ключевых опенсорсных программах типа ffmpeg, которые работают на бэкенде этих сервисов. Похожая ситуация с нейронками, где многие знают программу Ollama для локального запуска моделей на CPU. Но мало кто понимает, что это всего лишь простенькая оболочка вокруг опенсорсной библиотеки llama.cpp на С, которая и делает инференс. Автор этой библиотеки, талантливый разработчик Георгий Герганов, мало известен широкой публике.

Читать далее

+125

FirstJohn 7 июл в 08:41

Странная физика, которая дала жизнь искусственному интеллекту

Средний

12 мин

8.9K

Блог компании FirstVDSМатематика*ФизикаИскусственный интеллектМашинное обучение*

Перевод

Современные «мыслящие» машины возникли благодаря открытиям в области физики сложных материалов.

Спиновые стекла могут оказаться самыми полезными из бесполезных вещей, когда-либо обнаруженных.

Эти материалы — обычно состоящие из металла, а не стекла — демонстрируют загадочное поведение, которое заинтересовало небольшое сообщество физиков в середине 20-го века. Спиновые стекла сами по себе не имеют какого-либо практического применения, но теории, разработанные для объяснения их странностей, в конечном итоге вызвали сегодняшнюю революцию в области искусственного интеллекта.

В 1982 году учёный, изучающий физику конденсированного состояния, Джон Хопфилд, позаимствовал теорию спиновых стёкол, чтобы построить простые сети, которые могли учиться и иметь воспоминания. Сделав это, он оживил изучение запутанных сетей цифровых нейронов, которые были в значительной степени заброшены исследователями искусственного интеллекта, — и вывел физику в новую область: изучение разума, как биологического, так и механического.

Читать далее

+14

nonpareil_coder 6 июл в 20:07

Оптимизация языковой модели Mamba для выполнения на CPU

Сложный

4 мин

3.2K

Assembler*C*C++*Искусственный интеллектМашинное обучение*

Туториал

Как оптимизировать модель Mamba для выполнения на CPU? Ускоряем код в 20 раз по сравнению с PyTorch, нарушая в процессе все правила оптимизации.

Читать далее

+17

Demanih 6 июл в 04:15

Собираем комплекс для качественного офлайн-перевода текстов, работающий на самом обычном игровом компьютере

Простой

11 мин

5.1K

Машинное обучение*Подготовка технической документации*Семантические сети*

Из песочницы

Recovery Mode

Всем привет. В последнее время перевод текстов с одного языка на другой уже не вызывает такой головной боли, как раньше: есть несколько качественных онлайн-переводчиков, есть большие нейросети, которые тоже можно попросить перевести текст, — в общем, варианты есть, их довольно много, и они выдают вполне приемлемый результат. Но у всех них есть одно ограничение: они работают онлайн (удалённо). Для кого-то это ограничение несущественно, а для кого-то может быть критично. Мне же просто захотелось иметь что-то, что сможет переводить тексты на хорошем (современном) уровне офлайн (сугубо на моём компьютере). Ну, люблю я, когда всё, что мне нужно, может работать и локально тоже. В общем, ниже я делюсь с вами тем, что мне удалось в итоге собрать, запустить и даже получить удовлетворяющий меня результат.

Читать далее

+11

NickRoot69 4 июл в 13:16

Я построил Vision Transformer с нуля — и научил его обращать внимание

Простой

6 мин

5.7K

Искусственный интеллектМашинное обучение*Python*

Из песочницы

В этой статье я не просто объясню, что такое ViT — я покажу вам, как создать эту магию своими руками, шаг за шагом, даже если вы никогда раньше не работали с трансформерами для задач с изображениями.

Читать далее

+10

Darya_Frolova 4 июл в 12:00

Llama 3.1 и «Гарри Поттер»: сколько текста действительно запоминает ИИ?

5 мин

6.3K

Блог компании МТСМашинное обучение*Искусственный интеллект

Может ли искусственный интеллект запомнить целую книгу? А если да, что это значит для авторов, издателей и самих разработчиков ИИ? Недавнее исследование от ученых из Стэнфорда, Корнелла и Университета Западной Виргинии показало, что языковая модель Llama 3.1 может дословно воспроизвести до 42% текста «Гарри Поттера и Философского камня». Это заставляет усомниться в механизмах ограничения памяти ИИ и поднимает вопросы о защите авторских прав. Дальше — как раз об этом.

Читать далее

+49

netcitizen 3 июл в 15:40

Разбор заданий AI CTF на Positive Hack Days Fest. Часть 1

Средний

31 мин

2.3K

Блог компании Positive TechnologiesМашинное обучение*Искусственный интеллектCTF*Информационная безопасность*

Ретроспектива

Машинное обучение применяется везде: модели советуют врачам лекарства, помогают банкам ловить мошенников и пишут код вместо программистов. Проблемы с безопасностью в таких системах могут стоить денег, данных и репутации. Поэтому с 2019 года на конференции по безопасности PHDays мы проводим отдельный AI Track, а в рамках него — AI CTF, соревнование по взлому ML-систем.

Месяц назад мы провели AI CTF 2025 и хотим рассказать, какие задания мы придумали для участников, и какие атаки на AI и ML в них нужно было провернуть. На AI CTF 2025 было 14 заданий разного уровня и тематики, и 40 часов на их решение. В первой части мы с авторами разберем 8 заданий — те, что попроще.

Читать далее

+16

Oleg_Nikishenkov 3 июл в 14:21

Нейросеть приближается к опыту профессионального дерматолога

Средний

9 мин

1.9K

Блог компании Leader-IDИскусственный интеллектМашинное обучение*Программирование*Научно-популярное

Кейс

Наконец наступило лето, а с ним и пора отпусков. Уезжая на южные моря, не забывайте: большинство из нас имеет типичную для северянина кожу с пониженным содержанием меланина — пигмента, отвечающего за защиту от ультрафиолета. Если кожа отреагировала непонятным новообразованием, вызывающим опасения, теперь можно проконсультироваться с искусственным интеллектом. Он предварительно осмотрит кожу и посоветует, бежать ли ко врачу, за которым, конечно, всегда последнее слово. К слову, данная медицинская ИИ-технология, как и публикация, не является медицинской рекомендацией: диагноз ставит лечащий врач.

Читать далее

+16

3

4 5 ...