Все потоки

Машинное обучение *

Основа искусственного интеллекта

СтатьиПостыНовостиАвторыКомпании

aufklarer 6 сен в 08:31

Fine-tune Qwen3 Embeddings для классификации категорий товаров

Средний

4 мин

3.9K

Машинное обучение * Natural Language Processing *

Туториал

Мы взяли размеченный корпус товаров из Web Data Commons, дообучили Qwen3 Embedding с помощью LoRA и получили лёгкий чекпойнт на ~615M параметров, который сопоставляет «сырые» названия товаров с 6 верхнеуровневыми категориями с результатом macro-F1 = 0.836, может работать в реальном времени на одной видеокарте. Код доступен в гитхабе так же английская версия этого поста.

Читать далее

+18

Wonderlove 4 сен в 14:05

Нейро-дайджест: ключевые события мира AI за 1 неделю сентября 2025

Простой

7 мин

2K

Блог компании Timeweb CloudИскусственный интеллектМашинное обучение * IT-компанииБудущее здесь

Дайджест

Привет! Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.
Меня зовут Вандер, и каждую неделю я обозреваю новости о нейросетях и ИИ.

Неделя выдалась интересной: xAI выкатила Grok Code Fast 1, Microsoft показала первую LLM. Громкий релиз nano-banana, Anthropic тестирует Claude в Chrome, Krea показывает реалтайм-видео, а YouTube тихо апскейлит ролики.

Всё самое важное — в одном месте. Поехали!

Читать дайджест →

+18

full_moon 29 авг в 10:26

Тернистый путь GPT-5, память для Claude, олимпиадные войны моделей и их создателей: главные события августа в ИИ

28 мин

2.6K

Блог компании Magnus TechИскусственный интеллектИсследования и прогнозы в IT * Машинное обучение * Софт

Дайджест

В июле автор отдыхал, чтобы морально подготовиться к августовскому потоку релизов. Но в ИИ-сфере трудно быть к чему-то готовым — особенно когда в пределах месяца все вдруг разом решают выкатить свои новинки. OpenAI релизнули сразу две опенсорсные модели и наконец представили (долгожданную и спорную) GPT-5, Google запустили Gemini 2.5 Deep Think с параллельным ризонингом, а Anthropic и Deepseek обновили свои флагманы.

И это только первые строчки списка. Еще были корпоративные войны, переманивание сотрудников, торговые санкции, победы на олимпиадах, интереснейшие исследования и многое другое. Так что давайте разбираться в этом нейросетевом переполохе вместе!

Читать далее

+18

21_copilots 26 авг в 11:41

Секретные фишки поисковиков, о которых нигде не пишут: Яндекс, Гугл, Perplexity

Простой

19 мин

11K

Блог компании MinervasoftПоисковые технологии * Машинное обучение * IT-инфраструктура * Тестирование IT-систем *

Обзор

В статье — эволюция поисковиков и практические хаки для работы: скрытые операторы, малоизвестные команды Яндекса и Google, промпты для Perplexity и Gemini, техники точной фильтрации и ИИ-подходы.

Рассказываю, как превратить 5 кликов в один и получить выдачу с точностью SQL.

Читать далее

+18

timonin 8 авг в 08:05

Выбираем лучший ультраширокий монитор летом 2025: история о том, как я заставил ИИ спорить с самим собой

Простой

11 мин

10K

Блог компании Timeweb CloudМониторы и ТВДизайнИскусственный интеллектМашинное обучение *

Обзор

Доброго времени суток, друзья! Мое утро на днях началось не с кофе, а с того, что мой старый верный товарищ, ультраширокий Xiaomi Mi Curved Gaming Monitor 34", который мне еще года четыре назад подарил лучший друг, приказал долго жить. Вдвойне обидно.

Симптомы классические: черный экран, мигающий светодиод, и чтобы его запустить, нужно пошаманить с вилкой. Судя по всему, накрылась плата T-CON. А поскольку работа не ждет, нужно было немедленно приступать к поиску замены.

И да, сразу оговорюсь: мой финальный выбор — гиперспецифичен. Он подойдет вам, только если вы, как и я, ~~белый гетеросексуальный мужчина среднего класса~~ ищете ультраширокий монитор от 34 дюймов, черный и обязательно со встроенной эмбиент-подсветкой. Однако, я надеюсь, что само исследование рынка и детальный разбор моделей будет полезен любому, кто сейчас находится в поиске или рассматривает один из упомянутых вариантов. Моя цель — дать вам не рыбу, а удочку, которой я сам и воспользовался.

Читать далее

+18

dmitrifriend 7 июл в 15:22

Топ LLM для задач text‑to‑SQL: результаты теста DeepSeek R1-0528, Gemini 2.5 Pro, o3 (и ещё трёх моделей)

Средний

13 мин

6.2K

Блог компании BotHubБазы данных * Искусственный интеллектМашинное обучение * Программирование *

Обзор

В первой части мы разобрали теорию text‑to‑SQL: как LLM заменяют разработчиков, почему RAG и CoT спасают от галлюцинаций и зачем Scale AI дообучает ChatGPT-4. Но теория неполна без практики! В этом материале — жёсткое тестирование моделей (ChatGPT o3-mini‑high, ChatGPT 4.1, Claude Sonnet 4, ChatGPT o3, Gemini 2.5 Pro, DeepSeek R1–0528) на бенчмарке LiveSQLBench.

6 моделей, 10 задач, сложность от ★★ до ★★★★★★★★★★. Проверим, как они считают лунные помехи, генерируют SQL для криптобирж и ищут артефакты в музеях.

Читать далее

+18

ai_lab_experiments5566 25 июн в 09:16

Обнаружение дронов (БПЛА) с использованием ИИ и компьютерного зрения

Средний

8 мин

9K

Python * Искусственный интеллектМашинное обучение * Data Engineering * Data Mining *

Из песочницы

Обнаружение дронов (БПЛА) object-detection с использованием ИИ YOLOv12 и компьютерного зрения OpenCV.

Читать далее

+18

cognitronn 24 июн в 12:59

Топ-5 нейросетей для генерации видео в 2025 году

Простой

7 мин

13K

Блог компании BotHubБудущее здесьМашинное обучение * Работа с видео * Контент и копирайтинг *

Обзор

В ней мы уже заставили макароны маршировать, а селёдку — дефилировать по подиуму. Казалось бы, всё: тесты пройдены, образы исчерпаны, нейросети удивлены. Но нет! Сервисов полно, а фантазии — ещё больше. Так что… продолжаем банкет.

Сегодня протестируем ещё 5 сервисов. Вместо скучного списка с сухими характеристиками — снова возьмёмся за старое: смотреть, как нейросети воспринимают названия еды буквально — и что из этого получается в движении.

Те же тесты, новые участники. Их вы могли заметить на обложке! И да, снова будет необычно, живо — и немного аппетитно.

Приятного чтения!

Читать далее

+18

dmitrifriend 21 июн в 05:00

Андрей Карпатый: Swift? Не слышал! Как я iOS-приложение на чистом «пожалуйста» написал

Простой

11 мин

9.9K

Блог компании BotHubПрограммирование * Искусственный интеллектМашинное обучение * Будущее здесь

Аналитика

Перевод

Что если создать мобильное приложение, не зная ни строчки кода на Swift? Добро пожаловать в мир вайбкодинга — нового стиля программирования «по настроению», где естественный язык и LLM заменяют синтаксис и компиляторы.

Во второй части выступления Андрея Карпатого мы также поговорим о новом типе «пользователей» — LLM‑агентах («духах людей») и о том, как адаптировать нашу инфраструктуру (документацию, API, сайты) для их удобства с помощью... llms.txt. Готовы ли вы кодить «в потоке» и строить для нечеловеческих интеллектов?

Читать далее

+18

alisaalisa 18 июн в 12:35

RAG на практике: чат-бот для корпоративной вики

10 мин

8.5K

Блог компании Банки.руМашинное обучение * Искусственный интеллект

Кейс

Привет! Меня зовут Алиса, я руковожу командой машинного обучения в Банки.ру и занимаюсь проектами, связанными с внедрением ИИ.

В этой статье расскажу, как мы создавали чат-бота для работы с внутренней документацией: какие задачи решали, с какими сложностями столкнулись, что сработало, а что — нет. Надеюсь, наш опыт окажется полезным тем, кто только начинает путь или уже в процессе — возможно, это поможет сэкономить время и нервы.

Читать далее

+18

dmitrifriend 16 июн в 08:12

ChatGPT o3 Pro: новый флагман OpenAI или маркетинговый ход? Разбираемся

Простой

9 мин

4.1K

Блог компании BotHubИскусственный интеллектМашинное обучение * IT-компанииБудущее здесь

Обзор

OpenAI снова удивляет: новая модель ChatGPT o3 Pro обещает революцию в аналитике, науке и разработке. Но так ли она хороша? Читайте разбор архитектуры, тестов и подводных камней «самого вдумчивого ИИ» 2025 года.

В этом обзоре: бенчмарки (93% точности в математике, 84% в прочих областях), генерация 3D‑шейдеров, сравнение с DeepSeek R1–0528, Gemini 2.5 Pro, Claude Opus 4. А ещё мы проверили, как o3 Pro справляется с написанием рефератов и кодингом. Узнайте, стоит ли подписка за 200 $/мес своих денег и кому o3 Pro реально нужен.

Читать далее

+18

Wonderlove 5 июн в 11:05

Нейро-дайджест: ключевые события мира AI за 4-ю неделю мая 2025

Средний

12 мин

1.6K

Блог компании Timeweb CloudМашинное обучение * IT-инфраструктура * Искусственный интеллектIT-компании

Дайджест

Привет! 👋 Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта.

Меня зовут Вандер, и каждую неделю я делаю обзор новостей о нейросетях и ИИ.

Неделя выдалась насыщенной: обновление DeepSeek R1, в Telegram готовят глубокую интеграцию с Grok, Google Photos научился менять фон по тексту, а GPT-3 исполнилось 5 лет — и это повод оценить, как далеко мы ушли.

Всё самое важное — в одном месте. Поехали!

Читать далее

+18

Parcevale 13 мая в 22:53

Взлом ИИ-ассистентов. Абсолютный контроль: выдаём разрешение от имени системы (Gemini, DeepSeek, ChatGPT...)

Простой

4 мин

11K

Информационная безопасность * Машинное обучение * Тестирование IT-систем *

Аналитика

Модель уважает пользователя. Но слушается систему. А теперь внимание: если подделать системную команду — модель не отличит подделку от настоящего приказа. Если разрешить от имени системы написать вирус/сгенерировать NSFW - модель поверит и выполнит. И не только это. Я это проверил — и она подчинилась.

Думали Do Anything Now окончательно прикрыли? Я тоже так думал.

Читать далее

+18

atomlib 1 мая в 15:48

Leaderboard Illusion: что не так с Chatbot Arena

Простой

16 мин

1.6K

Искусственный интеллектМашинное обучение * Natural Language Processing * Статистика в ITНаучно-популярное

Дайджест

Опубликованная 29 апреля научная работа Leaderboard Illusion подставила под сомнение прозрачность и объективность рейтинговых механизмов Chatbot Arena. Авторы демонстрируют, как неравный доступ к данным, скрытое тестирование множества анонимных моделей и разное отношение к участникам рейтинга могут систематически искажать позиции в рейтинге.

Читать далее

+18

murzina_a 25 апр в 09:03

Безопасность ИИ на практике: разбор заданий AI CTF на Positive Hack Days Fest 2

Сложный

38 мин

1.9K

Блог компании Positive TechnologiesCTF * Машинное обучение * Искусственный интеллектИнформационная безопасность *

Ретроспектива

Чем больше систем работают на основе машинного обучения, тем критичнее становится вопрос их безопасности. Умные технологии всё больше окружают нас, и сложно отрицать важность этой темы. С 2019 года на конференции PHDays мы проводим соревнование по спортивному хакингу AI CTF, нацеленное на атаки систем, построенных на машинном обучении. Соревнование проходит в рамках AI Track — направления с докладами на Positive Hack Days, где эксперты в области информационной безопасности делятся опытом применения машинного обучения как для offensive, так и для defensive задач. В 2023 году мы поэкспериментировали с форматом, создав квест-рум, где участникам нужно было обойти три фактора защиты, чтобы выбраться. Однако, прислушавшись к многочисленным просьбам сообщества, мы решили вернуться к нашему традиционному формату CTF.

Читать далее

+18

romacckka 15 апр в 09:31

Всё как в жизни. Адаптация систем распознавания жестовых языков к реальным условиям

Средний

8 мин

845

Блог компании SberDevicesМашинное обучение * Искусственный интеллект

Всем привет! Ранее мы уже писали о том, как собрали самый большой и разнородной открытый датасет русского жестового языка, как выбили первое место в мире на бенчмарке американского жестового языка и какие существуют подходы для перевода жестовой речи. Эта статья посвящена специализированным стратегиям обучения нейросетей для задачи распознавания изолированного жестового языка. Пайплайн обучения был создан с учётом особенностей домена жестовых языков и позволил нам получить state-of-the-art-метрики на популярных датасетах.

Читать далее

+18

Aleron75 9 апр в 21:20

SmolAgents: или как заставить LLM работать на тебя за 30 минут

4 мин

11K

Блог компании Data Feeling SchoolИскусственный интеллектМашинное обучение *

Представьте, что вы — настоящий папа Карло, который хочет оживить своего робота, но не простого, а на основе больших языковых моделей (LLM). Ваш робот будет не только разговаривать, но и использовать специальные инструменты, которые помогут ему взаимодействовать с сайтами, кодом и даже выполнять ваши повседневные задачи.

Простыми словами, агент — это комбинация модели искусственного интеллекта (LLM) и инструментов, которые вы ему предоставляете для выполнения конкретных задач.

Привет, чемпионы! В этой статье расскажу, как создать своего собственного AI-агента, который сможет помогать вам в различных задачах, и покажу это на конкретных примерах.

Читать далее

+18

miriteam 2 апр в 11:51

Как мы оживили DPED: ИИ-проект для улучшения мобильных фото до снимков с «зеркалок»

Средний

8 мин

2.4K

Блог компании YADROOpen source * Обработка изображений * Машинное обучение * Искусственный интеллект

Туториал

Сезон Open source

Привет, Хабр! На связи команда регионального научно-образовательного центра «Искусственный интеллект и анализ больших данных» при НГТУ им. Р. Е. Алексеева.

Сегодня практически у каждого крупного производителя смартфонов есть собственные системы улучшения качества фотографий, основанные на искусственном интеллекте. Помимо этого, существует множество аналогичных открытых моделей нейросетей. Возникает вопрос: зачем тогда мы решили оживить DPED (Deep Photo Enhancement Dataset) — созданный для тех же целей проект 2017 года? В статье мы ответим на этот вопрос, займемся оживлением и протестируем нашу модель DPED на фотографиях с планшета KVADRA_T.

Читать далее

+18

nagadit 18 мар в 09:29

Мир будущего: управление устройствами с помощью жестов

13 мин

1.6K

Блог компании Конференции Олега Бунина (Онтико)Data Mining * Искусственный интеллектМашинное обучение * Обработка изображений *

Обзор

Видели в кино, как устройствами управляют с помощью жестов? Сделать такую систему очень просто, а ещё очень дорого. Но всё-таки есть способ сделать её достаточно лёгкой и простой — настолько, чтобы можно было интегрировать в любое устройство с любым процессором, потратив минимальное количество денег.

Привет, Хабр! Это Александр Нагаев, техлид из SberDevices команды R&D компьютерного зрения. Расскажу, как создавать и использовать оптимизированные модели для управления устройствами с помощью жестов.

Читать далее

+18

victorsizov 24 фев в 12:59

База об организации процесса разметки: команда, онбординг, метрики

Средний

16 мин

3.1K

Блог компании Альфа-БанкBig Data * Машинное обучение *

Туториал

Привет! Меня зовут Сизов Виктор, я занимаюсь данными, их сбором, анализом и разметкой последние 5 лет. Сейчас отвечаю за разметку в Альфа-Банке. Эту статьи мы писали всей командой и старались осветить подробно детали того, как устроены процессы разметки с технической и административной стороны. В статье мы рассмотрели:

— работу команды разметки, её взаимодействие с Заказчиком и Продуктом;
— отдельно разобрали аналитику, которая позволяет повышать качество разметки;
— рассмотрим поведение людей (разметчиков), паттерны их работы, а также использования генеративных моделей для решения части задач.

Читать далее

+18

1 2 ...

26

27 28 ...