Обновить
1215.04

Искусственный интеллект

AI, ANN и иные формы искусственного разума

Сначала показывать
Порог рейтинга
Уровень сложности

DeepSeek-OCR + LLama4 + RAG = Революция в мире агентного OCR

Уровень сложностиПростой
Время на прочтение10 мин
Охват и читатели360

В выходные я просматривал Твиттер, чтобы узнать, что происходит в сфере ИИ. И снова DeepSeek привлек внимание всего мира.

Это не просто очередной инструмент для распознавания текста, а новая технология контекстного оптического сжатия, которая использует визуальные методы для решения проблемы обработки длинных текстов, предлагая новый подход к работе с огромными массивами информации.

Любой, кто пользовался большой языковой моделью (LLM), сталкивался с такой проблемой:

Когда вы просите модель обобщить десятки тысяч слов из конспектов конференций или научных статей, она начинает терять память.

Это происходит потому, что квадратичная сложность длины последовательности по своей сути ограничивает GPT, Gemini и Claude - чем длиннее входные данные, тем больше вычислительной мощности требуется.

Читать далее

Новости

Лучшие нейросети для вайбкодинга на 1С 6 (финал)

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели5.7K

В этой части добавил Claude Opus 4.5 и GPT 5.1-Codex-Max

Предыдущая часть: https://habr.com/ru/articles/967828/

Для тех, кто не любит читать, результат сразу тут:

Читать далее

Claude Code за 4 часа написал AI чатбот (и мы выложили его в open source)

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели12K

Попросили Claude Code CLI сделать AI-чатбот для нашей платформы. Через 4 часа получили рабочее решение: контекстно-зависимый виджет, база знаний на markdown, эскалация в Telegram, автоматический сбор багов. Работает в production, выложили в open source.

GitHub
Лицензия: MIT

Читать далее

Глюкометр, бот, ИИ и как все это связано

Время на прочтение8 мин
Охват и читатели8.1K

Всем привет!

Это моя первая статья на Хабре, решил поделиться с общественностью своей идеей и тем, чем последнее время я занимаюсь в свободное время.

Любая критика (а также предложения и/или пожелания) категорически приветствуются.
Приятного чтения!

Идея

Не так давно по состоянию здоровья вынужден был погрузиться в мир глюкозы и ее мониторинга. В продаже довольно много всяких‑разных глюкометров, которые с более‑менее приемлемой точностью помогают мониторить уровень глюкозы. Но, в наш век информационных технологий, электромобилей и умных домов подавляющее количество этих устройств — это просто «экранчики с кнопками», показания которых никуда нельзя передать, никак нельзя экспортировать (ну кроме банального переписывания в тетрадку с экрана). В общем, говоря «современным языком» умных домов — по большей части эти устройства «глупые». К слову, да — я в курсе про системы непрерывного мониторинга уровня глюкозы и про них здесь тоже будет сказано (спойлер — не все так радужно в тамошних королевствах).

Читать далее

Делаем красивый лендинг за 2 часа: список инструментов и шаги создания

Уровень сложностиПростой
Время на прочтение2 мин
Охват и читатели8.9K

На днях мне понадобился новый лендинг для тестирования гипотезы. В прошлые разы я тратил на такое десятки тысяч рублей и недели времени, причем не всегда успешно. Примерно 50% работ фрилансеров улетало в корзину. С No-code и ИИ выход годных результатов получался ещё ниже. Но время идет, и, вот, мы дожили — 100% работы делают агенты.

Вжух — и лендинг!

Бумер и вайб-кодинг: как я делаю ИИ-анализатор новостей по инструкциям ChatGPT (Часть 1)

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели7.2K

В начале ноября после очередной шок-статьи, оказавшейся пустышкой, у меня появилась идея сервиса, который будет анализировать новости при помощи ИИ — рассказываю, что я делаю, и что из этого всего получается.

Это реальная история, не байт.

Читать далее

ИИ-инструменты для HR и рекрутинга: топ-10 сервисов для подбора персонала

Время на прочтение10 мин
Охват и читатели5.9K

Современная ATS (Applicant Tracking System) давно уже не является просто «электронной картотекой» с резюме. Сегодня ATS - это центр управления всем циклом найма, начиная с публикаций вакансий, заканчивая оффером и онбордингом. Система собирает отклики с десятков площадок, структурирует данные, ведёт коммуникации с кандидатами, синхронизируется с календарями команды и строит аналитику по качеству найма.

Искусственный интеллект позволяет вывести ATS на новый уровень за счет скорости, точности, автоматизации рутины, аналитики и прогнозов. 

Читать далее

Как не превратиться в «AI-first» компанию без реального использования ИИ. Перевод колонки CEO Runway

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели6.2K

Компании по всему миру сегодня спешат объявить себя «AI-first», но всё чаще это звучит как красивый лозунг без реального содержания. В своей колонке генеральный директор Runway Сицы Чен предлагает честно взглянуть на этот разрыв — между тем, что организации декларируют, и тем, что на самом деле происходит внутри команд. Это размышление о том, как не превратить инновации в показное действие, почему настоящие преобразования начинаются с любопытства, а не с мандатов сверху, и что отличает компании, действительно осваивающие ИИ, от тех, кто лишь делает вид.

Читать далее

В скором времени любой при достаточном объёме данных сможет создать цифровую версию самого себя. Но стоит ли это делать?

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели6.1K

За последние 23 года, выдавая более одной статьи в день, я накопил достаточно большой объём текстов, чтобы обучить модель искусственного интеллекта, которая могла бы убедительно писать «как я». С помощью современных технологий несложно создать систему, способную генерировать мнения, которые будут звучать так, как будто они исходили от меня — алгоритмического профессора, который будет продолжать публиковаться ещё долго после моей смерти.

Читать далее

3 главных инсайта о «взломах» LLM из исследования StrongREJECT

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели5.1K

Всем привет!
Погружаюсь в новую для себя область AI Security, в связи с чем решил написать несколько обзоров на самые обсуждаемые исследования  и статьи по этой теме. Сегодня поговорим про взлом LLM и неожиданные выводы исследования StrongReject.

Джейлбрейкнуть

Вкалывают роботы, а не человек, или как убрать рутину из работы при помощи ИИ

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели4.4K

Мы живём во времена AI-бума. ИИ упрощает ресёрч информации, визуализирует первые идеи дизайнеров, которые попадают в референсы, и пишет код. Некоторые даже говорят: «скоро разработчики станут не нужны», а «ИИ-агенты будут идеально писать код по промпту «хочу красиво» и т.д.

До этого «скоро» ещё далеко, но это не повод не использовать ИИ-агентов в автоматизации различной рутины. Например, в написании платёжных интеграций для POS-терминалов в разных странах. Передать ИИ-агентам такую задачку — не очень просто, но у нас получилось! Сегодня расскажем, как мы это сделали.

Читать далее

Предопределённые векторы для обучения нейросетей с экономией памяти

Уровень сложностиСредний
Время на прочтение4 мин
Охват и читатели3.2K

Одна из базовых функций систем машинного зрения состоит в классификации объектов. Для решения этой задачи традиционно применяются методы обучения с учителем (SL). Эти методы обеспечивают высокую точность, но при этом размер нейросетевой модели увеличивается с увеличением количества классов. Такая особенность ограничивает применимость SL в тех случаях, когда число классов слишком велико или заранее неизвестно.

Эксперт отдела перспективных исследований компании «Криптонит» Никита Габдуллин предложил новую методологию, позволяющую добиться одного и того же размера нейросетевой модели независимо от числа классов. Это достигается за счёт использования предопределённых векторных систем в качестве целевой конфигурации скрытого пространства (Latent Space Configuration, LSC) во время обучения.

С проблемой раздувания классов сталкиваются во многих областях — от ритейла до научных исследований. Мы рассмотрим её на задаче распознавания лиц, где каждый человек (его ID) считается отдельным классом.

Существующий подход (SL) требует, чтобы размер последнего классификационного слоя был пропорционален количеству этих ID.

Когда число идентифицируемых лиц исчисляется миллионами, параметры этого слоя становятся просто астрономическими, а модель — непрактичной из-за непомерных требований к ресурсам (в частности — к видеопамяти). Это становится существенным барьером на пути к масштабированию.

В качестве решения этой проблемы эксперт «Криптонита» предложил радикально новый метод — LSC, который устраняет прямую зависимость между размером модели и числом классов. Вместо того, чтобы заставлять сеть запоминать каждый класс во всё увеличивающемся классификационном слое, LSC учит её проецировать входные данные — например, изображения лиц — в заранее заданную, фиксированную систему векторов в абстрактном скрытом пространстве.

Читать далее

Я пишу тексты с ИИ. Простите

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели4.1K

Давайте поставим точку: я пишу тексты с ИИ.

Как это выглядит?

Во-первых, я пишу черновик текста. Руками и головой, как я писал сотни текстов до этого.

Например, как я написал свою первую тетрадку в 1 классе про "Удивительные приключения суперниндзей", которую учитель потом читал всему классу на уроке труда. Моя первая гордость. Потом таких тетрадок было еще штук пятнадцать. Одноклассники просили продолжение.

Читать далее

Ближайшие события

AI-агенты в аналитике: как я разработал два production-проекта за неделю

Уровень сложностиПростой
Время на прочтение12 мин
Охват и читатели4.3K

За 18 часов вместо 120 создал production-ready ETL-инструмент с 30-кратным ускорением. За 6 часов вместо 40 — фреймворк статистического анализа. Экономия времени: 85-88%. Улучшение качества: +48%.

Читать далее

Официальный гайд по промптам от OpenAI для GPT-5.1 (перевод)

Уровень сложностиПростой
Время на прочтение28 мин
Охват и читатели4K

 Хотя GPT-5.1 «работает из коробки» в большинстве случаев, это руководство сосредоточено на паттернах промптинга, которые максимизируют качество в реальных задачах. Эти техники основаны на широком внутреннем тестировании и совместной работе с партнёрами, создающими услуги и продукты на основе агентов, где небольшие изменения в промпте часто дают большой прирост надёжности и качества. Это только точка входа: промптинг итеративен, и лучшие результаты получаются при адаптации этих паттернов под ваши инструменты и задачи.

Читать далее

Нейро-дайджест: ключевые события мира AI за 4-ю неделю ноября 2025

Уровень сложностиСредний
Время на прочтение10 мин
Охват и читатели4.8K

Привет! Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.

Неделя выдалась плотной на релизы: Claude Opus 4.5 новый лидер в кодинге, открытые GigaChat 3, Kandinsky 5.0 и другие релизы от Сбера, FLUX.2 против Nano Banana Pro, параллельно обновились Cursor и Perplexity, а в США запускают мега-проект для ускорения науки.

Всё самое важное — в одном месте. Поехали!

Читать дайджест →

Разрабатываем голосового ассистента на Rockchip. Часть 1

Уровень сложностиСредний
Время на прочтение19 мин
Охват и читатели4.5K

Всем привет! Я Виктор Загускин, руководитель отдела голосового ML в MWS AI. Мы разрабатываем продукт формата «спичкит» — распознавание и синтез речи, анализ ее содержания. Наши клиенты используют эту технологию как кубики для создания прикладных продуктов. Чтобы лучше прочувствовать их потребности и боли, лучше познакомиться с тем, как реализовать голосовые ассистенты на основе современных решений, я решил попробовать сделать подобный продукт самостоятельно. Это будет работающий на локальном устройстве голосовой ассистент со встроенной LLM.

В этом цикле материалов я буду рассказывать о процессе создания ассистента, примененных технологиях, выбранном железе, трудностях и путях их преодоления, буду  демонстрировать этапы работ. Попутно расскажу основные концепции, необходимые для реализации голосовых технологий. 

Первая часть цикла посвящена базе — выбору «железа», тулкитов для инференса, моделей для синтеза и распознавания речи и LLM. Поехали!

Читать далее

Агентность, мультимодальность, бенчмарки: технический итог и взгляд в будущее на AIJ Deep Dive

Уровень сложностиПростой
Время на прочтение14 мин
Охват и читатели4.2K

Привет, Хабр! Меня зовут Олег, я работаю в менеджменте AI-продуктов и на днях посетил AIJ Deep Dive — специальный очный трек главной конференции по искусственному интеллекту в России AI Journey. Этот трек рассчитан на всех, кто пишет будущее ИИ: разработчиков, исследователей и дата-сайентистов. Здесь были десятки тематических сессий по разным направлениям, возможность задать вопросы разработчикам решений на R&D-выставке, узнать последние AI-тренды рынка, инсайты и «внутрянку» новинок Сбера и даже увидеть их робота.

Много говорили о том, как меняется роль разработчиков в эпоху ИИ-агентов. Мы внутри индустрии уже чувствуем это: модели чаще берут на себя рутину, смещают зоны ответственности команд и заставляют переосмысливать процессы. К примеру, HR-агент оценит резюме по релевантности искомой вакансии, а AI-помощник сервисного инженера выдаст суммаризацию из документации, чем очень поможет работнику.

Анонсы продуктов, впечатления, кейсы и самые интересные фичи с площадки — под катом. 

Читать далее

+30% к скорости написания автотестов и сотни чек-листов в день: как мы внедряем LLM в QA

Время на прочтение8 мин
Охват и читатели5.5K

Привет! Меня зовут Владислав Миронов. Я отвечаю за внедрение LLM в процессы QA Яндекса и в этой статье расскажу, каких результатов мы достигли — от генерации тест‑кейсов и автотестов до помощи в ручном тестировании. Поделюсь не только успехами, но и тем, какие компромиссы и организационные решения понадобились, чтобы всё это заработало.

В статье покажу, как мы разрешаем противоречия между командами, уходим от «зоопарка» инструментов и строим централизованную экосистему, где качество остаётся под контролем: реальные схемы, примеры и цифры, без магии и маркетинга.

Спойлер: рассчитывать можно на многое, но и вложиться придётся основательно. Парой промптов тут, к сожалению, не обойтись.

Читать далее

Долгая дорога к DiT (часть 3)

Уровень сложностиСредний
Время на прочтение17 мин
Охват и читатели3.4K

Заключительная (но ещё не последняя) статья из цикла про диффузные модели, где мы наконец отбросим примитивную модель из полносвязных слоёв и напишем работающий генератор изображений c архитектурой Diffusion Transformer (DiT). Разберёмся зачем нарезать изображения на квадратики и увидим, что произойдёт с вашей генерацией, если проигнорировать главную "слабость" трансформеров - неспособность понимать порядок.

Читать далее
1
23 ...

Вклад авторов