Как стать автором
Обновить
1391.54

Искусственный интеллект

AI, ANN и иные формы искусственного разума

Сначала показывать
Порог рейтинга
Уровень сложности

Оркестрация чатов LLM моделей через Redis

Уровень сложностиСложный
Время на прочтение9 мин
Количество просмотров2.1K

🐝 Оркестрация чатов LLM через Redis

При работе с языковыми моделями частым явлением являются галлюцинации - когда модель даёт неверных вывод. Это связано с издержками математической модели, которая пораждает важные нюансы, разобранные в данной статье. Статья описывает, что именно нужно сделать, чтобы эффективно бороться с галлюцинациями LLM на проде

Читать далее

Google представила функцию Canvas в Gemini: что это такое, как получить доступ и чем она полезна

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров8.9K

Google выпустила новую функцию Gemini под названием Canvas, которая представляет собой интерактивное рабочее пространство, призванное сделать процесс написания текстов и программирования более комфортным и эффективным.

Canvas - не совсем новая концепция в ИИ-чатботах. Компания Anthropic запустила подобную функцию для Claude под названием Artifacts восемь месяцев назад, а OpenAI запустила аналогичную функцию в ChatGPT пять месяцев назад.

Как разработчик, я использую ее для отладки кода и даже для предварительного просмотра проектов с компонентами front-end. Она также отлично подходит для оптимизации написанного контента, что делает ее полезным инструментом для блогеров.

Странно, что Google потребовалось так много времени, чтобы реализовать ту же функцию в Gemini, но я рад, что они наконец сделали это. Но как именно работает Canvas в Gemini и что отличает ее от конкурентов? Давайте узнаем.

Читать далее

Технологии распознавания паспорта – 10 лет.  Хабрология от Smart Engines

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров1.1K

Десять лет назад, 17 марта 2015 года, мы опубликовали свой самый первый хабр. Тогда мы впервые представили городу и миру нашу технологию распознавания паспорта на мобильнике. Публика в комментах разделилась на два лагеря: одни сомневались в пользе решения, другие критиковали за недостаток возможностей и предлагали идеи по улучшению. 

Теперь, с высоты уже немалого времени докладываем: 1) идея себя оправдала и даже превзошла самые смелые ожидания; 2) работа по совершенствованию технологии была проделана; 3) работы было и будет очень много. Собрали для вас хайлайты этой увлекательной и яркой истории.

Как это было?

Год с нейросетями: как и какие инструменты мы используем в разработке

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров3.6K

Мы собрали обратную связь по практическому опыту использования ИИ инструментов у наших сотрудников.

В статье расскажем, как наши разработчики используют нейросети, какие задачи они решают с их помощью и как изменилось их отношение к ИИ за последний год.

Читать далее

Обзор мировых AI-платформ на конец марта 2025 (сгруппировано по странам и категориям) + ссылки на официальные сайты

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров3.9K

AI-платформы и инструменты активно развиваются, предлагая решения для различных задач: от генерации текста и изображений до автономных систем и бизнес-аналитики. Локальные решения, такие как Stable Diffusion и LLaMA, позволяют использовать ИИ без подключения к интернету, что особенно важно для задач, требующих конфиденциальности и высокой производительности. Выбор платформы зависит от конкретных задач, бюджета и технических возможностей.

Читать далее

Влияние LLM на людей, процессы, продукты и общество в разработке ПО: исследование с ранними пользователями

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров1.1K

В начале марта вышло любопытное исследование от PhD студентов Computer Science университета Северной Каролины: «Влияние больших языковых моделей на людей, процессы, продукты и общество в разработке программного обеспечения: комплексное исследование с ранними пользователями».

Исследование базируется на 16 глубинных интервью разработчиков – ранних адептов LLM. Структура организована вокруг четырёх измерений – разработчики, процессы, продукты и общество и посвящено влиянию больших языковых моделей (LLMs) — таких как ChatGPT, Gemini и GitHub Copilot — на разработку программного обеспечения.

В ответах представлены некоторые инсайты как LLM помогает в разработке (например, подходы внедрения LLM в производственный процесс). Мы прочитали 40 страниц мелким шрифтом и делимся самым интересным.

Читать далее

Reasoning-LLM: архитектура и обзор передовых моделей

Время на прочтение24 мин
Количество просмотров8.1K

Reasoning-LLM — это большие языковые модели, нацеленные на логическое рассуждение при решении сложных задач. В отличие от обычных LLM, которые часто выдавали ответы сразу, такие модели способны «думать» пошагово — как человек, анализируя задачу и выстраивая цепочку вывода.

Появление reasoning-LLM связано с тем, что традиционные LLM (например, GPT-4 или Llama 3.1) хотя и хорошо справляются с языковыми и энциклопедическими запросами, нередко ошибались в задачах, требующих сложных вычислений, планирования или логического вывода. В этой статье мы подробно разберем, как работают reasoning-LLM, их внутреннее устройство (Transformer, self-attention, механизмы «мышления»). А еще — рассмотрим передовые модели (OpenAI o1, DeepSeek R1 и Claude 3.7 Sonnet), факторы, влияющие на их точность, и дадим практические рекомендации по применению.
Читать дальше →

Дженсен Хуанг, как же так!? Тестируем NVIDIA GeForce RTX 5090 в ИИ задачах

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров9.4K

Несмотря на огромный дефицит, нам удалось достать несколько карт GeForce RTX 5090 и протестировать одну из них. Не все так однозначно, как обещал глава NVIDIA, но результаты интересные и внушают оптимизм для применения GPU для ИИ задач.

Читать далее

Зумеры не просто слушают — они хотят, чтобы их слушали. Как баг изменил наш взгляд на продукт

Время на прочтение6 мин
Количество просмотров3.3K

Привет, Хабр! Меня зовут Катя Меркулова, я CPO Сlatch. Летом мы работали над улучшением нашего приложения. На первый взгляд, задача была простой: перенести кнопку технической поддержки из веб в мобильную версию. Но, как это часто бывает, нюансы сделали свое дело. Мы пропустили слово «техническая». И все завертелось.

Как одно слово чуть не поломало нам все процессы, заставило неделю работать в две смены и как мы развили новый инструмент для общения с аудиторией, я расскажу в этом материале. И заодно поделюсь своими выводами: что же действительно нужно сейчас подросткам и какой интерфейс для них является по-настоящему нативным.

Читать далее

Как научить нейросеть запоминать вас: технология персонального контекста

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров2.2K

Привет, Хабр!

Если вы, как и я, регулярно общаетесь с нейросетями, то наверняка сталкивались с ситуацией, когда приходится раз за разом объяснять ИИ одни и те же вещи: кто вы, чем занимаетесь, какие у вас предпочтения и цели. Каждый новый чат — это знакомство с чистого листа.

Сегодня я хочу рассказать о технологии, которая решает эту проблему — персональном контексте для LLM. Объясню простыми словами, что это такое, как это работает и почему это важное направление в развитии взаимодействия человека с ИИ.

Как создать цифровую память для нейросети

Выбор локальной LLM модели. Публикация на сайт с чатом

Уровень сложностиСложный
Время на прочтение7 мин
Количество просмотров10K

🐝 Выбор локальной LLM модели. Публикация на сайт с чатом.

В мире нейросетей - хайп. Не всегда заявления производителя соответствуют действительности, например, на бумаге DeepSeek R1 поддерживает русский язык, на деле не всё так гладко. Данная статья содержит подборку LLM моделей, хорошо работающих с русским языком и имеющих возможность tool calls - вызов внешних python/nodejs функций для интеграции в стороние сервисы

Читать далее

Дискуссия: генеративный AI в разработке: yay or nay?

Уровень сложностиПростой
Время на прочтение12 мин
Количество просмотров1.2K

Собрались как-то на Conversations ребята из Яндекс Райдтех, Звука, Альфа-Банка и MTS AI, чтобы вместе с Just AI прийти к выводу: генеративный AI в разработке это супер или пока не очень?

Как можно использовать AI на разных этапах разработки – поддержки, дизайна, аналитики, солюшн-архитектуры, тестирования? Как разработчикам Copilot-сервисов учесть реальные интересны разработчиков-юзеров? Как замерять эффективность использования генеративок? А как бороться со скепсисом и саботажем (и нужно ли)? Как генеративный AI изменит культуру разработки и роль разработчика в целом?

Читать далее

BioNNE-L — соревнование по нормализации биомедицинских именованных сущностей на русском и английском языках

Уровень сложностиСредний
Время на прочтение8 мин
Количество просмотров618

Привет, Хабр!

Я — Андрей Саховский, исследователь SberAI и аспирант Сколтеха. Занимаюсь биомедицинским NLP, интересуюсь графами знаний, задачами извлечения информации из текстов медицинской тематики, языковыми моделями в хемоинформатике. Если вам тоже интересны эти научные области, обратите внимание на соревнование BioNNE‑L, которое организует наша команда исследователей из AIRI, МГУ и SberAI и которому будет посвящён этот текст.

Читать далее

Ближайшие события

Ищем соринку в глазу: контроль качества с помощью компьютерного зрения

Уровень сложностиСложный
Время на прочтение10 мин
Количество просмотров2K

В этой статье мы расскажем о том, как можно использовать компьютерное зрение для автоматического контроля качества продукции. Вместо того чтобы полагаться на человеческий фактор, мы обучим алгоритмы анализировать изображения и выявлять дефекты с высокой точностью. Рассмотрим разные подходы: от простого сравнения с эталоном до использования нейросетей и глубокого обучения. Покажем, как на практике реализовать систему с помощью Python, OpenCV и TensorFlow, а также как обучить модель находить аномалии с помощью Anomalib

Читать далее

Без операторов и водолазов: как дронопорты и подводные роботы меняют промышленность

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров1.7K

Знаете, что общего между тепловизионными камерами, взрывозащищёнными дронами и 90-метровыми колоннами? Или как в промышленной компании из трёх дронов вырос целый парк из более чем 20 машин, а мониторинг трубопроводов перестал зависеть от человеческого фактора?

В статье рассказываю — как ИИ с точностью 80% ищет утечки, дронопорты летают без операторов, а подводные роботы заменяют водолазов. Но обо всём по порядку.

Читать далее

Как ИИ-агенты меняют атаки с украденными учётными данными

Уровень сложностиСредний
Время на прочтение8 мин
Количество просмотров1.4K

Атаки с подбором учётных данных оказали огромное влияние в 2024 году, подпитываемые замкнутым кругом заражений инфостилерами и утечек данных. Однако ситуация может стать ещё хуже с появлением Computer‑Using Agents (CUA) — нового типа ИИ‑агентов, обеспечивающих дешёвую и малозатратную автоматизацию распространённых веб‑задач, включая те, которые активно используют злоумышленники.

Читать далее

Что лучше, AI или AGI?

Время на прочтение3 мин
Количество просмотров1K

Вроде бы странный вопрос. Сродни тому, что лучше: телега или автомобиль. Но это как посмотреть. Автор, ни в коем случае не претендующий на то, чтобы быть источником истины в какой-либо инстанции, предлагает свой взгляд с практической стороны.

Читать далее

Мультимодальные языковые модели: как нейросети учатся видеть и слышать

Уровень сложностиСложный
Время на прочтение6 мин
Количество просмотров3K

Мультимодальные языковые модели представляют собой самый прогрессивный класс нейросетевых архитектур, объединяющих способность воспринимать и обрабатывать различные типы данных одновременно - текст, изображения, аудио и видео. Это похоже на то, как наш мозг интегрирует информацию из разных органов чувств, чтобы создать полную картину мира. Как сказал философ Марсель Пруст, “Настоящее открытие не в том, чтобы увидеть новые земли, а в том, чтобы иметь новые глаза”.

Читать далее

Подступающий AGI: анализ прогнозов Кевина Вейла (OpenAI)

Время на прочтение11 мин
Количество просмотров4.6K

Привет, Хабр! 

Мир технологий всегда был местом смелых прогнозов, но диалог с Кевином Вейлом, директором по продуктам (CPO) OpenAI, выделяется даже на этом фоне. Кевин Вейл из OpenAI уверен, что AGI уже на пороге — и появится в текущем году. Представьте, что ваш коллега по команде — не человек. Он не пьёт кофе, не присылает мемчики в пятницу и… обходит вас в любимых видеоиграх с разгромным счетом. Звучит как сюжет Black Mirror? Для Кевина Вейла это не фантастика. В ближайшие несколько месяцев, по его словам, ИИ превзойдёт человека в программировании. Недавнее интервью открывает нам не только технические перспективы, но и ставит фундаментальные вопросы о будущем человечества в эпоху стремительного развития ИИ.  

Чек-лист апокалипсиса для IT-профессий прилагается:  

- Экспоненциальное падение стоимости ИИ-интеллекта — в 10 раз ежегодно (закон Мура плачет в углу). 

- Робототехника как «физическое воплощение AGI» — когда ошибка в коде будет не багом, а ударом кулаком по столу. 

- ИИ-репетиторы и AGI-счётчик, который тикает, пока вы читаете и чем-то напоминает обратный отсчёт до старта SkyNet.

Читать далее

Как научить нейросеть запоминать вас: технология персонального контекста

Уровень сложностиСредний
Время на прочтение6 мин
Количество просмотров6.5K

Обложка статьи


Привет, Хабр!


Если вы, как и я, регулярно общаетесь с нейросетями, то наверняка сталкивались с ситуацией, когда приходится раз за разом объяснять ИИ одни и те же вещи: кто вы, чем занимаетесь, какие у вас предпочтения и цели. Каждый новый чат — это знакомство с чистого листа.


Сегодня я хочу рассказать о технологии, которая решает эту проблему — персональном контексте для LLM. Объясню простыми словами, что это такое, как это работает и почему это важное направление в развитии взаимодействия человека с ИИ.

Читать дальше →

Вклад авторов