Обновить
1190.42

Искусственный интеллект

AI, ANN и иные формы искусственного разума

Сначала показывать
Порог рейтинга
Уровень сложности

Пять ошибок при тестировании времени распознавания документов, которые отравляют жизнь нашим QA-инженерам

Время на прочтение5 мин
Количество просмотров1K

Продукты класса ContentCapture работают с большими объемами документов, и для бизнеса критична скорость их обработки. Но как убедиться, что система не замедлится после выхода очередного релиза? Здесь на помощь приходит тестирование: QA-инженеры регулярно проводят замеры скорости распознавания — например, при обновлении технологии или запуском нового проекта.

Казалось бы, все просто: автоматизируешь тесты, замеряешь время — и получаешь объективные метрики для оптимизации. Но на практике даже идеальная автоматизация не спасает от неожиданных сценариев.

В этой статье — пять коварных ошибок, которые чаще всего искажают результаты тестов. Некоторые настолько распространены, что мы научились распознавать их еще до того, как клиент закончит жаловаться.

Читать далее

Нейросеть на службе бизнеса: от отзыва до инсайтов

Время на прочтение6 мин
Количество просмотров1.6K

В эпоху цифровизации каждый клиентский отзыв — это больше, чем просто слова. Это ценный актив, содержащий информацию о настроениях, скрытых проблемах и возможностях для роста. Однако, как бизнесу эффективно обрабатывать тысячи таких сообщений? Решение лежит в области искусственного интеллекта. Сегодня мы разберёмся, как нейросеть трансформирует эмоциональный комментарий в структурированные данные, которые можно интегрировать в бизнес-процессы для принятия решений.

Читать далее

Кто автор? О правах на код, написанный с помощью искусственного интеллекта

Время на прочтение18 мин
Количество просмотров2.7K

Сейчас многие используют искусственный интеллект в работе, например, пишут код с помощью ИИ. Но как видит этот код закон? Программы приравнены к произведениям литературы, а авторские права на код охраняют так же, как и на книги.

Привет, Хабр! Меня зовут Арина Шахтарина, я инженер в Сбере, а в прошлом — юрист с 10+ годами практики в суде, прокуратуре и нотариате. По обеим специальностям окончила вуз. Эта статья написана по мотивам моего доклада для Saint Higload ++, и она как раз на стыке двух этих специальностей.

Расскажу про критерии авторского права, права на код, написанный лично, права на код, написанный с помощью ИИ, лицензии и возможность использования результатов деятельности генеративного искусственного интеллекта и ответственность.

Читать далее

Тихий апокалипсис: я устал читать сгенерированные статьи

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров27K

Привет, Хабр! Накипело. В последние 3–4 месяца, при поиске интересных статей на Хабр, очень часто замечаю полностью скопированные, не отредактированные статьи, которые генерирует ИИ. Появился некий «новый класс контента», ценность которого равна нулю. Честно, терпел долго, ждал изменений, но с каждым месяцем подобного становится всё больше. Пиком стали подобные «блоги компаний», где выходят статьи с аналогичными паттернами...

В данной статье Вы не найдете ссылок, скриншотов с никами авторов или названиями компаний. Это осознанное решение. Я хочу говорить о системной проблеме, а не о частных случаях.

Читать далее

Кейс: разработать квест-мастера на нейронке

Уровень сложностиСредний
Время на прочтение47 мин
Количество просмотров955

Инженерия подсказок, как и все, что связано с нейросетями, для непогруженного человека может показаться чем‑то раздутым и незначительным. Нет, ну серьезно. Что трудного попросить ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ сочинить стишок или рассказать популярно что такое «Эпистемологический анархизм». Но на деле все действительно оказывается слишком, слишком, слишком нетривиально. Расскажу на примере пустяковой задачки: «Разработать ИИ‑агента квест‑мастера, который генерит загадки и отслеживает ее угадываемость».

Доп.цель:
добиться исполнения логики именно на стороне нейросети, используя только ее базовые параметры, используя только бесплатные или самые дешевые модели, с задействованием минимально необходимого бекенда.

Читать далее

Путь к получению сертификата ISTQB AI тестировщика: советы и полезная информация

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров459

Практическое руководство по получению сертификата ISTQB по тестированию AI (ИИ), в котором рассказывается о преимуществах, трудностях и практических советах для успеха. Эта статья содержит личные впечатления о том, как сертификация улучшила карьерные возможности, укрепила уверенность в тестировании проектов на базе ИИ и предоставила структурированный путь к овладению навыками тестирования ИИ. 

Читать далее

Huawei vs NVIDIA: что сулит новая технология SuperPoD Interconnect

Время на прочтение5 мин
Количество просмотров1.9K

В гонке за лидерство в области искусственного интеллекта важны не только мощные чипы, но и то, как они связаны между собой. Huawei анонсировала SuperPoD Interconnect — собственную технологию межсоединений, призванную конкурировать с NVLink от NVIDIA. Если говорить по-простому, это с нуля разработанный аналог знаменитого NVLink от NVIDIA, тот самый «клей», который соединяет тысячи ИИ-ускорителей Ascend в один гигантский супермозг.

Для Huawei SuperPoD Interconnect — шаг к созданию собственной экосистемы в области искусственного интеллекта. Когда доступ к передовым чипам NVIDIA закрыт, единственный путь вперед — развивать свои решения и технологии межсоединений. Это позволяет не только продолжать работу в условиях санкций, но и претендовать на более независимую роль в мировой ИТ-инфраструктуре. Сегодня обсудим новинку и ее перспективы.

Читать далее

No-code разработка: telegram-бот для анализа эмоций без программирования

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров2.9K

Когда вокруг постоянно говорят про искусственный интеллект, трудно остаться в стороне. Куда ни посмотри — везде нейросети: от фильтров в соцсетях до сложных аналитических систем. Мне как начинающему специалисту эта тема особенно близка — не просто наблюдаю за трендами, а пробую их на практике.

Недавно я решил создать небольшой, но полезный проект — Telegram-бота, который умеет определять эмоциональный окрас сообщений. Не суперсложное приложение, а скорее практика: проверить, как можно быстро собрать рабочее AI-решение, не погружаясь в тонны серверных настроек и не тратя недели на разработку.

До этого я уже сталкивался с задачами по работе с облачными сервисами, но именно этот эксперимент стал для меня наглядным примером, как много сегодня можно сделать «из коробки». Нужно было лишь придумать задачу (в моем случае — анализ эмоций в тексте), выбрать инструменты и собрать все в единый рабочий процесс.

Я остановился на трех основных вещах: Container Apps для развертывания, n8n в роли конструктора логики и Evolution Foundation Models как источник интеллекта. Плюс удобный Artifact Registry, чтобы хранить образы контейнеров.

Дальше началось самое интересное — подготовка среды, развертывание и настройка бота. Ниже расскажу, как именно это происходило.

Узнать подробности

RAG-системы на арене: протестировали 5 популярных решений на реальных данных

Уровень сложностиСредний
Время на прочтение10 мин
Количество просмотров5K

Начнем с боли, знакомой каждому. У любой уважающей себя компании есть своя цифровая «антресоль» — растущая гора DOCX-документов, неструктурированные PDF-файлы, раздувшийся Confluence и километры переписки в почтовых ящиках. Найти там что-то часто попросту невозможно. И тут на сцену выходят LLM и RAG-системы.

Retrieval-Augmented Generation — это технология, которая обещает превратить информационную свалку в упорядоченную библиотеку. Идея простая: даем мощному ИИ доступ к корпоративным знаниям, а поисковик в нужный момент находит релевантный документ и подает его модели. Должен получиться идеальный корпоративный ассистент, который знает все о продуктах, помнит каждую инструкцию и отвечает клиентам мгновенно и без ошибок.

Но есть загвоздка. Что если этот умный помощник, вдруг начнет галлюцинировать?

Мы с командой решили устроить тест пяти RAG-системам на реальных данных. От корпоративных платформ до open-source решений — AutoFAQ Xplain, Yandex, AnythingLLM, Witsy и Onyx. Мы заставили их работать с неудобными форматами, включая отсканированные PDF и устроили слепой экзамен на точность ответов. В роли экзаменаторов выступили два независимых эксперта и две нейросети-оценщика.

В этой статье расскажем:

- Кто наши испытуемые и чем они отличаются под капотом. 
- Как мы построили полосу препятствий из типичных корпоративных документов. 
- Кто споткнулся уже на этапе подключения к данным. 
- И главное — кто оказался самым точным и стабильным.

Результаты вас удивят. Также будет ссылка на GitHub — вы сможете повторить наш эксперимент.

Читать далее

Ollama от А до Я: как выбрать модель, настроить и интегрировать

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров25K

В этой статье мы подробно разбираем Ollama — инструмент для локального запуска больших языковых моделей (LLM). Вы узнаете, как установить программу, выбрать подходящую модель, понять форматы и квантование, настроить систему под своё железо и работать как через CLI, так и через API. Практические советы, примеры конфигураций и рекомендации по VRAM помогут вам максимально эффективно использовать Ollama для диалогов, генерации текста, кода и других задач.

Читать далее

FuriosaAI NXT RNGD: как корейский стартап бросает вызов NVIDIA в сегменте ИИ-инференса

Время на прочтение3 мин
Количество просмотров794

Корейский стартап FuriosaAI представил сервер NXT RNGD для ИИ-инференса. 4 петафлопса вычислений при потреблении 3 кВт вместо 10+ кВт у GPU-решений. Анализ архитектуры, преимуществ и перспектив альтернативы NVIDIA.

Читать далее

AI Review: инструмент для автоматического ревью кода на основе LLM

Время на прочтение18 мин
Количество просмотров3.3K

Раньше вас ревьюил злой коллега — теперь это делает AI. AI Review — open-source инструмент, который сам проверяет код прямо в CI/CD. Поддерживает OpenAI, Claude, Gemini, GitLab и GitHub. Быстро, честно и без боли.

Читать далее

Векторная арифметика колбасы. Как объяснить жене нейропропмптинг на базе запроса «оливье с креветками»

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров4.3K

Представьте, что хороший знакомый или родственник внезапно подойдет к вам, скажет: «Оливье с креветками» — и замолчит. Что первым придет в голову (ну, исключая заболевания)? А о чем подумает нейросеть LLM типа «Алиса» или DeepSeek в такой же ситуации? Попробуем разобраться.

Меня зовут Андрей Сенченко, я бизнес-архитектор решений розницы и логистики в MWS. На работе я занимаюсь автоматизацией сети магазинов МТС, а в свободное время увлекаюсь нейросетями. 

В разговорах со знакомыми, которые пользуются нейронками от случая к случаю, нередко возникает вопрос “почему нейронка ответила на мой запрос именно так”. Мне нравится при объяснении технических особенностей использовать аналогии. Одну из них я считаю удачной и хочу поделиться ею с вами. 

Читать далее

Ближайшие события

Первые 48 часов Claude Sonnet 4.5 — анализ отзывов разработчиков и выявленных проблем

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров9.5K

Вчера вечером Anthropic представила Claude Sonnet 4.5 — новую модель, которая претендует на звание лучшего ИИ‑инструмента для программирования на текущий момент. Разбираемся, что нового принесла эта версия и почему она может изменить подход к разработке ПО.

Читать далее

Лучшие модели для вайбкодинга на 1С. Часть 4 (Sonnet 4.5/gpt-5-codex)

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров4.5K

К рейтингу добавил Sonnet 4.5 и gpt-5-codex. Кратко рассмотрел также несколько новых китайских моделей. Предыдущая часть рейтинга тут.

Также рассмотрены новые китайские модели: KAT-Dev-32B, Liquid LFM2-2.6B. И очень популярный на OpenRouter: Grok Code Fast 1/

Итоговая табличка ниже.

Читать далее

Tau² Benchmark: как переписывание промпта подняло точность GPT 5 mini на 22%

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров2.6K

В недавней публикации мы представили Tau² — инструмент для оценки больших языковых моделей. Сегодня же хотим поделиться неожиданным открытием: простое переписывание промпта увеличило успешность небольшой модели более чем на 20%. Ниже — подробный разбор того, как мы нашли и устранили узкое место в её работе, внеся всего несколько тонких изменений в политику агентов.

Читать далее

С ИИ всё стало умным, в том числе и… малварь — история появления GenAI-полиморфных вирусов

Уровень сложностиСредний
Время на прочтение12 мин
Количество просмотров3.2K

Все мы слышали про FraudGPT и WormGPT, и про такие атаки как Morris II, imprompter, EchoLeak. Но это все детский сад, или даже скрипткиддерство.

А что насчет использования генеративных способностей LLM в целях киберпреступности в автоматизированном режиме? Да, нарушители используют GenAI-модели для создания полезной нагрузки вируса.

BlackMamba, SkyNet, PromptLock и s1ngularity - если вы хотите узнать, что это за инциденты и какой среди них белая ворона, то я, автор канала «Борис_ь с ml» про ИБ и ИИ, приглашаю вас к прочтению.

Читать далее

ИИ-проекты съедают бюджеты, но не приносят ROI. Виновата технология?

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров2.1K

Разбираем, почему 95% корпоративных ИИ-пилотов проваливаются, и как внедрить систему метрик, которая гарантирует результат в условиях новой российской реальности.

Почему ваш ИИ-проект съедает бюджет, но не дает ROI?

Коротко: Статистика MIT неумолима: 95% ИИ-пилотов в корпорациях проваливаются. При этом бюджеты на них только растут.

Главный вывод: Дело не в технологии, а в том, ЧТО и КАК мы измеряем. Мы гонимся за точностью модели, а не за снижением издержек.

В статье я показываю, как перестать сжигать деньги и заставить ИИ работать на бизнес.

Что внутри:

Три реальных провала (банк, ритейл, производство) и их общая системная ошибка.

Семимерная модель метрик, которая смещает фокус с «технологии ради технологии» на реальный бизнес-эффект (с поправкой на российские реалии).

Готовый инструментарий руководителя: чек-лист, карта рисков, ROI-калькулятор.

Без «воды» и пустых обещаний. Только анализ, система и практика.

Читать далее

Прощай, рутина: как наша команда QA в 3 раза ускорила работу с помощью собственного ИИ-агента

Уровень сложностиПростой
Время на прочтение12 мин
Количество просмотров11K

Привет, меня зовут Сергей, я занимаюсь автоматизаций тестирования в компании ITFB Group, и хочу поделиться опытом внедрения AI-агентов в наши процессы.

Наверняка всем тестировщикам знакома ситуация, когда остаётся всего пара дней до релиза, а команда тестирования всё ещё работает над задачами по новым фичам и не может приступать к регрессу? Или перед передачей новой версии заказчику тестировщики успевают проверить только smoke-сценарии, засиживаясь допоздна? А до написания чек-листов и тест-кейсов по новым функциям руки дойдут вообще не скоро. У нас тоже такое нет-нет, да и случается.

Самое первое, что приходит в голову после таких авралов – нам нужна автоматизация регресса. Но как в кратчайшие сроки сделать из ручных сценариев автотесты, если никто в команде тестирования не пишет код и нужно изучать всё с нуля, и это при том, что и так ни на что не хватает времени? На помощь придёт вездесущий AI!

Читать далее

Ретроспектива дизайна детских книг в России (XXI век)

Время на прочтение6 мин
Количество просмотров3.8K

Ретроспектива дизайна детских книг в России (XXI век)

XXI век в детской иллюстрации обозначился не только повсеместным распространением новых технологий для иллюстрации (о чём мы говорили в предыдущей статье), но и появлением нового поколения специалистов, для кого эти технологии стали обыденными. Если в 90-е мы наблюдали первые шаги дизайна цифровых обложек детских книг в России, то за последующие пару десятилетий этот дизайн прошёл через отрицание, гнев, торг и депрессию, чтобы сформировать представления о том, как должны выглядеть детские книги в современном мире. Стоит сразу отметить, что коренное влияние на этот взгляд оказал, конечно же, западный рынок по объективным историко‑экономическим причинам. И то, что мы наблюдаем сегодня на российском рынке, в целом является неким эхом западных мотивов. В прошлой статье я уже упоминал, что в 90-е стала очень популярной практика ввоза и перевода европейской и американской литературы, в том числе и детской. Для бизнеса было выгоднее продавать адаптированное, чем создавать с нуля, что было характерно больше для стран с сильной внутренней идеологией. В чём‑то данный подход сохранил актуальность и в наши дни. К сожалению, в отличие от Запада, в России так и не сложился институт лит.агентов, а издательства уже давно выступают всё более в качестве иждивенца.

Читать далее

Вклад авторов