Как стать автором
Поиск
Написать публикацию
Обновить
740.65

Машинное обучение *

Основа искусственного интеллекта

Сначала показывать
Порог рейтинга
Уровень сложности

Классификация текстовых сообщений в 1С с помощью Yandex CatBoost

Уровень сложностиСредний
Время на прочтение4 мин
Количество просмотров537

В статье описывается способ классификации коротких текстовых сообщений в 1С с помощью Yandex CatBoost — библиотеки градиентного бустинга на деревьях решений. Например, если имеется набор сообщений от пользователей с вопросами, ответами или комментариями, то с помощью этого инструмента можно автоматизировать классификацию таких сообщений.

Читать далее

Рейтинг 6 нейросетей для сокращения текста, ч. 2: кто король краткости?

Уровень сложностиСредний
Время на прочтение12 мин
Количество просмотров2.2K

Тонны текста и в финале — чувство, что застряли в бесконечном произведении? Нейросети уже здесь, чтобы вытянуть вас из хаоса. Во второй части обзора — больше инструментов и тестов. Я рассмотрел DeepSeek‑R1, который превращает расшифровки в читабельные статьи, а также нейросеть ChatGPT-4o в генерации аннотаций и Grok-3, который успешно создал цепочку телеграм‑постов из видеовыступления. Результаты — под катом.

Ещё здесь рассмотрен Notion (тот самый для ведения заметок) — который тоже поддерживает ИИ‑редактирование. В этой части речь пойдёт о том, как максимально эффективно использовать каждый из этих инструментов. Давайте убедимся, что даже самая неуютная стена текста может быть превращена в лаконичный и удобный контент.

Читать далее

Как мы научили GigaChat слышать: погружение в аудиомодальность

Уровень сложностиСредний
Время на прочтение13 мин
Количество просмотров6.2K

В конце прошлого года мы рассказывали про эксперименты с аудиомодальностью GigaChat, эксклюзивно показывали стенд на нашей конференции. Теперь аудиомодальность GigaChat доступна всем — в веб-интерфейсе giga.chat и Telegram-боте!

Сегодня мы расскажем, почему ушли от классической схемы ASR (Automatic Speech Recognition) + LLM и построили end-to-end модель, которая понимает речь; как устроена наша новая модель; на каких данных мы её обучали; и что из этого получилось.

Читать далее

Мы нанимали маркетологов 60 лет, а потом пришла нейросеть

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров6K

Три года с командой продвигаю детские лагеря по мотивам Гарри Поттера. Это долго! Сложно увидеть что-то новое в тех же отзывах, придумать новый текст (когда пишешь штук 5 каждую неделю), мучительно перебирать фотографии — глаз замылился и не помнишь, что использовала. Креативы быстро выгорают, и всё заново. Когда появились нейросети, я выдохнула.

Продвигаем в телеграме детские тематические лагеря — по мотивам ГП и несколько других тоже в фентези-стиле. Наша задача — показать родителям, что именно этот лагерь станет лучшим летним приключением для их ребенка.

Для успешного продвижения лагерей нам нужно делать три главные вещи:

Читать далее

Обучаем ИИ-агентов играть в видеоигры: новый подход с LLM и рефлексией

Время на прочтение4 мин
Количество просмотров958

Современные ИИ-системы для видеоигр часто упираются в ограничения классических методов, таких как обучение с подкреплением (RL): они требуют больших вычислительных ресурсов, длительного обучения и тонкой настройки под каждую игру. В ответ на эти сложности исследователи из Tencent предложили новый подход к созданию ИИ-агентов для 3D-игр — с опорой на большие языковые модели (LLM) и специализированный язык описания поведения. Такой метод позволяет быстро генерировать эффективные стратегии без переобучения, и, как показывают эксперименты, демонстрирует впечатляющие результаты. Разбираемся, как это работает.

Читать далее

Как мы учили Алису видеть мир с помощью мультимодальной нейросети Яндекса

Время на прочтение11 мин
Количество просмотров6K

Недавно пользователям приложения «Алиса» стал доступен Live-режим, который работает на базе мультимодальной нейросети (VLM), созданной в Яндексе. В этом режиме Алиса распознаёт объекты, показанные ей через камеру смартфона, и рассказывает о них пользователю. А ещё раньше наша VLM стала применяться в Поиске по картинкам, Умной камере и Нейроэксперте. Всё это время технология не стояла на месте и продолжала совершенствоваться. Пожалуй, пришло время поделиться опытом.

На связи Роман Исаченко из команды компьютерного зрения в Яндексе. Сегодня я расскажу, какой путь наша VLM прошла за полгода. А Дарья @dara-orange Виноградова, которая работает со мной в той же команде, поделится описанием пайплайна зрения в Алисе. Мы опишем весь путь формирования новой модели: от архитектуры и сбора данных до финальных замеров качества и скорости.

Читать далее

Бинарная классификация одним простым искусственным нейроном. Личный опыт

Время на прочтение8 мин
Количество просмотров2.4K

Статья о том, как я обучал один простой искусственный нейрон проводить бинарную классификацию линейно-разделимого множества объектов.
Рассуждения, результаты, выявленные особенности.
Личный опыт.

Читать далее

Рейтинг 6 нейросетей для сокращения текста, ч. 1: промты рвут контент на части

Уровень сложностиСредний
Время на прочтение12 мин
Количество просмотров5.4K

Иногда этот мир слишком многословен. Помните случаи, когда вы открываете статью в «Википедии», а через три минуты осознаёте, что потеряли нить повествования? Нейросети, описанные в этом гайде, больше не допустят такого. Сокращение текста — не просто тренд, а настоящий мастхэв для журналистов, студентов, маркетологов и всех, кто хоть раз топил взгляд в 100-страничных инструкциях.

25 полезных промтов, от создания аннотаций до цепочек постов в телеграм‑канале, а также сильные стороны моделей Gemini-2.5-Pro, Grok-3, ChatGPT-4o, DeepSeek‑R1 и Claude-3.7-Sonnet в задачах сокращения текста — обо всём этом здесь. Забудьте о часах правок, когда ИИ превращает полотна букв в аккуратные саммари.

Читать далее

Я — редактор. И я боюсь, что меня заменит нейросеть

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров32K

Каждый апдейт нейросетей звучал, как выстрел. Пока я правил очередной текст, ИИ уже генерировал сотни. В отделе шептали о сокращениях, и однажды мне сказали прямо: «Или учишься, или…».

Страх выкинул меня из зоны комфорта — я нырнул в бездну промтов, инструкций и лайфхаков. Хотел понять, как работать с машиной, прежде чем она займёт моё место.

И знаете что? В процессе я понял кое-что важное.

Читать далее

Искусственный интеллект в киберзащите

Уровень сложностиПростой
Время на прочтение30 мин
Количество просмотров3K

В информационной безопасности технологии искусственного интеллекта пока проходят первые шаги внедрения и эксплуатации. Мы можем уверенно говорить о преимуществах внедрения ИИ в инструменты защиты: снижение нагрузки на специалистов, ускорение реагирования на инцидент за счет автоматизации рутинных процессов, поведенческий анализ пользователей и систем, обнаружение неизвестных ранее угроз. Сегодня ИИ выполняет роль второго пилота рядом со специалистом по кибербезопасности, дополняет и расширяет возможности классических решений для защиты. Когда технология сможет зарекомендовать себя как надежный и точный инструмент и будут решены существенные проблемы с данными, вычислительными мощностями, обучением и разработкой ИИ, мы увидим постепенный переход к полному ИИ-автопилоту для обеспечения киберзащиты.

Про основные области применения ИИ в инфобезе читайте в этой статье.

Читать

Хочешь умного агента? Научись оценивать его правильно

Время на прочтение7 мин
Количество просмотров1.2K

В середине 2024 года AI-агенты стали главной темой обсуждений в технологическом сообществе — с помощью них теперь выполняют множество задач от заказа ингредиентов для ужина до бронирования билетов и записи на прием к врачу. Затем появились вертикальные AI-агенты — узкоспециализированные системы, о которых заговорили как о потенциальной замене привычных SaaS-решений. Но по мере роста влияния агентов увеличиваются и риски, связанные с их преждевременным внедрением.

Недостаточно протестированный AI-агент может стать источником множества проблем: от неточных предсказаний и скрытых байасов до плохой адаптивности и уязвимостей в безопасности. Такие ошибки дезориентируют пользователей и подрывают доверие к системе, нарушая принципы fairness и транспарентности.

Если вы разрабатываете AI-агента, наличие чёткой стратегии безопасного деплоймента критически важно. В этой статье мы рассмотрим, почему тщательная валидация необходима, разберём пошаговые подходы к тестированию и методы проведения комплексной оценки AI-агентов для обеспечения их надёжного развертывания.

Читать далее

Чёрный ящик раскрыт: как инъекция промта заставляет ИИ говорить всё и вытягивает системный запрос

Уровень сложностиСредний
Время на прочтение8 мин
Количество просмотров30K

Исследователи из HiddenLayer представили универсальную технику инъекции промтов, которая успешно обходит защитные механизмы ключевых современных ИИ‑моделей. Это касается систем OpenAI (ChatGPT-4o, 4o‑mini, 4.1, 4.5, o3-mini, o1), Google (Gemini-1.5, 2.0, 2.5), Microsoft (Copilot), Anthropic (Claude-3.5, 3.7), Meta✶ (семейства Llama-3✶ и 4), DeepSeek (V3, R1), Qwen (2.5-72B) и Mistral (Mixtral-8x22B).

Путём применения техники, связывающей правила безопасности и ролевое взаимодействие, компании удалось обойти настройки поведения моделей и получить результаты, нарушающие принципы безопасного использования ИИ. Это касается контента по темам CBRN (химические, биологические, радиологические и ядерные угрозы), а также извлечения системных промтов.

Читать далее

Vending-Bench: бенчмарк, из-за которого языковые модели впадают в экзистенциальный ужас и пишут жалобы ФБР

Уровень сложностиПростой
Время на прочтение20 мин
Количество просмотров5.4K

Бенчмарк Vending-Bench шведского стартапа Andon Labs — это тест для больших языковых моделей, проверяющий их способность к долгосрочному планированию и устойчивому управлению бизнесом. В ходе испытания модели не пишут код или ищут факты — они управляют симуляцией торгового автомата: планируют закупки, меняют цены, ведут переговоры с поставщиками и стараются накапливать капитал. Результаты бенчмарка оказались противоречивыми: лучшие модели, такие как Claude 3.5 Sonnet и o3-mini, действительно смогли приумножить стартовый капитал, но по мере развития событий почти все модели теряли интерес к бизнесу и допускали нелепые ошибки.

Читать далее

Ближайшие события

Как мы внедрили LLM в рабочие процессы аналитиков на R — и сделали это бесплатно

Уровень сложностиСредний
Время на прочтение10 мин
Количество просмотров3K

В этой статье расскажу, как мы в команде аналитиков начали использовать большие языковые модели (LLM) в повседневных рабочих инструментах. Всё построено на R, и покажу на практике, как можно внедрить такие фичи у себя — без платных подписок, без OpenAI и без строчки кода на Python.

Читать далее

Как мы научились сохранять тембр и интонацию спикера при переводе видео в Яндекс Браузере

Время на прочтение12 мин
Количество просмотров29K

Осенью 2021 года мы впервые представили пользователям технологию перевода видео в Яндекс Браузере. Этот инструмент быстро стал популярен: с его помощью переведены уже миллионы часов видеоконтента. Напомним, что на старте для перевода использовались только два голоса — мужской и женский. Затем мы расширили набор заранее созданных голосов. Ну а сегодня мы делаем следующий большой шаг вперёд.

Теперь наша технология сохраняет тембр и интонации оригинального голоса, создавая перевод, который звучит более естественно и близко к оригиналу. О том, как мы этого добились, расскажу в этой статье. Вы узнаете, как выглядит архитектура нашего нового решения, какие проблемы zero‑shot‑синтеза мы решали и как ускоряли инференс новой модели. Расскажу про эвристики для выбора аудиопромптов. Поговорим про замеры качества. Ну и, конечно же, покажу итоговый результат нашей работы в виде ролика в конце статьи.

Читать далее

Обучаем нейросеть управлению транспортом на основе мультисенсорных данных и информации о локальных траекториях

Время на прочтение21 мин
Количество просмотров2.3K

Современные системы автономного вождения стремительно развиваются, объединяя достижения в области машинного обучения, робототехники и сенсорных технологий. Одной из ключевых задач при построении таких систем остается точная интерпретация окружающей среды и принятие решений в условиях высокой неопределенности. Эффективное управление транспортным средством требует надежного восприятия дорожной сцены, для чего всё чаще применяется мультисенсорный подход — объединение данных с различных сенсоров, — а также использование заранее рассчитанных траекторий в качестве ориентира.

Почему я взялся за этот проект? Всегда было интересно, как «видит» дорогу беспилотник и как можно научить его принимать решения. Хотелось не просто изучить подходы из книжек и статей, а руками собрать полный пайплайн — от сбора данных до управления на основе мультисенсорного восприятия и локальных траекторий.

Читать далее

Endless Fun Machine: бесконечный генератор смешных картинок

Уровень сложностиСредний
Время на прочтение4 мин
Количество просмотров2.8K

Может ли ИИ шутить? Я провел эксперимент, чтобы ответить на этот вопрос.

В этой статье я расскажу, как я научил ИИ генерировать смешные картинки с нуля.

Читать далее

Как мы в Авито предсказываем категории объявлений по описанию

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров13K

Привет! Меня зовут Руслан Гилязев, я работаю в подразделении DS SWAT в Авито, руковожу командой платформы Item2param. В этой статье рассказываю, с помощью каких технологий мы решаем задачу классификации объявлений и почему это важно для бизнеса. Материал будет полезен DS-инженерам любого грейда и backend-инженерам, которые интересуются темой data science. 

Читать далее

Безопасность ИИ на практике: разбор заданий AI CTF на Positive Hack Days Fest 2

Уровень сложностиСложный
Время на прочтение38 мин
Количество просмотров1.8K

Чем больше систем работают на основе машинного обучения, тем критичнее становится вопрос их безопасности. Умные технологии всё больше окружают нас, и сложно отрицать важность этой темы. С 2019 года на конференции PHDays мы проводим соревнование по спортивному хакингу AI CTF, нацеленное на атаки систем, построенных на машинном обучении. Соревнование проходит в рамках AI Track — направления с докладами на Positive Hack Days, где эксперты в области информационной безопасности делятся опытом применения машинного обучения как для offensive, так и для defensive задач. В 2023 году мы поэкспериментировали с форматом, создав квест-рум, где участникам нужно было обойти три фактора защиты, чтобы выбраться. Однако, прислушавшись к многочисленным просьбам сообщества, мы решили вернуться к нашему традиционному формату CTF.

Читать далее

Внутренний голос: как электроды и ИИ возвращают речь парализованным людям

Время на прочтение6 мин
Количество просмотров918

Представьте ситуацию: вы составляете фразу в своей голове, но произносит ее компьютерный помощник, а не вы. Для миллионов людей, которые лишены речи из-за паралича, инсульта или нейродегенеративных заболеваний, это становится реальностью. Импланты, сверхтонкие электроды и искусственный интеллект позволяют преобразовать электрическую активность мозга в слова. От калифорнийских лабораторий до российских стартапов — ученые и компании учатся возвращать голос тем, кто молчал годами. Сегодня предлагаю разобраться, как это работает и какие проекты меняют жизни уже сейчас.

Читать далее

Вклад авторов