Search
Write a publication
Pull to refresh
15
6
AI Talent Hub @ai-talent

Онлайн-комьюнити специалистов по ML/DS/AI

Send message

Reflect, Retry, Reward: как RL учит LLM рефлексировать и становиться лучше

Level of difficultyMedium
Reading time5 min
Views1.1K

Привет, Хабр!

Меня зовут Роман, я NLP-инженер в Сбере. Занимаюсь мультиагентными системами и работаю с LLM в проде. Сегодня расскажу про одну из самых интересных статей июня по версии Huggingface Daily Papers — Reflect, Retry, Reward: Self-Improving LLMs via Reinforcement Learning.

Читать далее

Знает ли LLM то, что знаешь ты?

Level of difficultyMedium
Reading time9 min
Views2.8K

Представьте, что у вас есть друг, который идеально завершает ваши мысли. Вы говорите: «В детстве я любил...», а он тут же продолжает: «...играть в футбол и смотреть „Смешариков“». Совпадение? Или он вас слишком хорошо знает?

Теперь представьте, что этот «друг» — языковая модель вроде GPT-4, обученная на десятках терабайт текста. Вы даёте ей фразу — и она точно угадывает продолжение. Вопрос: она действительно видела это раньше или просто хорошо обучена угадывать?

Вот тут на сцену выходит Membership Inference Attack (MIA) — метод, который позволяет выяснить, был ли конкретный текст в тренировочном датасете модели. По сути, это способ заставить LLM проговориться: «Да, я это читала. Но никому не говори».

Раньше такие атаки были возможны только при доступе к логитам — вероятностям слов, которые модель «придумывает» на выходе. Но популярные модели вроде ChatGPT или Claude таких данных не раскрывают — вы получаете только текст.

Можно ли вытащить приватные данные, видя только текст, без логитов и без доступа к модели?

Спойлер: да, можно. И способ называется PETAL.

Читать далее

AFlow: как создавать мультиагентные системы без программиста

Level of difficultyHard
Reading time5 min
Views1.9K

Привет, Хабр!

Меня зовут Ярослав, я магистрант AI Talent Hub в ИТМО. Сегодня расскажу об одной из самых интересных статей ICLR 2025 — AFlow: Automating Agentic Workflow Generation.

В ней предложен подход к автоматическому созданию мультиагентных систем для решения прикладных задач с помощью LLM и алгоритма Monte Carlo Tree Search (MCTS). Разберёмся, как это работает и почему это важно.

Читать далее

Эмпатичный ИИ: как трансформеры учатся распознавать эмоции в разговорах

Level of difficultyMedium
Reading time5 min
Views1K

В эпоху чат-ботов и голосовых помощников ИИ всё чаще становится собеседником человека. Но чтобы стать по-настоящему полезным в коммуникации, он должен не только понимать слова — но и улавливать эмоции, интонации, паузы и даже жесты. Именно это и пытается решить задача Emotion Recognition in Conversations (ERC).

В недавней работе »A Transformer‑Based Model With Self‑Distillation for Multimodal Emotion Recognition in Conversations» исследователи предложили архитектуру, которая объединяет мультимодальные сигналы (текст, аудио, видео) в единую модель, способную «читать между строк» в прямом смысле. Рассказываем, как это устроено и почему это важно.

Читать далее

Все, что нужно для создания приложений с LLM: обзор возможностей LangChain

Reading time9 min
Views6.1K

LangChain: твой универсальный конструктор для работы с LLM

Сегодня появляется все больше и больше приложений на основе больших языковых моделей — условным чат-ботом в Telegram уже никого не удивить. В рамках обучения в магистратуре AI Talent Hub мне не раз приходилось разрабатывать такие приложения с использованием ChatGPT или GigaChat. В этой статье я расскажу о полезном инструменте для работы с LLM - мы рассмотрим главные возможности фреймворка LangChain, а также методы мониторинга и проверки качества существующего приложения с ИИ.

Читать далее

Осваивая новые направления: что получила backend-разработчица от изучения продуктовой проработки и дизайна

Reading time6 min
Views548

Всем привет! Меня зовут Воляница Елизавета, я магистрант ИТМО по программе Искусственного интеллекта AI Talent Hub и по совместительству backend-разработчик на маркетплейсе. В основном я занимаюсь проектированием архитектуры, декомпозированием задач и написанием кода для различных систем. Но причём здесь графический дизайн? 

Недавно, когда у меня появилась та самая гениальная идея для того самого стартапа, который «ну 100% выстрелит», я столкнулась с тем, что нужно не только проектировать архитектуру и писать код. Тогда мой дизайн выглядел как-то так:

Читать далее

SLAVA — бенчмарк социально‑политического ландшафта и ценностного анализа

Level of difficultyMedium
Reading time6 min
Views974

Большой обзор: от идеи и структуры — до неожиданных выводов и практических сценариев применения

SLAVA — это открытый русскоязычный бенчмарк, разработанный экспертами РАНХиГС и ИСП РАН для проверки, как большие языковые модели справляются с фактологическими и ценностно нагруженными вопросами по истории, обществознанию, географии и политологии. 

В корпусе — 14 199 заданий пяти форматов и трёх уровней провокационности. Уже протестировано более 40 моделей: от GPT‑4o и Claude‑3.5 до GigaChat и Llama‑3 8B. Это открытый русскоязычный бенчмарк, созданный для проверки, как большие языковые модели справляются с фактологическими и ценностно нагруженными вопросами из истории, географии, обществознания и политологии. 

Читать далее

ИИ-ассистент для врачей: как мы автоматизируем приём пациента на основе анализа речи и NLP

Level of difficultyMedium
Reading time4 min
Views2.4K

Привет, Хабр! Мы команда AI Talent Hub ИТМО хотим рассказать о совместным с компанией Genotek проекте — ИИ-ассистент для врачей. Уже полгода мы разрабатываем сервис, который распознаёт медицинские диагнозы и автоматически заполняет карту пациента, чтобы освободить медработников от рутинных задач. Под катом ― о деталях решения.

Читать далее

Путь от преподавателя английского к AI Product Manager

Level of difficultyEasy
Reading time4 min
Views2.1K

Всем привет, меня зовут Оля Шерстюк, раньше я была преподавателем английского языка, но начиная с 2023 года решила поменять свою деятельность и перейти в IT, сейчас я учусь в магистратуре AI Talent Hub. Хочу поделиться с вами своей историей.

В 2023 я зачеркивала дни в календаре, приходя с работы в Сверхновой школе в Питере. Несмотря на то, что это было самое лучшее из всех мест, где мне удалось поработать, всё сложилось так, что на 5-м году преподавания я уже просто выгорела. Работа учителя — это самая недооцениваемая и ресурсозатратная деятельность, которую только можно придумать.

Однажды я прочитала статью про применение искусственного интеллекта в декодировании языка животных в The New Yorker, одновременно всё большую популярность приобретал Chat GPT, и меня затянуло в новое и неизведанное.

Погуглив, я узнала, какой язык программирования нужен, чтобы прикоснуться к ИИ, посмотрела, какие есть курсы.

Читать далее

Как бустануть джуну в карьере: истории студентов AI Talent Hub

Reading time6 min
Views1.7K

После окончания бакалавриата студент стоит перед выбором — пойти работать или продолжить обучение в магистратуре. По разным данным, примерно половина выпускников идут получать степень магистра. Причины у всех разные: кто-то хочет повысить свою конкурентоспособность на рынке труда, кому-то недостаточно квалификации бакалавра для выбранной профессии, еще часть хочет попробовать себя в другом направлении подготовки, а кто-то — мечтает об аспирантуре. Какую роль магистратура играет для студентов в действительности? Собрали вдохновляющие истории джунов, которые поступили в совместную магистратуру по искусственному интеллекту от @NapoleonIT и ИТМО AI Talent Hub и за первый год обучения раскрыли свой потенциал на максимум. Их опыт и советы помогут разобраться, как развить себя и стать успешным специалистом в IT даже на старте карьеры. 

Читать далее

Information

Rating
1,726-th
Location
Россия
Registered
Activity