Comments / Profile of kucev / Habr

Спасибо за интересную статью! А какой из этапов подготовки данных дал наибольший прирост качества модели? Были ли среди экспериментов этапы, которые, напротив, оказались неэффективными?

Look

Red Teaming для LLM: Полное пошаговое руководство по Red Teaming больших языковых моделей

kucev Feb 14 at 15:31

Спасибо!

Look

В РФ появилась русскоязычная платформа для оценки генеративных нейросетей

kucev Oct 6 2024 at 17:31

Вот: llmarena.ru

Look

Тыкай и кидай голосовухи: как ускорить сбор данных для мультимодальности

kucev Oct 4 2024 at 15:41

В оригинальной статье "Molmo: Outperforming Proprietary Multimodal Language Models" авторы помимо голосовух просят людей показывать на объекты, о которых говорят. Они утверждают, что это помогло научить модель связывать пиксели с текстом.

У вас в гифке после "Давайте смотреть итог:" показывается интерфейс разметки. Правильно ли я понял, что сначала человек выделяет точками объекты про которые он будет рассказывать. И потом записывает голосовуху? Как вы потом соотносите к какой точке какой отрезок аудио относится?

Look

MERA v.1.2.0 Новая версия независимого бенчмарка, что поменялось?

kucev Sep 25 2024 at 12:00

🔥🔥🔥

Look

Обзор бенчмарков для тестирования LLM (больших языковых моделей)

kucev Sep 16 2024 at 10:04

Крутая статья!

Look

Шлепа — Большой Русский Бенчмарк

kucev Sep 2 2024 at 13:33

Look

Шлепа — Большой Русский Бенчмарк

kucev Sep 2 2024 at 13:21

У ребят из LMSYS как раз вышла недавно статья "Does style matter? Disentangling style and substance in Chatbot Arena"

В котором они подтверждают, что красивый маркдаун, более длинные тексты, и разные стилистические хаки завышают рейтинг моделям, которые используют их. И предложили свой способ отделять содержание ответа от его стиля. Сейчас на llmarena.ru мы тоже внедряем этот фильтр.

По нашем данным gpt4 дает довольно сухие ответы без стиля, из-за чего на простых промптах Vikhrmodels/it-5.2-fp16-cp, T-lite ее обгоняет. Скину ниже пару примеров логов.

А как вы боритесь баесом, что модели оценщики (judge LLM as judge) с больше вероятностью голосуют за свою линейку моделей?

Look

Вышла новая — Llama 3.1 405B

kucev Jul 23 2024 at 20:43

Где-то через неделю оценка должна появится на llmarena.ru

Look

Reinforcement Learning from Human Feedback: когда одной математики мало

kucev Jul 4 2024 at 14:26

Отличная статья!

Look

Вредные советы по подготовке датасета

kucev Aug 15 2023 at 20:02

Статья прям по живому задела, у нас тоже офлайн сборы самые интересные и запоминающиеся. SMM даже видео об этом сняло)

Look

Вредные советы по подготовке датасета

kucev Aug 15 2023 at 20:00

Спасибо за интересную статью! А кто у вас отвечает за сбор данных? Отправляете ли вы на объект MLщиков, или у вас есть отдельная роль, кто занимается таким сбором?

Если отдельная роль, то на сколько человек погружен в IT сферу и понимает как лучше организовать сбор, чтобы максимизировать качество собираемых данных?

А если MLщищи, то на сколько они рады таким командировкам?

В разных компаниях видел и 1 и 2 вариант, и оба кажутся не очень идеальными.

Look

Segment Anything: создание первой базисной модели для сегментации изображений

kucev Jun 27 2023 at 09:16

Да, автоматизация ускоряет скорость разметки, делает разметчиков более эффективными, удешевляет разметку.

При этом сам рынок разметки никуда не делся, только теперь наиболее конкурентными становятся компании, у которых помимо людей есть и используемые технологии. И компания TrainingData.Solutions - одна из таких)

Look

EasyPortrait — портретная сегментация и анализ лиц

kucev Apr 28 2023 at 10:56

Пробовали ли вы применять интерактивную сегментацию (Segment Anything, либо HRnet) для простых классов? Думаю губы, брови, глаза она бы хорошо выделяла

Look

EasyPortrait — портретная сегментация и анализ лиц

kucev Apr 28 2023 at 09:09

Почему вы решили делать разметку полигонами с перекрытием? Если сделать перекрытие 1, но ужесточить валлидацию, не будет ли это более выгодно с точки зрения скорости разметки и стоимости? Мы обычно применяем именно такой подход с перекрытием 1.

Look

EasyPortrait — портретная сегментация и анализ лиц

kucev Apr 28 2023 at 09:00

По нашему опыту: если просить разметчиков рисовать тимапы, то для них задача остается все также в постановке классической сегментации, но по полученным тиримапам довольно просто получить маттинг алгоритмически

Look

Пользователь обнаружил, что смартфоны Samsung S20 Ultra и новее улучшают детализацию Луны на любых фото с помощью ИИ

kucev Mar 12 2023 at 19:04

Так в видосике сказано, что у них постобработка AI, которая улучшает качество фото. Под капотом какая-нибудь Super-Resolution моделька. Полюбас в датасете для обучения модельки были изображения луны, поэтому она хорошо запомнила как луна выглядит и с хорошим качеством ее улучшила. Не понимаю, что в этом такого удивительного и необычного?

Look

2 3 4