Comments / Profile of antipov_dmitry / Habr

How to become an author

Дмитрий Антипов @antipov_dmitry

AI / LLM / ML / Software

ProfileArticles18PostsNewsComments40

По следам GPT-5: как LLM все сильнее превращается в айфон

antipov_dmitry Aug 9 at 10:38

Вот благодаря таким комментариям в интернете столько мусора и ллмки потом от них и галлюцинируют 😄

Ты не можешь отличить сайт, на котором находишься? Это риторический вопрос, очевидно, что написание даже бессмысленного комментария требует трудозатрат и когнитивных усилий, но - чтобы что? Чтобы уязвить меня? Меня ты не уязвил, а датасет интернета для обучения взял да и испортил.

Роботы потом спасибо не скажут, не надо так!

По следам GPT-5: как LLM все сильнее превращается в айфон

antipov_dmitry Aug 8 at 16:33

Спасибо за дополнение, все верно. Я, честно говоря, не думал что слово айфон само по себе является таким мощным триггером, что мне аж в двух минусах приписали, внимание, его рекламу 😄 На самом деле переход в тексте с айфона на смартфоны получился просто из-за мысли о том, что именно эппл сделали ставку на совершенно новый интерфейс (и он до сих пор с нами), а когда такой интерфейс стал стандартом де-факто, то выделить чем-то именно айфон на фоне всех конкурентов уже было нельзя

По следам GPT-5: как LLM все сильнее превращается в айфон

antipov_dmitry Aug 8 at 16:21

Айфон принес тот самый интерфейс управления смартфонами, который с нами уже почти два десятилетия. Разница между первой версией айфона и любым смартфоном сейчас - номинальна, разве нет?

По следам GPT-5: как LLM все сильнее превращается в айфон

antipov_dmitry Aug 8 at 16:13

Ну, главный акцент у этого предложения был как раз во второй его части, а по первой - согласен, надо было выражаться яснее 😄 Но я все же не писал, что эппл его изобрели первыми, но, кажется, они были теми, кто сделал ставку именно на сенсор (на всю котлету, как говорится), без клавиатур и стилусов. И главная заслуга того маркетинга - symbian мертв, стилусы мертвы, а тот придуманный способ управления телефонами с нами уже больше 15 лет без особых изменений

По следам GPT-5: как LLM все сильнее превращается в айфон

antipov_dmitry Aug 8 at 15:37

Конечно же я пробовал делать научные исследования с помощью всех топовых ллмок и это все выглядит как полная шляпа 😄 Всеми этими "исследованиями", как и большей частью неподготовленного анализа вида "вот пдф, просто посчитай мне в нем Х", - нельзя пользоваться, оно получается околомусорным. Я не топлю безусловно за то, что ллмки всех заменят или что это серебряная пуля для всего на свете, ни в коем случае.

LLM дарят очаровательную магию простоты, но на деле это не избавляет от той большой работы, которую надо проделать, чтобы итог получился действительно хороший. Да, многое маркетингом и энтузиастами подается как уже решенное, а на деле работает примерно никак, но и целиком отрицать прогресс таких систем не очень честно.

Когда вышла первая версия chatgpt, кто-то мог представить, что спустя всего пару лет можно будет просто кинуть в него скриншот конфига nginx и попросить его тонко настроить кэш на проекте?

Переизобретая аналитику будущего: как и почему LLM-агенты меняют анализ продуктов, но все не так просто

antipov_dmitry Jul 28 at 10:49

Спасибо! 60 лет мультику, а вся часть про двух из ларца как будто бы современная специальная аллюзия про промптинг LLM 😄

Искусственный интеллект не представляет угрозы. Угроза — это человек

antipov_dmitry Jul 25 at 07:07

Спасибо за статью. Кажется, что в любой буре социальных изменения, которую вызывает новая революционная технология, всегда угрозу создает человек. Изобретение телефона, а затем интернета, тоже способствовало всей перестройке общества, тоже породило множество нового фрода, но ничего — адаптировались.

В конце концов, у каждого из нас есть дома штуки, которыми очень легко причинить серьезный вред другим, но никто не видит угрозы в условных кухонных ножах.

Как и зачем мы замеряли знания культурного кода у YandexGPT

antipov_dmitry Dec 23 2024 at 18:56

Насколько глубоким в каждой теме планируется бенч или же вы его зафиксировали (надолго ли?), и он не будет развиваться? Есть достаточно много «распределенного» культурного кода, который является важным для хоть и весомого, но все же среза людей. Условно, есть блогеры-миллионники (и генерируемый ими культурный код для публики всех возрастов — тоже), без которых кто-то не может представить свою жизнь, а кто-то о них даже не слышал. Или региональные шутейки и словечки (особенно в приграничье), например, «на ход ноги» или приморские «чифанька» вместе с «фонарный». Кажется, что культурный код все равно относительно конечен, но вот именно для всех единым бенчом его как померить? Как вы определяется что попадает в бенч и когда надо остановиться?

И, кажется, что чем больше будет такого, тем чаще будут проваливаться люди и, наоборот, выигрывать модели просто за счет ш̶и̶р̶о̶т̶ы̶ ̶р̶у̶с̶с̶к̶о̶й̶ ̶д̶у̶ш̶и знаний всего интернета.

Как планируете с этим бороться?

А если скатываться в просто сравнивание с другими моделями, то будет просто гонка кто глубже и ширше обработал культурный код, но у вас бенч закрыт, поэтому что именно в нем вызывает вопросики.

И второй вопрос, планируете ли бенч с визуалом культурного кода? Люди, архитектура, символика и тд?

Какой тип разметки данных требуется для вашего проекта? Полный гид по аннотированию изображений

antipov_dmitry Dec 23 2024 at 08:44

От статьи отовсюду сквозит gpt-стилем, который затем даже не вычитывали. Ну вот как пример: «Распознавание лицевых выражений». Да, есть такая устоявшаяся штука «Facial expression recognition», которую ни один человек на русский не переведет как «лицевые выражения».

Плюс вы не указали битовую маску — кисточку, которая в сто раз удобнее полигонов для сложной геометрии и для сложных задач используется почти всеми ведущими ai-лабораториями мира.

Не раскрыт вопрос того, что bbox часто используется как более быстрый детектор, через который затем можно доуточнить объект внутри бокса. То что часто разметка делается так, что из одного типа делается другой — тоже.

Не раскрыт вопрос того, что каждому выделению часто требуется метка объекта.

Не раскрыт вопрос предразметки и ассистов типа SAM, без которых серьезная разметка уже вообще не делается.

Вообщем, в статье что-то есть, но это точно не полный гайд, а интересная тема, которую блоками писала генеративка.

Как LLM меняют архитектуру систем: от простых дата-пайплайнов к интеллектуальным автономным агентам

antipov_dmitry Dec 22 2024 at 11:04

В оригинале они ничего не пишут про подход, в котором LLM вообще не присутствует и можно обойтись классическим NLP, не тащя ллмку в прод, когда она там не нужна, я эту часть добавил. А дальше — да, фактически их статья, я же про это открыто там и написал. А статья — она как песня, из нее слов не выкинешь, хотя и адаптация на читабельный русский не так проста, как может показаться ツ

Нам нужен RAG, вам нужен RAG: как встроить LLM туда, где она не нужна

antipov_dmitry Dec 9 2024 at 12:35

Нет

Bukva: алфавит русского жестового языка

antipov_dmitry Oct 17 2024 at 12:25

В датасете достаточно сильный перекос по полу в сторону женщин (80 на 20), оказывает ли это какое-то влияние на инференс? И хотелось ли бы это соотношение изменить?

Тыкай и кидай голосовухи: как ускорить сбор данных для мультимодальности

antipov_dmitry Oct 7 2024 at 13:05

Рома, привет! Сейчас у нас эксперимента фактически два: ускорить текущий пайплайн описаний (который не включает в себя точки вообще, только описание) и пособирать к ним в том числе дополнительно и точки ключевых объектов (благо что это дешево). Поэтому да, понял все правильно: сначала выделяют точки, потом общую голосовуху. Соответственно, не соотносим их между собой сейчас никак - гипотеза заключается в том, что точки это лишь дополнительная подсказка для обучения модели, а вот разобраться где что по тексту - должна модель сама.

Про детализацию "выделяем отдельно каждый объект и детально голосим его" - очень хотим попозже попробовать и такой вариант, проблем с такой реализацией как будто бы нет, но пока стартовали с вариантов попроще.

Большие и чёрные (ящики): что мы знаем о том, как «думают» нейросети?

antipov_dmitry Sep 11 2024 at 07:06

(Кстати, оставляйте комментарий, если хотите, чтобы мы разобрали этот и другие методы из мира механистической интерпретируемости!)

Оставляю комментарий, было бы интересно почитать. За эту статью - спасибо!

Разбор SAM2 через колено в голову или революция в разметке видео

antipov_dmitry Aug 21 2024 at 13:34

У них есть официальная веб-демка, на которой можно поиграться и это вот именно она: https://sam2.metademolab.com/

GigaChat + RAG: как гига нам инструкции для разметки пишет в 3 раза быстрее

antipov_dmitry Jul 2 2024 at 00:59

😀 Это стоит читать как «он решает задачу, плюс сходу закрывает вопрос доступов/оплаты, претензий от кибербезов и отсутствия лишних прослоек в подключении» 🤗

Заменят ли LLM людей в разметке данных для AI?

antipov_dmitry Apr 15 2024 at 07:51

Спасибо за развернутое дополнение, мне было интересно прочитать и сам ответ и ссылки в нем.

Мы просто работаем в достаточно узком понимании биологии людей и моделей тоже, поэтому не все аналогии могут быть удачны для биофизика :) С точки зрения разметки, не совсем важно то, как именно мы назовем что именно происходит с ответом разметчика (и что стало его первопричиной) - логическая ошибка, фантазия, незнание, галлюцинация, некая "оптимизация времени трудовой деятельность" - как угодно, нам важно лишь то, чем является конечный (часто бинарный) результат.

С людьми мы неизбежно выкидываем часть их ответов, процент разный в разных типах задач, но эта величина практически постоянна на длинных дистанциях. Идеей было лишь сравнить этот феномен с моделями, то есть, неизбежность принятия лишь части ответов.

Вы подсветили интересную штуку, которую мы поизучаем дополнительно: более глубокое понимание происходящих процессов, так скажем, "генерации ответа" позволит нам сделать более
серьезные инструменты анализа этих ответов, а может быть и вообще постановки изначально самого задания.

Большое спасибо!

Уродливая математика в машинном обучении или чему нам стоит поучиться у деривативов?

antipov_dmitry Jan 14 2024 at 11:14

Спасибо! Все так, чем монструознее и мощнее нейронки в наличии, тем больший класс задач будет им отдавать просто потому что так можно, увы, хотя оправдано это далеко не всегда.

Уродливая математика в машинном обучении или чему нам стоит поучиться у деривативов?

antipov_dmitry Jan 14 2024 at 11:09

В мире нейросетей все очень по разному, и он точно не черно-белый, как и мотивация инженеров сводится не только к "за деньги - да". Я лично знаю людей, которых неплохо повышали за именно качественные исследования, без каких-либо kpi. И знаю обратные ситуации, например, когда сотрудников (или студентов физтеха) скупали оптом, просто потому что "они умные и пусть лучше работают у нас", после чего за ними вообще пропадает какой-то контроль, потому что этот контроль падал на других людей, у которых хватало своих корпоративных забот.

Уродливая математика в машинном обучении или чему нам стоит поучиться у деривативов?

antipov_dmitry Jan 14 2024 at 10:37

Не соглашусь, потому что мотивация "выполнено-освоено" она, возможно, более присуща менеджменту (и чем выше менеджмент, тем вероятнее там такое мышление, но все тоже далеко не черно-белое), а вот у сильных технарей мотивация работает уже по другому - вопросы просто получения немаленькой зарплаты уже давно решены и вот так это уже не работает, иначе из всех утюгов не трубилось бы о "выгорании".

Потому что все выгорающие зарплату, скорее всего, получали, зарплата по общим меркам была немаленькая, да и задачи решали и бюджет осваивали, однако ж проблема есть. Потому что она гораздо сложнее той конструкции, что вы сейчас описали.

1