Комментарии / Профиль antipov

Дмитрий Антипов @antipov_dmitry

AI / LLM / ML / Software

ПрофильСтатьи35ПостыНовостиКомментарии49

Тело AI-агентов: технический обзор робота 1X Neo

antipov_dmitry 4 ноя в 11:46

Вы статью-то читали вообще или сразу в бой?

Выбираем векторную БД для AI-агентов и RAG: большой обзор баз данных и поиск смысла

antipov_dmitry 30 окт в 14:39

Спасибо!

От LangChain к LangGraph: детально разбираемся с фреймворками и всей Lang-экосистемой

antipov_dmitry 16 окт в 07:31

Тут все сложно! 😀

Верхнеуровнево все так - structured output это более широкое понятие, но json это его самая популярная реализация. Поэтому с натяжкой знак тождественности между ними поставить можно.

Если более технически, то разница вот в чем: нативный "tool calling" (как бы он не назывался у конкретного провайдера) - это более сложное понятие, чем просто json-mode. И там и там мы ожидаем json и задаем его сами - да. Но под капотом происходит вот что: json-mode это отправка фактически простого запроса, который содержит в себе требования к json-схеме и этот запрос обрабатывается именно как простой запрос, то есть модель очень старается попасть в схему, но для нее это простой запрос, такой же как и предыдущие.

А когда мы отсылаем tool-calling запрос, то там все примерно похожее, но модель обрабатывает его иначе - используя свою зафайнтюненную версию именно на json-схемы и понятие инструментов - и потому вероятность успеха гораздо выше.

Зоопарк фреймворков для AI-агентов: как выбрать подходящий — делаем бенчмарк и большое сравнение

antipov_dmitry 3 окт в 15:05

Хорошее дополнение, спасибо! Популярность в каком-то виде хорошая прокси-метрика к зрелости/adoption, ведь да, фактически чем мощнее коммьюнити (особенно выраженное в звездочках гитхаба), тем вероятнее прекрасное светлое будущее самого фреймворка и особенно если этот фреймворк - ленгчейн 😀

Тест-драйв Nano Banana (Gemini 2.5 Flash Image): новый фотошоп и революция в редактировании изображений от Google

antipov_dmitry 28 авг в 06:38

я потихоньку бы ллмкам уже начинал бы всегда "спасибо" говорить, когда ответ понравился

Тест-драйв Nano Banana (Gemini 2.5 Flash Image): новый фотошоп и революция в редактировании изображений от Google

antipov_dmitry 27 авг в 19:39

Лайк, так и есть!

Как я автоматизировал мониторинг цен своей корзины на маркетплейсах и при чем тут LLM

antipov_dmitry 25 авг в 07:42

У меня был спортивный интерес в первую очередь, особенно про то, как заведется LLM-ная часть (скрапингом всего и вся я занимался много и там ничего нового для меня нет) 😊

В целом, это неплохо сработает на товарах, которые "хорошо бы купить", но они не нужны вот прямо сейчас (там можно выбить вплоть до 10%). И на товарах с длительным сроком хранения, которыми пользуешься много и постоянно (и которые есть где хранить - у меня есть). Например, кофейные дрипы. Вот экономика: я часто покупаю кофе одной питерской конторы, в упаковке 24 штуки. Цена за пачку колеблется от 900 до 1200, при средней цене около 1150 большую часть времени. Кофе пьют двое, иногда больше 1 в день, то есть пачки хватает на 24/~2.3=10 дней. Срок годности - год, но, допустим, нам придут не вчера произведенные, да и совсем годовалые тоже пить не хочется, то есть, у товара примерно полгода точно есть возможность лежать дома на полке.

Если насталкерить цену 870 (так уже было), то разница на 10 пачках (1150-870)*10=2800. Примерно как сходить один раз на одного в бар 🤣 Порше не купишь, конечно, но это и не требует совершенно никаких усилий, да и пример лишь на одном товаре из достаточно большого круга типа стиральных порошков, фильтров, углей-брикетов и прочего разного расходного.

Но, повторюсь, мне в первую очередь было прикольно и весело, но отвечая на конкретный вопрос - да, если замарочиться сильнее, то какая-то выгода есть 😎

Как я автоматизировал мониторинг цен своей корзины на маркетплейсах и при чем тут LLM

antipov_dmitry 25 авг в 07:13

Нет-нет, как раз-таки понял, все именно так 😊 В целом, это можно порешать, чуть усложнив схему: у нас уже есть ссылка на карточку, а на самой карточке мп уже проделали работу по поиску лучших цен у других продавцов - блок "есть дешевле" или "все цены" с указанием конкретной минимальной цены, можно прицепиться к ним. Ну то есть, помимо просто корзины ходить еще по ссылкам и смотреть в этот блок, если там есть что-то интересное, то либо слать уведомляшку сразу, либо усложнять еще - проваливаться в такой список и забирать цены оттуда

Но если мп сам не заматчил добавленный товар с другими поставщиками, то все становится сильно сложнее.

Как я автоматизировал мониторинг цен своей корзины на маркетплейсах и при чем тут LLM

antipov_dmitry 25 авг в 07:08

Скорее всего, не запилит, увы, потому что во всех офертах маркетплейсов написано, что промышленно парсить их нельзя, а значит перепродажа таких услуг будет в довольно серой зоне. Конечно, сами мп и особо крупные продавцы тихо скрапят друг друга, и сторонние сервисы (они есть) тоже их скрапят (и продают результаты как "аналитику" - довольно сомнительного качества), но все, что делается "с улицы" (то есть, не по официальной датке самих мп, а им это не интересно) - в больших масштабах это все равно будет некая аппроксимация от реальности. Ну и плюс на масштабах это действительно сложно

По следам GPT-5: как LLM все сильнее превращается в айфон

antipov_dmitry 9 авг в 10:38

Вот благодаря таким комментариям в интернете столько мусора и ллмки потом от них и галлюцинируют 😄

Ты не можешь отличить сайт, на котором находишься? Это риторический вопрос, очевидно, что написание даже бессмысленного комментария требует трудозатрат и когнитивных усилий, но - чтобы что? Чтобы уязвить меня? Меня ты не уязвил, а датасет интернета для обучения взял да и испортил.

Роботы потом спасибо не скажут, не надо так!

По следам GPT-5: как LLM все сильнее превращается в айфон

antipov_dmitry 8 авг в 16:33

Спасибо за дополнение, все верно. Я, честно говоря, не думал что слово айфон само по себе является таким мощным триггером, что мне аж в двух минусах приписали, внимание, его рекламу 😄 На самом деле переход в тексте с айфона на смартфоны получился просто из-за мысли о том, что именно эппл сделали ставку на совершенно новый интерфейс (и он до сих пор с нами), а когда такой интерфейс стал стандартом де-факто, то выделить чем-то именно айфон на фоне всех конкурентов уже было нельзя

По следам GPT-5: как LLM все сильнее превращается в айфон

antipov_dmitry 8 авг в 16:21

Айфон принес тот самый интерфейс управления смартфонами, который с нами уже почти два десятилетия. Разница между первой версией айфона и любым смартфоном сейчас - номинальна, разве нет?

По следам GPT-5: как LLM все сильнее превращается в айфон

antipov_dmitry 8 авг в 16:13

Ну, главный акцент у этого предложения был как раз во второй его части, а по первой - согласен, надо было выражаться яснее 😄 Но я все же не писал, что эппл его изобрели первыми, но, кажется, они были теми, кто сделал ставку именно на сенсор (на всю котлету, как говорится), без клавиатур и стилусов. И главная заслуга того маркетинга - symbian мертв, стилусы мертвы, а тот придуманный способ управления телефонами с нами уже больше 15 лет без особых изменений

-2

По следам GPT-5: как LLM все сильнее превращается в айфон

antipov_dmitry 8 авг в 15:37

Конечно же я пробовал делать научные исследования с помощью всех топовых ллмок и это все выглядит как полная шляпа 😄 Всеми этими "исследованиями", как и большей частью неподготовленного анализа вида "вот пдф, просто посчитай мне в нем Х", - нельзя пользоваться, оно получается околомусорным. Я не топлю безусловно за то, что ллмки всех заменят или что это серебряная пуля для всего на свете, ни в коем случае.

LLM дарят очаровательную магию простоты, но на деле это не избавляет от той большой работы, которую надо проделать, чтобы итог получился действительно хороший. Да, многое маркетингом и энтузиастами подается как уже решенное, а на деле работает примерно никак, но и целиком отрицать прогресс таких систем не очень честно.

Когда вышла первая версия chatgpt, кто-то мог представить, что спустя всего пару лет можно будет просто кинуть в него скриншот конфига nginx и попросить его тонко настроить кэш на проекте?

Переизобретая аналитику будущего: как и почему LLM-агенты меняют анализ продуктов, но все не так просто

antipov_dmitry 28 июл в 10:49

Спасибо! 60 лет мультику, а вся часть про двух из ларца как будто бы современная специальная аллюзия про промптинг LLM 😄

Искусственный интеллект не представляет угрозы. Угроза — это человек

antipov_dmitry 25 июл в 07:07

Спасибо за статью. Кажется, что в любой буре социальных изменения, которую вызывает новая революционная технология, всегда угрозу создает человек. Изобретение телефона, а затем интернета, тоже способствовало всей перестройке общества, тоже породило множество нового фрода, но ничего — адаптировались.

В конце концов, у каждого из нас есть дома штуки, которыми очень легко причинить серьезный вред другим, но никто не видит угрозы в условных кухонных ножах.

Как и зачем мы замеряли знания культурного кода у YandexGPT

antipov_dmitry 23 дек 2024 в 18:56

Насколько глубоким в каждой теме планируется бенч или же вы его зафиксировали (надолго ли?), и он не будет развиваться? Есть достаточно много «распределенного» культурного кода, который является важным для хоть и весомого, но все же среза людей. Условно, есть блогеры-миллионники (и генерируемый ими культурный код для публики всех возрастов — тоже), без которых кто-то не может представить свою жизнь, а кто-то о них даже не слышал. Или региональные шутейки и словечки (особенно в приграничье), например, «на ход ноги» или приморские «чифанька» вместе с «фонарный». Кажется, что культурный код все равно относительно конечен, но вот именно для всех единым бенчом его как померить? Как вы определяется что попадает в бенч и когда надо остановиться?

И, кажется, что чем больше будет такого, тем чаще будут проваливаться люди и, наоборот, выигрывать модели просто за счет ш̶и̶р̶о̶т̶ы̶ ̶р̶у̶с̶с̶к̶о̶й̶ ̶д̶у̶ш̶и знаний всего интернета.

Как планируете с этим бороться?

А если скатываться в просто сравнивание с другими моделями, то будет просто гонка кто глубже и ширше обработал культурный код, но у вас бенч закрыт, поэтому что именно в нем вызывает вопросики.

И второй вопрос, планируете ли бенч с визуалом культурного кода? Люди, архитектура, символика и тд?

Какой тип разметки данных требуется для вашего проекта? Полный гид по аннотированию изображений

antipov_dmitry 23 дек 2024 в 08:44

От статьи отовсюду сквозит gpt-стилем, который затем даже не вычитывали. Ну вот как пример: «Распознавание лицевых выражений». Да, есть такая устоявшаяся штука «Facial expression recognition», которую ни один человек на русский не переведет как «лицевые выражения».

Плюс вы не указали битовую маску — кисточку, которая в сто раз удобнее полигонов для сложной геометрии и для сложных задач используется почти всеми ведущими ai-лабораториями мира.

Не раскрыт вопрос того, что bbox часто используется как более быстрый детектор, через который затем можно доуточнить объект внутри бокса. То что часто разметка делается так, что из одного типа делается другой — тоже.

Не раскрыт вопрос того, что каждому выделению часто требуется метка объекта.

Не раскрыт вопрос предразметки и ассистов типа SAM, без которых серьезная разметка уже вообще не делается.

Вообщем, в статье что-то есть, но это точно не полный гайд, а интересная тема, которую блоками писала генеративка.

Как LLM меняют архитектуру систем: от простых дата-пайплайнов к интеллектуальным автономным агентам

antipov_dmitry 22 дек 2024 в 11:04

В оригинале они ничего не пишут про подход, в котором LLM вообще не присутствует и можно обойтись классическим NLP, не тащя ллмку в прод, когда она там не нужна, я эту часть добавил. А дальше — да, фактически их статья, я же про это открыто там и написал. А статья — она как песня, из нее слов не выкинешь, хотя и адаптация на читабельный русский не так проста, как может показаться ツ

Нам нужен RAG, вам нужен RAG: как встроить LLM туда, где она не нужна

antipov_dmitry 9 дек 2024 в 12:35

Нет

2 3

Информация

Специализация