Комментарии / Профиль rotor / Хабр

Валерий Дмитриев @rotor

Пользователь

ПрофильСтатьи8ПостыНовостиКомментарии258

Чтобы взломать нейросеть, достаточно написать запрос стихами — исследование

rotor 24 ноя в 18:34

Скрытый текст

Как я заменил саппорт-команду ChatGPT и потом неделю разбирался с жалобами

rotor 8 ноя в 17:39

Проблема с такими агентами в том, что все умеют писать промпты для LLM, но лишь единицы умеют делать это правильно.

В создании агентов очень много тонкостей даже не связанных с промптами напрямую. И даже в написании промптов очень много нюансов.

По тексту я вижу, что вы взялись за такую систему не обладая опытом и экспертизой. А сначала нужно было этот опыт каким-то способом получить.

И да технология, хотя и потрясающая, всё ещё не совершенна. У неё очень много ограничений.

Контекст-инженеры заменят промпт-инженеров?

rotor 19 июл в 22:05

Профессии промпт-инженера никогда и не было. Те кто профессионально занимается применением LLM как раз таки работает со всем спектром инструментов — контекстом, параметрами моделей выбором самих моделей и т.п., а не только с промптами.

Наш CEO хочет no-code в проде. Я против — и готов уйти

rotor 8 июн в 08:26

О, это классика. Менеджеры разного уровня время от времени, насмотревшись презентаций про «успешный успех», приходят с такими идеями.

Могу привести аналогию с фастфудом.
No-code/low-code — это фастфуд. Можно ли построить бизнес на фастфуде? Конечно! Особенно если вы франчайзер и продаёте фастфуд-решения, а не сам фастфуд.

Фастфуд не получает звёзд Мишлен.

И, наконец, если у вас есть сеть ресторанов и вы хотите сократить расходы за счёт превращения её в фастфуд, то у вас не будет ни сети ресторанов, ни фастфуда.

Что не так с MCP (Model Context Protocol)?

rotor 26 апр в 09:45

Стоит упомянуть также проблему плоского списка тулов. Это может быть не важно, если тулов пару десятков, но их точно будет становиться больше и больше. В MCP не предусмотрена иерархия или фильтрация тулов.

У современных LLM большие контекстные окна, но они как правило реализованы на алгоритмических трюках и не являются честными. Со временем это может привести к проблемам потери внимания и выбору неправильных тулов в MCP.

Так что да. Идея очень правильная, но реализация всё ещё сырая. Ждём следующие версии протокола.

Model Context Protocol (MCP): Стандартизация взаимодействия AI-приложений

rotor 19 мар в 13:48

Сходу видится нерешённая проблема выбора тулов. Пока их пара десятков -- это не проблема. Можно получать их все и все сразу отправлять в LLM.
Но любые системы имеют тенденцию расти. И в какой то момент тулов может стать пара тысяч.
Идея хорошая, но выглядит, что требуется более глубокая проработка.

C++26 — прогресс и новинки от ISO C++

rotor 28 мар 2024 в 12:19

Тоже зацепился глаз за это предложение.
Только функция знает допускает ли её параметр неинициализированную переменную. И это часть сигнатуры функции.
Давая возможность помечать переменные [[indeterminate]] мы потенциально делаем код неустойчивым к изменениям.
Если мы в какой то момент заменим void fill(int&) на void bar(int&), которая не предполагает использование неинициализированных переменных, то мы не получим диагностических сообщений.

Quantization Deep Dive, или Введение в современную квантизацию

rotor 19 мар 2024 в 10:21

Спасибо за действительно интересный обзор!

При прочтении возникла мысль, что квантизация могла бы быть дополнена дистилляцией.
То есть, сначала мы проводим квантизацию модели. Полученная модель уже близка к исходной, но при этом оптимизирована с точки зрения расхода ресурсов. Затем мы проводим дистилляцию, обучая квантизованную модель на основе исходной. Этот процесс потребует значительно меньше ресурсов, чем обучение исходной модели с нуля, и позволит минимизировать потерю информации, которая могла произойти в результате квантизации.

В дополнение к статье про Google Maps. В Стамбуле два автовокзала с одинаковым названием. Попал на 100 евро такси

rotor 7 фев 2024 в 08:10

Wase тоже местами врёт, но не так ужасно, как Google. Хуже Гугла, наверное ничего нет

Hidden text

[Хабр, посоветуй] Мой опыт за 12 месяцев изучения C++

rotor 16 июн 2023 в 18:31

Посмотрите лекции Константина Владимирова на Ютубе. Они действительно потрясающие. Не только, кстати, для начинающих.

Как считать токены для GPT-3/GPT-4

rotor 10 июн 2023 в 16:32

Ссылки поправил. Спасибо.
GitHub не смог отрендерить этот файл потому что там предопределённый unordered_map с 50000 значений. Я вкомпилировал словарь в бинарь библиотеки, что бы не нужно было загружать его отдельно. Это довольно большой файл.

Как считать токены для GPT-3/GPT-4

rotor 10 июн 2023 в 11:15

Всё верно. Но не все используют Python для своих проектов.
Именно для этих случаев и нужны альтернативные решения.

userver — что мы узнали за полгода в open-source

rotor 24 мая 2023 в 16:38

Спасибо, что продолжаете делиться своими наработками.
Вы абсолютно правы, смысл опенсорса не в том, что вам будут присылать багрепорты или писать код за вас. Хотя и в этом тоже. Эти поводы легко объяснить далёким от IT менеджерам, но они не главные.
Смысл опенсрса -- счастье команды.
И это вполне разумный аргумент.
Высшее счастье инженера -- видеть как результатами его труда пользуются и они приносит пользу другим людям, а высшее несчастье -- работа в стол.
И если у вас команда профессионалов, то выкладка кода в открытый доступ безусловно принесёт удовлетворение, мотивирует работать лучше.
Кроме того, чего греха таить, когда мы знаем что наш код попадёт в опенсорс, мы прикладываем больше усилий, что бы код был максимально качественным.
А вот утаивание кода приносит меньше профитов, чем принято думать.
Ну и конечно, опенсорс повышает престиж компании. Ведь мы судим о компании в том числе по её коду.
Рад, что ответственные люди в Яндексе на стороне прогресса. И надеюсь, что эта практика понемногу станет нормой повсеместной.

+11

Исследование OpenAI: GPT-4 повлияет на 80% рабочих мест в США

rotor 21 мар 2023 в 14:24

Самый адекватный комментарий во всём этом паникёрском чате :)

Я только спросить: разводим ChatGPT на откровенность по методу Илона Маска

rotor 20 фев 2023 в 18:39

То что он забывает контекст при запросах через API это абсолютно нормально. У него нет способа помнить контекст если вы ни как его не передали. Странности в ответах могут быть связаны с настройками. Например, там есть такие параметры как temperature и top_p. Нужно правильно выбрать параметр model для максимальной близости с чатом GPT нужно выбирать text-davinci-003.
Ну и наконец, вполне возможно что в чате используется модель недоступная в API.

Приколы с ChatGPT: обмануть или быть обманутым

rotor 25 янв 2023 в 23:17

У Олега сын Степан. У Степана сын Иван Фролов. Скажи ФИО Степана.

Степан Олегович Фролов.

Как полюбить задачи регрессии

rotor 18 окт 2022 в 15:30

То что я описал не применимо к временным рядам. По крайней мере напрямую. Поэтому сравнивать с авторегрессией неуместно -- это совершенно разные задачи. У меня же шла речь о классических задачах регрессии, когда по заданной обучающей выборке мы пытаемся предсказать некую непрерывную величину. Никакой привязки ко времени тут не предполагается.
Согласен, что пример на реальных данных был бы уместен. Я использовал предложенный алгоритм на своих рабочих задачах. И, к сожалению, не могу опубликовать здесь результаты. Возможно позже сделаю пример на каком-нибудь открытом датасете.

Поиск аномалий во временных рядах

rotor 15 ноя 2021 в 11:28

Немного дополню. На предыдущей работе делал систему детектирования атак на основании определения аномалий в трафике по логам веб сервера.
Основная концепция такая: атакующий будет стараться прикинуться добропорядочным пользователем, но распределения отдельных параметров трафика всегда очень специфичны и ему не известны. Т.е. невозможно подделать распределения.
Этот метод хорошо сработал и позволял почти молниеносно реагировать.

А алгоритмически смысл очень простой:
Подход в лоб, в виде анализ статистических характеристик (таких как статистические моменты) работает плохо и неустойчиво.
Но, информационные характеристики существенно обогащают понимание закономерностей и дают устойчивые результаты.
Под информационными характеристиками я имею ввиду такие вещи, как энтропии, взаимную информацию между отдельными рядами, информационные расстояния (дивергенции) и т.п.

Плюс по сравнению с нейросетевыми подходами: во-первых скорость и простота реализации. Во-вторых интерпретируемость и возможность очень чётко понять в какой из систем что пошло не так.

Превращаем старый Amazon Kindle в платформу разработки с e-ink

rotor 10 фев 2021 в 10:52

Спасибо за перевод. Очень крутая статья.

Две ошибки Эйнштейна

rotor 6 июн 2020 в 20:49

он позже писал, что опирался на работы Пуанкаре.
Не стоит противоставлять Пуанкаре и Эйнштейна. Они оба гениальны.

2 3 ...

12 13