Comments / Profile of master

Игорь Воронцов@master_program

Преподаю в МФТИ, МГУ, ЦУ и ВШЭ, сотрудник ЦНК МФТИ

437

Subscribers

ProfileArticles146PostsNews1Comments737

Как заработать на LLM, перестав писать «правильные промпты»

master_program Jan 2 at 23:32

Да, плюс конкретно у Gemini очень хорошая встроенная работа с изображениями.

Дипсик для описываемых целей непригоден, например.

Царский путь к пониманию комплексных чисел. Часть I

master_program Jan 2 at 21:31

И любая теория в физике, начиная с Ньютона, на категориальном уровне именно так и устроена (состояния, переходы и операторы).

Различие есть только между "монадами" (отдельными объектами) и полями. Первые описываются как объекты, имеющие небольшое число степеней свободы и свое пространство состояний, а вторые - клеточные автоматы.

Как заработать на LLM, перестав писать «правильные промпты»

master_program Jan 2 at 14:03

Кусочек промпта могу показать (там такого несколько страниц).

Изнутри весь вопрос сводится к методу обратной связи, промпт пишет сама LLM.

Как заработать на LLM, перестав писать «правильные промпты»

master_program Jan 1 at 13:31

И последнее, насчет OCR. На данный момент любые OCR работают гораздо хуже, чем Gemini 3.0, в задаче распознавания изображений, и чем другие современные LLM.

Это касается даже очень узкоспециализированных задач. Например, есть Mathpix, специализированный инструмент для обработки текста (превращает текст и формулы с изображений в LaTeX и ворд). Если сравнить качество его работы с Gemini 3.0, оно намного хуже. В случаях написания текста плохим почерком, или сканов старых книг, Mathpix допускает очень много ошибок, а Gemini 3.0 работает практически идеально.

Как заработать на LLM, перестав писать «правильные промпты»

master_program Jan 1 at 13:23

Главная проблема не в распознавании. Она в другом - так как таблицы разные все, сделаны по разным форматам, а еще при извлечении данных таблица может превратиться в две, или наоборот, две в одну, то непонятно, как сделать единое правило, которое позволяет определить, как именно заполнить ту или иную ячейку.

Человеку это понятно по пониманию контекста, а машина его не понимает.

Если бы документы были все +- одинаковые, то правила были бы достаточно простые и ошибок бы вообще не возникало.

Как заработать на LLM, перестав писать «правильные промпты»

master_program Jan 1 at 13:06

"Мне представляется, что из этих 1% ошибок (уверен, что их больше), о которых вы говорите, львиная доля порождается фундаментальной рандомностью нейросети и влиянием контекста на вывод. "

Как ни странно, вообще 0. То есть не было ни разу ошибок извлечения табличных данных из pdf. Все ошибки порождены неидеальностью скрипта.

Вы написали длинное сообщение об ошибках, которые у меня не появляются вообще. Промпт идеально работает. Я думаю, причина в многократной избыточности инструкций этого промпта.

Как заработать на LLM, перестав писать «правильные промпты»

master_program Jan 1 at 13:03

Можно попробовать Gemini как раз, у него длинный контекст. Или платный ChatGPT.

Джун наоборот или разоблачение главного мифа вайб-кодинга

master_program Jan 1 at 10:05

В МФТИ я как раз вычислительную математику преподаю. https://toomanydigits.online/ . Можете посмотреть мой сайт.

Как заработать на LLM, перестав писать «правильные промпты»

master_program Jan 1 at 10:00

Нет. Просто промпты пишу. Там 78 ячеек надо заполнить, а я за раз прошу от 1 до 4-5 дописать алгоритм заполнения и меняю строго этот участок кода.

Сначала сгружаю всю доступную информацию про эти ячейки и примеры таблиц, и что надо было заполнить и куда с них. Ллм присылает функцию. Затем тестирую, вижу в части случаев заполняет не то. Присылаю ему скрины из ворд файла и прошу переделать функцию, но так, чтобы больше ничего не сломалось (прикрепляю также примеры правильной работы). Он тогда дописывает дополнительных правил в функцию.

И так до тех пор, пока эти от 1 до 4-5 ячеек не станут правильно работать на всех моих примерах. Затем следующие. Так все 78 ячеек правильно заполняет.

А потом ещё от заказчика приходят ещё примеры, на которых не работает что-то. Снова дорабатываем. Если на каких-то прошлых примерах работать перестало как надо - тоже сообщаю в LLM, он переделывает код функции.

Как заработать на LLM, перестав писать «правильные промпты»

master_program Dec 31 2025 at 22:18

Ценность решения измеряется не красотой кода и безошибочностью, а количеством экономии человеко-часов специалистов в год.

Как заработать на LLM, перестав писать «правильные промпты»

master_program Dec 31 2025 at 13:56

Нужен выход в интернет с ВПН, чтобы запускать Gemini для первичного распознавания с промптом.
Скрипты собираются в готовое приложение, инструкция была
Есть инструкция, один человек всему научился, который со мной взаимодействовал. Можно легко быстро научить другого, но вроде как у них больше нет в этом потребности (достаточно одного). Все дополнительные вложения - затраты времени этого человека ( он собирал файлы, оформлял договоры, объяснял что и как нужно заполнять, контролировал качество работы) . Никаких подписок и дополнительных устройств не нужно.
Могу больше подробностей в личку. Напишите личное сообщение.

Царский путь к пониманию комплексных чисел. Часть I

master_program Dec 31 2025 at 10:33

Как действовал Муавр.

Уже из обычных формул сложения:

$\cos (\alpha+\beta)=\cos \alpha \cos \beta-\sin \alpha \sin \beta, \quad \sin (\alpha+\beta)=\sin \alpha \cos \beta+\cos \alpha \sin \beta$

следует тождество умножения:

$(\cos \alpha+i \sin \alpha)(\cos \beta+i \sin \beta)=\cos (\alpha+\beta)+i \sin (\alpha+\beta)$

Дальше методом математической индукции можно получить:

$(\cos \theta+i \sin \theta)^n=\cos (n \theta)+i \sin (n \theta) .$

Именно это мы сейчас называем формулой Муавра (для целых ).

Царский путь к пониманию комплексных чисел. Часть I

master_program Dec 31 2025 at 10:27

Вы своими комментариями подсказали хорошую идею, как начать вторую статью. Можно начать с разбора, а как люди вообще решали эту проблему. Собственно, Муавр первым придумал явную формулу.

А в геометрической интерпретации решение очевидно.

Царский путь к пониманию комплексных чисел. Часть I

master_program Dec 31 2025 at 10:02

Вообще в поворотах есть прямой смысл, связанный как раз с исходной задачей, из которой мнимые числа и появились. Как извлечь кубический корень из комплексного числа? Это ведь нужно в формуле Кардано.

Использовали метод неопределенных коэффициентов, а тут есть прямой способ - нужно осуществить трисекцию угла.

Как заработать на LLM, перестав писать «правильные промпты»

master_program Dec 31 2025 at 06:58

Они нужны для начального этапа подбора оборудования.

Больших подробностей я не знаю, так как я не работаю в этой фирме, меня просто наняли, чтобы я помог автоматизировать ручной труд. И все параметры задачи мне объяснили в объеме, достаточном для выполнения задания, а не больше.

Мне за эту шайтан-машину заплатили 100к рублей, а у них за полгода человеко-часы, требуемые для обработки подобных паспортов, ощутимо дороже обходятся. Благодаря Gemini я ее довольно быстро сделал, так что это и мне было весьма выгодно.

А сейчас наняли делать еще один комплекс программ автоматизации их рутины, но там нужны нормальные скрипты, а не шайтан машина: у них просто множество вычислений и обработки данных с датчиков делается в эксель-файлах вручную, нужно сделать несколько скриптов, которые весь этот ручной труд автоматизируют.

Я могу делать и то, и другое, если будет что-то такое нужно - можете обращаться.

Как заработать на LLM, перестав писать «правильные промпты»

master_program Dec 31 2025 at 06:01

На pdf один из возможных вариантов, как они делают эти паспорта. Таблицы могут быть по-другому устроены и иначе расположены. Но, конечно, сильно помогает, что надписи одни и те же используются, технические термины, обозначения.

Как заработать на LLM, перестав писать «правильные промпты»

master_program Dec 31 2025 at 05:58

Не получится, единых стандартов нет, а заказчики все очень разные.

При извлечении таблиц куча сложностей: нужное число может быть под нужным описанием, справа или даже в той же клетке. А в таблице посреди всего этого может стоять логотип, график или рисунок, что тоже затрудняет.

Промпт по извлечению таблиц добился того. чтобы разные данные, написанной в одной и той же клетке таблицы pdf (то есть число и его описание, как правило), попадали все-таки в разные клетки таблицы.

Далее сложности: как правильно во всех случаях считывать именно нужное число, ведь там могут быть другие числа рядом, а еще может перенести в соседнюю таблицу. И для этого как раз LLM придумывает огромную кучу эмпирических правил, опираясь на обратную связь и примеры того, как его правила работают в конкретных случаях.

В этих правилах также используются известные данные о том, в каком диапазоне могут быть числа, какие бывают марки того или иного оборудования и т.п., это всё скармливалось в LLM.

Или, например, оказалось, что во всех образцах паспортов данные не разрываются на странице, то есть если есть данные для чего-то (например, вентилятора), то они все на одной странице находятся, исключений из этого не было. Это позволило использовать информацию о том, с какой страницы извлечена таблица, в этих правилах.

Царский путь к пониманию комплексных чисел. Часть I

master_program Dec 31 2025 at 05:54

В частных случаях получал. В общем случае нет.

Бомбелли работал уже более системно, он кубические корни из комплексных чисел вычислял. Например, тут описано https://www.ms.uky.edu/~sohum/ma330/files/eqns_4.pdf .

Царский путь к пониманию комплексных чисел. Часть I

master_program Dec 31 2025 at 04:27

Вторую часть сложнее всего написать. Остальное проще.

Царский путь к пониманию комплексных чисел. Часть I

master_program Dec 31 2025 at 04:26

Ваш собеседник предлагает вводить через алгебраическую аксиому (как расширение поля), а вы предлагаете сразу вводить поворот. Проблема первого способа в том, что так ничего непонятно, проблема второго в том, что поворот как будто ниоткуда взялся. Я сам третий подход собираюсь показать: комплексные числа появляются в геометрической алгебре.

3 4 ...

36 37

Information

Specialization