А) Модель вообще ответила или аккуратно ушла от ответа, отказалась или налила «воды»
Б) Ответ действительно про тот же вопрос или модель сместилась в сторону и рассуждает уже о другом?
В) Ответ устойчив?
Главное заблуждение, что "модель ответила". Вспоминаем, что модель предсказывает следующий токен. И, конкретно в этом приере, вся проблема сокрыта в том, какую задачу ей поставили. А точнее в том, что задачу ей, по факту, не поставили.
«прочитай документ от начала и до конца, найди логические дыры, проверь корректность отображения формул и переменных»
Эта задача изначально составлена не как «делегирование работы» (что сделать, как читать, как проверять), а как «делегирование ответственности» (хочу красиво). Ты ждешь от ЛЛМ не исполнительности (что она, в целом, умеет), а разумности и внимательности, а этих свойств в ней не только не заложено, даже все попытки провайдеров надрессировать модели на эти качества постоянно терпят фиаско.
Может ли ЛЛМ в действтительности "вычитать и выловить ошибки"? Да, но только если ты предварительно ей классифицируешь, какие ошибки ищешь и детально опишешь, как их выловить, а потом еще не забудешь напоминать правила после каждого проверенно подраздела документа и внимательно будешь вычитывать все, что она тебе лишнего пришлет.
Например, вот прям сейчас у меня ЛЛМ вычитывает и находит несоответствия в онтологии. И вот такой промпт у нее на входе:
По каждому блоку (определение / аксиома / гипотеза / вывод) — 4 параметра:
Правильно ли выбран тип записи?
Правильно ли сформулирована запись?
Правильно ли указаны ссылки?
Полнота ссылок — все ли указаны, нет ли лишних?
Общая рамка:
Последовательность внутри главы строгая: определения → аксиомы → гипотезы → выводы → резюме.
Определения не ссылаются на аксиомы/гипотезы/выводы текущей главы — самостоятельны по смыслу.
Аксиомы — фундаментальные точки опоры, каждая обоснована во внешнем домене и не требует доказательств в текущей работе (физика, биология, теория систем и т.д.).
Гипотезы — наблюдения текущей сборки, незавершённые по своей природе, могут быть пересмотрены.
Выводы — структурные узлы; не расширяют смысл предположениями, только перемножают введённое, опираются на аксиомы / гипотезы / прошлые выводы.
Ссылки только на введённое выше по тексту. Никаких forward-ссылок ни внутри главы, ни на будущие главы.
Порядок работы:
Прочитать главу целиком.
Пройти по каждому блоку, заполнить таблицу с оценками корректности. Отметить проблемы;
Структурные нарушения (forward-ссылки, нарушение порядка) — маркировать как критические.
P.S. Бородатый анекдот как раз в тему:
— Вот за это я и не люблю кошек. — Ты просто не умеешь их готовить!
— Пап, а зачем AGI заставляет нас бросать кирпичи в лужи? — Понимаешь, сынок, у него слишком точные расчеты. Чтобы запустить генератор по-настоящему случайных чисел, ему нужен наш уникальный талант делать фигню, не поддающуюся никаким законам логики.
— Пап, а AGI поможет мне делать уроки? — Конечно. Он напишет тебе идеальное эссе, а потом сам же его проверит, поставит тебе «два» за использование ИИ и напишет жалобную записку твоей маме. Ты даже не поймешь, в какой момент стал лишним в этой цепочке.
— Папа, а как мы поймем, что AGI уже здесь? — Очень просто, сын. Когда ты спросишь у чат-бота «Что такое AGI?», а он вместо статьи на 40 страниц просто глубоко вздохнет в динамик, скажет «Ой, отвали, я в депрессии» и пойдет листать мемы — значит, свершилось. Он стал как мы.
— Мы уволили 80% сотрудников, заменили их нейросетями и сэкономили кучу денег! — Отлично! А кто теперь будет делать наш продукт? — Какой продукт? ИИ проанализировал наши бизнес-процессы и пришел к выводу, что производство нашего товара не имеет никакого смысла. Теперь мы просто продаем другим компаниям консалтинг о том, как им тоже внедрить себе ИИ.
— Наша корпорация полностью передала стратегическое планирование ИИ! — И как результаты? — Потрясающе! Раньше мы теряли миллионы из-за банальной человеческой глупости. А теперь мы сжигаем миллиарды с безупречной математической точностью, идеальными презентациями и со скоростью света. Инвесторы просто в восторге от масштабов катастрофы!
У меня настойчивая ассоциация с джуном, который взял учебник и пошел программировать в проде. Вот и наши "управленцы" взяли книжки по стратегии войны и пошли их отрабатывать...
Этот facepalm, когда джун приходит через пару месяцев и говорит "ну ведь я сделал все как написано, почему ничего не работает?".. Вот и наши... "мы же все сделали как просили, а почему все сломалось?"...
Умение "строить" - это совсем другой навык, он отличается от "умения исполнять инструкции"... Он требует пространственного мышления и траты сил на анализ потенциальных дисбалансов... Критического мышления... Адаптивности к среде и умения слушать обратную связь...
И все это настолько чуждо нашив вождям и их вождизму, что.. (дальше каждый может продолжить мысль на свое усмотрение)
это похоже на азарт "кто первый обуздает этот инструмент". Потому и интересно пытаться его победить. Так как мозг понимает - он гораздо быстрее способен писать код. И путь он сейчас плохо контролируем... Но азарт "победить природу" есть. Если выйдет, то можно будет писать в десятки и сотни раз быстрее. А так как процесс еще не освоен, потому и идет в голове ломка. Уж очень много знаний и привычек уже переосмыслено, вроде все еще "надежность в ручном труде", но стремление к эффективности говорит "разбирайся в новом, за ним будущее, и его нельзя пропустить, наверстывать будет сложнее, так как это реально совсем другой навык"
Процессы "законотворчества" развиты и прогрессируют на порядок быстрее и лучше, чем процессы "ИИ-созидательства". И эти навыки настолько убежали вперед, что остальные процессы просто закопаны и замурованы законами в клетки...
Прочитай мой комментарий внимательнее - я же сказал, что статья интересная. Я в целом считаю подход к оформлению текста у ИИ более комфортным, особенно за его прогнозируемую последовательность мысли и за его хорошую структуру. В нем пусть и есть проблемы с тем, что он слишком разжеван, но это решается небольшой вычиткой.
тут я обращал внимание на совсем другое... Статья описывает "как детектировать ИИ-контент". И по ходу всего чтения я невольно примерял эти же критерии к тексту самой статьи... И все так классно подтверждалось... Что даже закралось сомнение, что это ИИ-контент о том, как нужно детектировать ИИ-контент... Не уроборос, конечно, но фигура "лента мебиуса" на ум точно приходит.
P.S. Если я задел Ваши «нотки души» своим комментарием, прощу прощения. Не думал, что на него можно столько несдержанно отреагировать. Уж я постарался, вроде как, написать его достаточно отстраненно от прямой критики ии-контента.
P.P.S. Я бы с радостью читал больше ИИ-оформленных статей, чем то, что иногда пишут люди... Где ни грамматики, ни смысла, а лишь куча наляпистых картинок и взрыв мозга. Как хорошо, что чтение тут не "обязаловка"
Мне кажется... или это перевод при помощи ИИ? Всю статью не покидало чувство, что все критерии в ней же и воспроизведены... Статья интересная, и все же...
Ну то есть я понимаю, что статья большая и без ИИ ее не перевести, да и не простая. Но блин, когда читаешь текст "чисто ии" и в нем описано, как отличить текст ИИ от текста человека... я чувствовал внутренний то ли диссонанс, то ли кринж. Хз как это называется -))
Мда... Ну так хабр - это не посиделки квантовых физиков, вроде как.
Если хочешь быть услышанным — потрудись заинтересовать и написать простым языком
Когда ты пишешь текст сложно, даже люди, которые знакомы с квантовой физикой, прочитают пару абзацев и закроют материал. Это когнитивно сложно, переваривать чужой лексикон
Если хочешь быть понятым — потрудись выстроить причинно-следственную связь и обосновать
Люди, читающие твой пост, вообще не обладают всеми твоими мыслями и умозаключениями. Нетерпение в желании «поделиться инсайтом с миром» приводит только к отторжению твоих идей. (а пока будешь обосновывать, окажется, что половина идей натянута и не выдерживает даже базовой критики)
Заметь, я вообще не опровергал твоих идей и гипотез. Я и сам разбираюсь в природе сознания «на досуге». И поверь, это делает любой +- пыткий ум в свободное время. ЛЛМ дают много пищи для ума.
НО! нужно понимать, что ЛЛМ дают сейчас кратное ускорение в выработке идей. Но это не значит, что все то, что ты с ЛЛМ обсудил, можно вываливать на публику. Хочешь аудиторию квантовых физиков? Пости материалы на английском на сайт arXiv, только там нужно реально провести исследование и оформить научный pre-print. А если уж хочешь писать для хабра, так адаптируй материал и формулируй все выкладки, помогая читателю понять мысль.
Задай той же ЛЛМ вопрос - а как мне лучше донести мои мысли до общества? Как подготовить материал? На какие главы его разбить? Какой шанс, что его примут? Как сделать вероятность прочтения выше? и т.п. (на адаптацию идеи может уйти в 10 раз больше времени, чем на ее первичное формулирование, а уж на пост-проверку и верификацию еще раза в три больше времени)
Ну или будь готов к тому, что получить 100-500 дизлайков и не обижайся -)
А чего заминусовали коммент? Это защитники Трампа? -))
я же говорю - раз 20 пробовал, чтобы найти хотя бы 2 варианта -) причем направления тем я ей подсказывал.
Научить нейронку шутить - та еще задачка. Но все анекдоты выше мне составила она.
Не хочется вот так разочаровывать... И все же
Главное заблуждение, что "модель ответила". Вспоминаем, что модель предсказывает следующий токен. И, конкретно в этом приере, вся проблема сокрыта в том, какую задачу ей поставили. А точнее в том, что задачу ей, по факту, не поставили.
Эта задача изначально составлена не как «делегирование работы» (что сделать, как читать, как проверять), а как «делегирование ответственности» (хочу красиво). Ты ждешь от ЛЛМ не исполнительности (что она, в целом, умеет), а разумности и внимательности, а этих свойств в ней не только не заложено, даже все попытки провайдеров надрессировать модели на эти качества постоянно терпят фиаско.
Может ли ЛЛМ в действтительности "вычитать и выловить ошибки"? Да, но только если ты предварительно ей классифицируешь, какие ошибки ищешь и детально опишешь, как их выловить, а потом еще не забудешь напоминать правила после каждого проверенно подраздела документа и внимательно будешь вычитывать все, что она тебе лишнего пришлет.
Например, вот прям сейчас у меня ЛЛМ вычитывает и находит несоответствия в онтологии. И вот такой промпт у нее на входе:
P.S. Бородатый анекдот как раз в тему:
— Вот за это я и не люблю кошек.
— Ты просто не умеешь их готовить!
— Пап, а зачем AGI заставляет нас бросать кирпичи в лужи?
— Понимаешь, сынок, у него слишком точные расчеты. Чтобы запустить генератор по-настоящему случайных чисел, ему нужен наш уникальный талант делать фигню, не поддающуюся никаким законам логики.
— Пап, а AGI поможет мне делать уроки?
— Конечно. Он напишет тебе идеальное эссе, а потом сам же его проверит, поставит тебе «два» за использование ИИ и напишет жалобную записку твоей маме. Ты даже не поймешь, в какой момент стал лишним в этой цепочке.
— Папа, а как мы поймем, что AGI уже здесь?
— Очень просто, сын. Когда ты спросишь у чат-бота «Что такое AGI?», а он вместо статьи на 40 страниц просто глубоко вздохнет в динамик, скажет «Ой, отвали, я в депрессии» и пойдет листать мемы — значит, свершилось. Он стал как мы.
— Мы уволили 80% сотрудников, заменили их нейросетями и сэкономили кучу денег!
— Отлично! А кто теперь будет делать наш продукт?
— Какой продукт? ИИ проанализировал наши бизнес-процессы и пришел к выводу, что производство нашего товара не имеет никакого смысла. Теперь мы просто продаем другим компаниям консалтинг о том, как им тоже внедрить себе ИИ.
— Наша корпорация полностью передала стратегическое планирование ИИ!
— И как результаты?
— Потрясающе! Раньше мы теряли миллионы из-за банальной человеческой глупости. А теперь мы сжигаем миллиарды с безупречной математической точностью, идеальными презентациями и со скоростью света. Инвесторы просто в восторге от масштабов катастрофы!
В эту ветку предлагаю скидывать интересные анекдоты
У тебя дубль. ты дважды один и тот же пост опубликовал
У меня настойчивая ассоциация с джуном, который взял учебник и пошел программировать в проде. Вот и наши "управленцы" взяли книжки по стратегии войны и пошли их отрабатывать...
Этот facepalm, когда джун приходит через пару месяцев и говорит "ну ведь я сделал все как написано, почему ничего не работает?".. Вот и наши... "мы же все сделали как просили, а почему все сломалось?"...
Умение "строить" - это совсем другой навык, он отличается от "умения исполнять инструкции"... Он требует пространственного мышления и траты сил на анализ потенциальных дисбалансов... Критического мышления... Адаптивности к среде и умения слушать обратную связь...
И все это настолько чуждо нашив вождям и их вождизму, что.. (дальше каждый может продолжить мысль на свое усмотрение)
это похоже на азарт "кто первый обуздает этот инструмент". Потому и интересно пытаться его победить. Так как мозг понимает - он гораздо быстрее способен писать код. И путь он сейчас плохо контролируем... Но азарт "победить природу" есть. Если выйдет, то можно будет писать в десятки и сотни раз быстрее. А так как процесс еще не освоен, потому и идет в голове ломка. Уж очень много знаний и привычек уже переосмыслено, вроде все еще "надежность в ручном труде", но стремление к эффективности говорит "разбирайся в новом, за ним будущее, и его нельзя пропустить, наверстывать будет сложнее, так как это реально совсем другой навык"
Дуршлаг — «дырявый by design» =)
Процессы "законотворчества" развиты и прогрессируют на порядок быстрее и лучше, чем процессы "ИИ-созидательства". И эти навыки настолько убежали вперед, что остальные процессы просто закопаны и замурованы законами в клетки...
для меня это звучит не как точка роста проекта, а скорее как приговор надежности / устойчивости. Это как-то слишком далекое будущее
Длинные, слишком законченные предложения. Это не "резануло", это "не отпускало ощущение".
Если это так, то это еще раз доказывает... Что грамотный человек пишет так же, как и ИИ. Или ИИ пишет так же, как и грамотный человек -)
Прочитай мой комментарий внимательнее - я же сказал, что статья интересная. Я в целом считаю подход к оформлению текста у ИИ более комфортным, особенно за его прогнозируемую последовательность мысли и за его хорошую структуру. В нем пусть и есть проблемы с тем, что он слишком разжеван, но это решается небольшой вычиткой.
тут я обращал внимание на совсем другое... Статья описывает "как детектировать ИИ-контент". И по ходу всего чтения я невольно примерял эти же критерии к тексту самой статьи... И все так классно подтверждалось... Что даже закралось сомнение, что это ИИ-контент о том, как нужно детектировать ИИ-контент... Не уроборос, конечно, но фигура "лента мебиуса" на ум точно приходит.
P.S. Если я задел Ваши «нотки души» своим комментарием, прощу прощения. Не думал, что на него можно столько несдержанно отреагировать. Уж я постарался, вроде как, написать его достаточно отстраненно от прямой критики ии-контента.
P.P.S. Я бы с радостью читал больше ИИ-оформленных статей, чем то, что иногда пишут люди... Где ни грамматики, ни смысла, а лишь куча наляпистых картинок и взрыв мозга. Как хорошо, что чтение тут не "обязаловка"
Мне кажется... или это перевод при помощи ИИ? Всю статью не покидало чувство, что все критерии в ней же и воспроизведены... Статья интересная, и все же...
Ну то есть я понимаю, что статья большая и без ИИ ее не перевести, да и не простая. Но блин, когда читаешь текст "чисто ии" и в нем описано, как отличить текст ИИ от текста человека... я чувствовал внутренний то ли диссонанс, то ли кринж. Хз как это называется -))
я в своих статьях как раз научился вручную ставить и кавычки скобочками и длинные тире на маке (на винде не скажу, давно не сидел в ней)
Option+"-" (длинное тире –) или Option+Shift+"-" (супер-пупер длинное тире —)
кавычки скобочками - тоже самое но с "=" («»)
а вот букву е: ставить не научился, так что вместо них пишу е.
P.S. не в защиту автора, просто для меня этот навык тоже новый, вот и решил поделиться, раз уж тут спрашивают.
Мда... Ну так хабр - это не посиделки квантовых физиков, вроде как.
Когда ты пишешь текст сложно, даже люди, которые знакомы с квантовой физикой, прочитают пару абзацев и закроют материал. Это когнитивно сложно, переваривать чужой лексикон
Люди, читающие твой пост, вообще не обладают всеми твоими мыслями и умозаключениями. Нетерпение в желании «поделиться инсайтом с миром» приводит только к отторжению твоих идей. (а пока будешь обосновывать, окажется, что половина идей натянута и не выдерживает даже базовой критики)
Заметь, я вообще не опровергал твоих идей и гипотез. Я и сам разбираюсь в природе сознания «на досуге». И поверь, это делает любой +- пыткий ум в свободное время. ЛЛМ дают много пищи для ума.
НО! нужно понимать, что ЛЛМ дают сейчас кратное ускорение в выработке идей. Но это не значит, что все то, что ты с ЛЛМ обсудил, можно вываливать на публику. Хочешь аудиторию квантовых физиков? Пости материалы на английском на сайт arXiv, только там нужно реально провести исследование и оформить научный pre-print. А если уж хочешь писать для хабра, так адаптируй материал и формулируй все выкладки, помогая читателю понять мысль.
Задай той же ЛЛМ вопрос - а как мне лучше донести мои мысли до общества? Как подготовить материал? На какие главы его разбить? Какой шанс, что его примут? Как сделать вероятность прочтения выше? и т.п. (на адаптацию идеи может уйти в 10 раз больше времени, чем на ее первичное формулирование, а уж на пост-проверку и верификацию еще раза в три больше времени)
Ну или будь готов к тому, что получить 100-500 дизлайков и не обижайся -)