понятно, думаю стоит в статье акцентировать внимание на этом:
Датасет должен отражать то, с чем модель будет работать на практике: форматы запросов, стиль текста, тематика, распределения токенов, длины ввода/вывода. Если калибровочный датасет сильно отличается от боевого сценария — то статистика активаций может не соответствовать, и ошибка квантирования возрастёт.
Например: если модель будет работать с диалогами на русском, но ты калибруешь на энциклопедических статьях по английскому языку — получишь “неоптимальные” параметры.
как мне кажется, сейчас и проявится алчность и лицемерие человечества. лабы делают проприетарных чатботов и всеми силами пытаются повысить количество юзеров по нескольким причинам:
привлечь больше инвестиций
собирать больше данных для продажи рекламодателям
быть рупором "истины"
что скорее всего нас ждёт: несколько топовых лаб с чат ботами, типа openai, antropic, perplexity, grok, добавьте свои. У каждой будут свои инвесторы и рекламодатели, информация о которых будет невзначай фигурировать в ответах. некоторые такие лабы будут под правительством, которые будут контролировать данные для обучения, чтоб там было только то, что им надо.
почему алчность и лицемерие? ceo лаб говорят о том что ИИ принесёт пользу всему человечеству, НО с темпами роста кластеров под обучении ИИ мы не доживём до этого, а нагреем планету так, что точка невозврата будет пройдена.
есть только один хороший сценарий - если мы быстро сделаем ИИ, который поможет решить экологическую проблему. иначе привет природные катаклизмы.
а я в своём комментарии вообще не касался тему квантового ластика и эксперимента с отложенным выбором. это совсем другая тема для разговора и куда более интересная)
мой поинт лишь был в том, что большинство статей и видео про двухщелевой эксперимент имеют одну и ту же непонятную мне ошибку, говоря что свет, проходя через одну щель, оставит на экране одну полоску. вот и всё.
представь что в бесконечном пространстве из точки вылетел фотон, его волновая функция распространяется во всех направления, то есть имеет сферическую плоскость. Если ты на каком-то расстоянии поставишь кучу детекторов (например в радиусе 1 метра от источника), то в тот момент когда одни из детекторов сработает, это будет значить, что фотон именно тут, и дальнейшая эволюция волновой функции будет идти только из этой точки, все другие возможные пути (пути от других детекторов) не будут учитываться волновой функцией. таким образом фотон всё ещё не превратился в частицу, а распространяется как волна, но эта волна локализовалась на месте детектора, который засёк фотон.
а как же явление дифракции? согласно ей, если длина волны меньше размера щели, то каждая точка в щели становится источником вторичных волн, которые интерферируют сами с собой. в итоге на экране будет не полоска, а несколько полосок, где центральная самая яркая, а другие менее яркие затухают при отдалении от центра. (см. рисунок)
я к тому, что квантовые объекты всегда ведут себя как волна пока не провзаимодействюут с макро объектом. то есть, когда мы запускаем одиночный квантовый объект в сторону двух щелей с детектором, то после детектора тоже распространяется волна до самого экрана, где мы уже увидим его точно место попадания. разница лишь в том что после щелей с детектором волна распространяется по более простым правилам - дифракция на одной щели, вместо интерференции на двух щелях, когда детектора нет.
Как только в щелях появляются детекторы (пресловутый эффект наблюдателя) и вы начинаете измерять траекторию частиц, то интерференция исчезает, и остаются просто две полоски, совсем не то, что мы бы хотели видеть.
ёмаё, да сколько можно то. никогда не будет в этом эксперименте 2 полоски. будет дифракционная картина. я понимаю что все так пишут-рассказывают ради упрощения и усиления "вау" эффекта глубоко не разбирающегося читателя, но мне кажется такое упрощение не уместно. ведь по сути, волновая функция не коллапсирует, когда добавляется детектор. она просто локализуется в одной из щелей. то есть после детектора тоже распространяется волна, только она уже идёт от одной из щелей. таким образом, детектор - это как чекпоинт для волной функции, который обрезает часть возможных путей распространения волной функции.
понятно, думаю стоит в статье акцентировать внимание на этом:
Датасет должен отражать то, с чем модель будет работать на практике: форматы запросов, стиль текста, тематика, распределения токенов, длины ввода/вывода. Если калибровочный датасет сильно отличается от боевого сценария — то статистика активаций может не соответствовать, и ошибка квантирования возрастёт.
Например: если модель будет работать с диалогами на русском, но ты калибруешь на энциклопедических статьях по английскому языку — получишь “неоптимальные” параметры.
спасибо за статью!
А есть ли разница какой датасет для калибровки использовать? если да, то почему именно этот датасет был выбран?
как мне кажется, сейчас и проявится алчность и лицемерие человечества. лабы делают проприетарных чатботов и всеми силами пытаются повысить количество юзеров по нескольким причинам:
привлечь больше инвестиций
собирать больше данных для продажи рекламодателям
быть рупором "истины"
что скорее всего нас ждёт: несколько топовых лаб с чат ботами, типа openai, antropic, perplexity, grok, добавьте свои. У каждой будут свои инвесторы и рекламодатели, информация о которых будет невзначай фигурировать в ответах. некоторые такие лабы будут под правительством, которые будут контролировать данные для обучения, чтоб там было только то, что им надо.
почему алчность и лицемерие? ceo лаб говорят о том что ИИ принесёт пользу всему человечеству, НО с темпами роста кластеров под обучении ИИ мы не доживём до этого, а нагреем планету так, что точка невозврата будет пройдена.
есть только один хороший сценарий - если мы быстро сделаем ИИ, который поможет решить экологическую проблему. иначе привет природные катаклизмы.
а главная проблема - это жажда наживы
а я в своём комментарии вообще не касался тему квантового ластика и эксперимента с отложенным выбором. это совсем другая тема для разговора и куда более интересная)
мой поинт лишь был в том, что большинство статей и видео про двухщелевой эксперимент имеют одну и ту же непонятную мне ошибку, говоря что свет, проходя через одну щель, оставит на экране одну полоску. вот и всё.
потому что свет может распространятся в стекле.
представь что в бесконечном пространстве из точки вылетел фотон, его волновая функция распространяется во всех направления, то есть имеет сферическую плоскость. Если ты на каком-то расстоянии поставишь кучу детекторов (например в радиусе 1 метра от источника), то в тот момент когда одни из детекторов сработает, это будет значить, что фотон именно тут, и дальнейшая эволюция волновой функции будет идти только из этой точки, все другие возможные пути (пути от других детекторов) не будут учитываться волновой функцией. таким образом фотон всё ещё не превратился в частицу, а распространяется как волна, но эта волна локализовалась на месте детектора, который засёк фотон.
а как же явление дифракции? согласно ей, если длина волны меньше размера щели, то каждая точка в щели становится источником вторичных волн, которые интерферируют сами с собой. в итоге на экране будет не полоска, а несколько полосок, где центральная самая яркая, а другие менее яркие затухают при отдалении от центра. (см. рисунок)
я к тому, что квантовые объекты всегда ведут себя как волна пока не провзаимодействюут с макро объектом. то есть, когда мы запускаем одиночный квантовый объект в сторону двух щелей с детектором, то после детектора тоже распространяется волна до самого экрана, где мы уже увидим его точно место попадания. разница лишь в том что после щелей с детектором волна распространяется по более простым правилам - дифракция на одной щели, вместо интерференции на двух щелях, когда детектора нет.
ёмаё, да сколько можно то. никогда не будет в этом эксперименте 2 полоски. будет дифракционная картина. я понимаю что все так пишут-рассказывают ради упрощения и усиления "вау" эффекта глубоко не разбирающегося читателя, но мне кажется такое упрощение не уместно. ведь по сути, волновая функция не коллапсирует, когда добавляется детектор. она просто локализуется в одной из щелей. то есть после детектора тоже распространяется волна, только она уже идёт от одной из щелей. таким образом, детектор - это как чекпоинт для волной функции, который обрезает часть возможных путей распространения волной функции.