Обновить
0
0

Пользователь

Отправить сообщение

понятно, думаю стоит в статье акцентировать внимание на этом:

  • Датасет должен отражать то, с чем модель будет работать на практике: форматы запросов, стиль текста, тематика, распределения токенов, длины ввода/вывода. Если калибровочный датасет сильно отличается от боевого сценария — то статистика активаций может не соответствовать, и ошибка квантирования возрастёт.

  • Например: если модель будет работать с диалогами на русском, но ты калибруешь на энциклопедических статьях по английскому языку — получишь “неоптимальные” параметры.

спасибо за статью!
А есть ли разница какой датасет для калибровки использовать? если да, то почему именно этот датасет был выбран?

как мне кажется, сейчас и проявится алчность и лицемерие человечества. лабы делают проприетарных чатботов и всеми силами пытаются повысить количество юзеров по нескольким причинам:

  • привлечь больше инвестиций

  • собирать больше данных для продажи рекламодателям

  • быть рупором "истины"

что скорее всего нас ждёт: несколько топовых лаб с чат ботами, типа openai, antropic, perplexity, grok, добавьте свои. У каждой будут свои инвесторы и рекламодатели, информация о которых будет невзначай фигурировать в ответах. некоторые такие лабы будут под правительством, которые будут контролировать данные для обучения, чтоб там было только то, что им надо.

почему алчность и лицемерие? ceo лаб говорят о том что ИИ принесёт пользу всему человечеству, НО с темпами роста кластеров под обучении ИИ мы не доживём до этого, а нагреем планету так, что точка невозврата будет пройдена.

есть только один хороший сценарий - если мы быстро сделаем ИИ, который поможет решить экологическую проблему. иначе привет природные катаклизмы.

а главная проблема - это жажда наживы

а я в своём комментарии вообще не касался тему квантового ластика и эксперимента с отложенным выбором. это совсем другая тема для разговора и куда более интересная)

мой поинт лишь был в том, что большинство статей и видео про двухщелевой эксперимент имеют одну и ту же непонятную мне ошибку, говоря что свет, проходя через одну щель, оставит на экране одну полоску. вот и всё.

  1. потому что свет может распространятся в стекле.

  2. представь что в бесконечном пространстве из точки вылетел фотон, его волновая функция распространяется во всех направления, то есть имеет сферическую плоскость. Если ты на каком-то расстоянии поставишь кучу детекторов (например в радиусе 1 метра от источника), то в тот момент когда одни из детекторов сработает, это будет значить, что фотон именно тут, и дальнейшая эволюция волновой функции будет идти только из этой точки, все другие возможные пути (пути от других детекторов) не будут учитываться волновой функцией. таким образом фотон всё ещё не превратился в частицу, а распространяется как волна, но эта волна локализовалась на месте детектора, который засёк фотон.

а как же явление дифракции? согласно ей, если длина волны меньше размера щели, то каждая точка в щели становится источником вторичных волн, которые интерферируют сами с собой. в итоге на экране будет не полоска, а несколько полосок, где центральная самая яркая, а другие менее яркие затухают при отдалении от центра. (см. рисунок)

я к тому, что квантовые объекты всегда ведут себя как волна пока не провзаимодействюут с макро объектом. то есть, когда мы запускаем одиночный квантовый объект в сторону двух щелей с детектором, то после детектора тоже распространяется волна до самого экрана, где мы уже увидим его точно место попадания. разница лишь в том что после щелей с детектором волна распространяется по более простым правилам - дифракция на одной щели, вместо интерференции на двух щелях, когда детектора нет.

Как только в щелях появляются детекторы (пресловутый эффект наблюдателя) и вы начинаете измерять траекторию частиц, то интерференция исчезает, и остаются просто две полоски, совсем не то, что мы бы хотели видеть.

ёмаё, да сколько можно то. никогда не будет в этом эксперименте 2 полоски. будет дифракционная картина. я понимаю что все так пишут-рассказывают ради упрощения и усиления "вау" эффекта глубоко не разбирающегося читателя, но мне кажется такое упрощение не уместно. ведь по сути, волновая функция не коллапсирует, когда добавляется детектор. она просто локализуется в одной из щелей. то есть после детектора тоже распространяется волна, только она уже идёт от одной из щелей. таким образом, детектор - это как чекпоинт для волной функции, который обрезает часть возможных путей распространения волной функции.

Информация

В рейтинге
Не участвует
Зарегистрирован
Активность

Специализация

Бэкенд разработчик, ML разработчик