Информация
- В рейтинге
- 342-й
- Откуда
- Москва, Москва и Московская обл., Россия
- Дата рождения
- Зарегистрирован
- Активность
Специализация
Фулстек разработчик
Старший
От 150 000 ₽
Python
JavaScript
Linux
Математическое моделирование
Web
Vue.js
Flask
Git
Docker
PHP
UPD. Провел дополнительные исследования для уточнения поправки к S_T за счет влияния редких событий. Оказывается, шансы выбросить аномально большое среднее на длинной серии существуют, хотя и малы. То есть я было неправ ранее насчет того, что 32 - это совсем уж невероятно.
Прочитав ваш комментарий и подумав про единичное событие ещё немного, я пришел к выводу, что формула для ограничения времени у меня неправильная и нуждается в добавке, и даже эмпирически вывел эту добавку (добавив в статью как UPD). Я предлагаю добавить к S_T число R_T от 1 до 2, которое отразит некоторую медианную удачу толпы игроков. Это более честное ограничение времени, так как в ситуации, когда у вас ровно одна игра, получается, что S_T = R_T и вы вполне можете попытать удачи со ставкой S=2, оставаясь в рамках допустимого риска, даже если не считаете себя настолько везучим, что бы с одной попытки выбросить пять орлов подряд. При S=2 игра честная с точки зрения матожидания, если вы учитываете шансы до 4 орлов. Интересно, что шанс на 4 орлов составляет 1/16 = 6.25% - вполне допустимый в бытовой жизни шанс, как раз превышающий 5% психологический порог критической удачи.
Нет, не совсем.
Задача двух кнопок эквивалентна задаче, где вам нужно поставить огромную, для вас, сумму ради шанса выиграть кратно большую.
В этом смысле, вы не будете второй раз жать кнопку в случае проигрыша, потому что у вас уже более не будет денег.
То, что событие единично здесь сказывается, но из-за довольно большого шанса в 50% сказывается не так уж значительно. Возвращаясь к моей модели, играть при S> S_T не прямое самоубийство, просто это сильно повышает риск. Я сейчас подумал, что нужно ввести туда аддитивный коэффициент R_T<5, который бы позволил рисковым парням играть при S=S_T + R_T и рассчитать статистический диапазон риска для R_T. Иначе получится, что играть в одну игру не выгодно при любом положительном S, хотя это очевидно выгодно при S=1 и вроде бы имеет равновесные риски при S=2.
2^41? Мое уважение.
Когда я публиковал код из jupyter notebook, я это делал не сколько для чтения непосредственно кода, сколько для его проверки на вашей стороне при наличии такого желания. Для этого коду лучше быть быстрым, то есть немного магическим, с чанками и логарифмическими операциями. Статья достаточно сильно описывает логику происходящего текстом и формулами, что бы разобраться в происходящем вообще без анализа кода.
А вообще эта новая фича хабра sourcecraft достойно справляется с задачей объяснения кода.
Хехе, it's magic.
Надеюсь, мой комментарий ниже про гистограмму убеждает в том, что это *работает*.
Технически,
B[offset:offset + size] = -np.log2(rng.random(size))осуществляет следующую цепочку операций: генерацию случайного числа float64 из равномерного распределения [0;1], взятие от этого логарифма и приведение этого логарифма к целому uint8 (с минусом) через отбрасывание дробной части. Это эквивалентно честной игре Бернулли, но гораздо быстрее. Ещё это эквивалентно тому, что бы взять равномерно распределенный float64 из [0;1], оторвать от его записи экспоненциальную часть и сконвертировать её в uint8. Причем так было бы даже ещё быстрее, но в python я не смог быстро придумать, как эту побитовую операцию грамотно осуществить.Мой оптимизированный код для вычисления B может сбивать с толку, но он дает корректную гистограмму B. Вот какое распределение я получаю :
То есть, с хорошей точностью, у меня половина - нули, четверть - единицы, восьмая часть - двойки и так далее. Код суммы так же правильный, он согласуется с теорией и достаточно простой.
Не может быть у вас средний выигрыш 36 для серии из 2^32 исходов. Это невозможный уровень удачи. Может быть, у вас другая модель, например вы "выплачиваете" в своей симуляции агенту вдвое больший выигрыш, чем я? Тогда это то же что и выигрыш у меня 18, что в принципе допустимо.
На серии в 20000 ~ 2^14 по моей модели ожидается средний выигрыш 7 +- 3. Выход за этот диапазон явно показывает численную несогласованность наших моделей. Но если вы достигли моего значения (16) выплачивая игроку вдвое больше, то на самом деле вы достигли 8.
Да, в статье плохо раскрыты математические аспекты происходящего.
Я думал раскрыть их здесь комментарием, но в итоге написал более полную с математической точки зрения статью: https://habr.com/ru/articles/984276/
Хорошая статья!
Вы напомнили мне про завалявшееся у меня незаконченное статистическое исследование этого парадокса. Я его завершил и опубликовал: https://habr.com/ru/articles/984276/ в качестве обстоятельного математического комментария к происходящему.
Что за чушь вы несете?
таким образом у нас будет сеньор ии которого можно будет жестко взаимодействовать с физическим миром в особо извращенной форме без нарушения трудового кодекса за допущенные им баги и галлюцинации.
То, что финальная пазлинка в превью не подходит пазу - галлюцинация или авторский замысел?
Ну ладно, американский ИИ не обязан разбираться в русских сказках - подумал я и потребовал у них двоих список персонажей "Волшебника в стране Оз" Баума. Приводить ответы целиком не буду, но на этот раз GPT не стал придумывать ерунду, справившись с заданием без особых нареканий, а GigaChat почти не облажался, всех правильно перечислив, но в конце концов не выдержав и добавив в список некого "толстяка Джокера".
Так вот - что эти бенчмарки, SWE-bench, GPQA, какая ерунда! Вот настоящий вызов для LLM - перечислить герои и перепетии сюжета разных известных книжек, ничего не выдумывая и ничего не убирая. Вот где кроется настоящий вызов для ИИ!
P.S. Программисты у GigaChat нормальные для не супер-топ модели. А вот создателя веб-интерфейса за такую халтуру стоит сослать в Сибирь.
P.P.S. Повторил запрос на персонажей "Незнайки" в Opus-4.5 и Gemini-3-pro через LMArena. Гиганты справились с вопросом нормально, ничего не сгаллюцинировав. Может быть, продвинутая версия GigaChat тоже может нормально на это ответить?
Захотел вступиться за претендентов и набрал в доступном онлайн Гигачате тот же вопрос.
Сначала я обрадовался, но позже вчитался в ответ сберовского поделия.
Спрутс-младший ? Монета Людоедка ? Охотник Пулька теперь лунянин?
Ладно - решил я - гигачат недотягивает. Есть ещё куда расти русскому ИИ. И что бы его полностью посрамить пошел спрашивать то же самое у chatGPT:
Так что Сиропчик у нас теперь профессор, Спрутс и Крабс - полицейские, а половину лунных персонажей я вообще не знаю.
Это образно. За день джуниор тоже не разберется.
Я верю (это не доказано и не опровергнуто), что работа нейросетевой модель в некотором смысле подобна работе человеческого разума. Модель обучалась на корпусе текстов, написанных людьми; если математическая функция человеческого разума (если понимать разум как речевую машину, а многие известные философы, например, Гоббс, Хомский или Витгенштейн считали речевую компоненту важнейшей и неотъемлимой частью разума) существует, то высокодостоверна гипотеза, что нейросетевая модель её воспроизводит.
В этом случае мы можем считать, что внутри нейросетевой структуры действительно живет полный аналог человеческого специалиста, точнее, той части разума этого специалиста, которая ответственна за его профессию, и можем корректно считать, что, хотя модель моделирует специалиста в несколько раз быстрее, чем мы его проживаем, их (специалиста и модели) паттерны мышления/поведения/освоения вашего проекта будут эквивалентны.
За вступительное объяснение спасибо, но есть еще неясные моменты.
Обозначим комбинацию для 2d случая так:
Чему равны скалярное, внешнее и геометрическое произведения комбинаций
и
?
Понимаю, что для вас это очевидная база, но из ваших определений мне никак не удается получить однозначный ответ на этот вопрос.
С вашей стороны было бы любезно упомянуть все эти простые инструменты хранения и сжатия ноутбуков явным образом. Краткий поиск в Google и Perplexity дал мне примерно ничего.
Маримо, безусловно, хороша, но о ней мало кто знает. И я имею ввиду не людей а инструменты. Почти весь свой ноутбучный код я пишу не через jupyterlab, а через cursor - он унаследовал от vscode прекрасный плагин jupyter. Marimo плагин для VSCode существует, но, во-первых, он плохо разработан (например, не поддерживает тему редактора), а во-вторых, не портирован на тот же cursor.
Читают мои блокноты коллеги же, обычно, прямо через web-интерфейс github. Как вы понимаете, marimo-файлы он проигрывать не умеет, и то, что marimo кодирует свои блокноты через голый python здесь недостаток а не достоинство.
Не впечатлило.
К (1): вы тоже не можете познать себя «полностью». Вы разве что можете внушить себе некоторые иллюзии насчет самопознания. Может быть вы - формальная система?
К (2) - разглядывая нейроны в коре вашего мозга, никакой нейролог тоже там понимания не найдет. Но это же не значит что его там нет? Машина строит во время своей работы некую сложную математическую структуру. Нейроны мозга , скорее всего, тоже строят во время своей работы сложную математическую структуру, которую называют разумом. Если эти структуры схожи, можно считать, что машина моделирует разум со всеми его атрибутами вроде поднимания.
К (3) - может, абсолютно сильной эмерджентности вообще нет на свете? По вашему описанию, мы считаем сильной эмерджентностью то, про что сейчас, нашими ограниченными инструментарными и когнитивными возможностями слабого человеческого ума не можем понять, как оно такое получилось ( пример: живая бактерия как-то получается из органических молекул). Но почему вы считаете эти барьеры абсолютными? Гораздо достовернее выглядит, что это мы глупые и технологически неразвитые, и что какой-то высший разум легко мог бы разобраться с вопросами, которые мы считаем проявлениями сильной эмерджентности.
К (4) - как вы уже поняли, я не вижу в ваших измышлениях не то что доказательства, но даже сильного аргумента в пользу описанной вами точки зрения. Что же касается красного цвета, то в скрытом пространстве нейросети это тоже вовсе не (255,0,0) а сложное семантическое понятие, близкое к словам «любовь» и «кровь»
Вывод: не переведутся на свете бездельники-философы, рассказывающие нам, что что-то устроено волшебным и непостижимым образом так что понять невозможно, и нет способов их переубедить, пока это невозможное не постучится к ним в окно и не скажет «привет». И даже тогда будут продолжать спорить.