All streams
Search
Write a publication
Pull to refresh
24
0.2
Григорьев Андрей @Pochemuk

Пользователь

Send message
Ну Вы верно уловили суть…

За покер не могу говорить, т.к. ривер от ретривера не отличу, поэтому поговорим за преферанс. Вернее, за такой тип игры, как «мизер».

Для тех, кто не в курсе, поясню: мизер, это такой заказ, при котором мизерящий обязуется не взять ни одной взятки. Если выполнил это обязательство — получает крупную премию. Если нет — крупный штраф за каждую взятую взятку.

Так вот, по правилам преферанса. прикупив две карты из прикупа, мизерящий скидывает две любые карты в «снос». Причем, его противники этих карт не видят.
У него после сноса может остаться такая комбинация карт, при которой он заявку «мизер» выполнит автоматом при любом раскладе у противников. В этом случае говорят, что мизер чистый.
Но чаще в одной или нескольких мастях остаются такие комбинации, которые с некоторой вероятностью могут дать ему взятку или несколько. Такие комбинации называются «дырами». В том смысле, что в них мизерящему что-то прилетит.

Так вот, допустим у мизерящего два варианта сноса, но при любом остается «дыра». Вероятность того, что на первую дыру получим взятку составляет 70%, а на вторую — 60%.

Казалось бы, оставлять вторую дыру выгоднее всегда… И это называется чистой стратегией.

Примем упрощенную модель, при которой вероятности ловли дыр являются независимыми.

Тогда с вероятностью (1-0,7)*(1-0,6)=12% не ловится ни одна дыра.
С вероятностью 0,7*(1-0,6)=28% ловится только первая дыра.
С вероятностью 0,6*(1-0,7)=18% ловится только вторая дыра.
С вероятностью 0,7*0,6=42% ловятся обе дыры.

Но давайте предположим, что мизерящий сносит случайным образом с частотами 50/50.

Тогда от 28% и от 18% останется только половина. Потому что в половине случаев будет оставлена не та дыра, которая ловится.
И от 42% останется только половина. Потому что противники будут ловить не ту дыру, которая оставлена (не угадают).

Итого, при такой стратегии сноса (случайной) мизер будет пойман всего лишь в 0,5*(0,28+0,18+0,42)=44%.
А сыграет его мизерящий с вероятностью 0,12+0,5*(0,28+0,18+0,42)=56%.

Согласитесь, что 56% сыграть мизер при смешанной стратегии сноса гораздо лучше вероятности 40% при оставлении всегда второй дыры…

Конечно, модель очень упрощена. Она не учитывает, что при некоторых раскладах карт у противников количество взяток на разные дыры может существенно отличаться. Но суть, надеюсь, описал понятно.

Так вот, какие алгоритмы должны применяться в ИНС, чтобы в конце концов мы получили именно равные частоты для обоих вариантов сноса, а не явное предпочтение оставлению второй дыры?

Я так краем глаза слышал, что метод обратного распространения ошибки здесь не подходит. Нужно применять какие-то другие методы. Но вот какие именно — не помню и не знаю… Может быть подскажете?
Это, безусловно, больше соответствует реалиям карточных игр, но не отвечает на главный вопрос:

Каким образом ИНС может расчитать оптимальную смешанную стратегию?

Т.е., другими словами, каким образом заставить вещественное число на выходе нейрона быть адекватной той частоте, с которой надо выбирать именно этот ход?

Т.е., если три хода должны быть выбраны с частотами (не вероятностями, а именно частотами в данном контексте) 40%, 50% и 10%, то в результате обучения ИНС на выходе мы должны получить значения трех нейронов, из которых однозначно вычислим эти частоты.

Т.е. ИНС должна обучаться именно частотам, причем, в конце концов, подбирать их оптимальное соотношение.
Способа перехода от позиции к позиции два вы либо уходите в пас, либо остаетесь.

Это как раз и есть, что называется, решением в чистых стратегиях.
Имеем вероятности, имеем значения проигрышей/выигрышей в каждом случае, оцениваем риски, находим оптимальный единственный ход.

Но Cepheus умеет как раз блефовать, т.е. в некоторых случаях следует не чистым, а смешанным стратегиям:

https://www.gipsyteam.ru/news/4362-proschay-limitnyy-holdem

Как найти численными методами смешанные стратегии — имею представление. Например, методом Брауна-Робинсон. Или более продвинутыми.
Как работает классификатор на основе ИНС тоже некое представление имею.

Но как заставить ИНС не просто проводить классификацию, а вычислять частоты различных стратегий в рамках смешанной стратегии, да еще следовать им, — это представить не могу.

Вот поэтому интересуюсь: это какие-то специальные ИНС на такое способны или сбоку к ИНС прикручена еще какая приблуда, которая этим занимается?
Вот поясните мне, почти что абсолютному нулю в ИНС, такой вопрос:

В одной статье про ИНС и покер (лимитный ТХ) читал, что ИНС (название не помню, может быть Cepheus) может блефовать.

Это вот мне как раз и странно. В моем понимании, ИНС это линейный классификатор. Т.е. куча параметров на входе и одна 1 на одном выходе, определяющем класс, к которому относится объект (позиция игры в данном случае). Остальные выходы — по нулям. Т.е. таким образом однозначно находится класс входного объекта (является ли он буквой «Ъ», нужно ли пасовать или брать пешкой ферзя).

Т.е. однозначно находятся чистые стратегии игровых продолжений.

Но блеф — это совсем другой иконостас… Здесь мало найти, к какому классу относится позиция, нужно еще определить, что в этой позиции нужно применять смешанную стратегию, а так же частоты принятия того или иного решения в рамках этой смешанной стратегии.

Например, пасовать 99% случаев или блефовать и поднимать в 1% случаев.

Это какая-то особая архитектура ИНС для вычисления этих частот применяется? Или достигается вообще за счет каких-то других методик?
Не спасает… У нас на МТС был как раз корпоративный тариф.
Спасибо!

Модель 1910 — единственная в нашем зверинце, на которой протокол STP (в вариантах расширений STP/RSTP/MSTP) не только реализован, но и включен по умолчанию. Т.к. только расширение PVSTP строит отдельное дерево для каждого VLAN, а остальные — одно общее дерево, то топология с разделением на изолированные Port Based VLAN ошибочно принимается ими за избыточные связи и отдельные ветви отсекаются.

После отключения STP на HPE 1910-48 стенд заработал.
С ZyXEL GS1910-24 сложнее. Там в настройках по WEB-интерфейсу не нашел отключения STP. Но это не критично. Их у нас только 2 и они только 24-портовые. Можно найти, куда их приткнуть.

А ТП HPE — sucks!!! 4 месяца мозги выносили и так и не сказали мне в чем там дело и как это побороть!

А вот грамотный человек намекнул и за несколько часов проблема была решена!
Да откуда ж взять этот IMEI, с которого подписка прошла?
Просто больше никто не видит никакого криминала, там где его на самом деле нет…
Ой, токи не надо так упрощать…

Есть хабы, есть неуправляемые свитчи, есть упраляемые уровней L2 и L3… а есть продукция компании Hewlett Packard Enterprise. А конкретнее — HPE 1910-48 — скопированный со старого свитча 3COM Baseline Switch 2952-SFP Plus. А так же другие изделия HPE и ZyXEL серии 1910.

Так вот… эти чудо-приборы соединить между собой можно только одним транковым кабелем. Хоть напрямую, хоть через цепочку других свитчей. Ибо режим разделения портов на изолированные нетегированные VLAN (Port Based VLAN) реализован в них криво и косячно. Делишь порты на 2-3 отдельных VLAN, соединяешь каждый своим шнурком — связь рвется. Иногда между каким-то одним VLAN, иногда между обоими — еще звависит от того, задействованы или нет гигабитные порты.

4 месяца я писал в техподдержку HPE. В конце концов они сказали, что такое невозможно и используйте транковые каналы… Ты бач!!! У нас куча разных TrendNET, ZyXEL (1900 и 1920), D-Link и даже HPE 1620 — все поддерживат. А эти — нет. Да там поддерживать ничего не надо, на самом деле. Изоляция нетегированных VLAN между собой — это самая примитивная основа…

Короче, посоны, не покупайте это дерьмо серии HPE 1910 и ZyXEL GS1910. Как я почитал в Инете — это у них не единственный косяк в VLAN.
Тыкнуть в баннер — обидно, но случается.

А у нас другая проблема с опсосом была…

На удаленных объектах используются промышленные GSM/GPRS-модемы для передачи в диспетчерскую службу телеметрии техпроцессов. И использовали мы в них Sim-карты МТС (основная) и Beeline (резервная). Внезапно оказалось, что со счета МТС как-то подозрительно быстро расходуются деньги.

Оказывается, модемы, чтоб им скучно не было, то GOOD-OK себе подключат, то на рассылку анекдотов подпишутся, то на прогноз погоды… Не, ну в самом деле, должны же они техоборудованию сообщить о грядущей погоде, дабы оно знало, к какому режиму работы готовиться :D

Долгие бодания с МТС на тему «модем не мог сам подписаться и, вообще, избавьте наши номера от этих услуг» ни к чему не привели. Пришлось отказаться от МТС и перейти на Мегафон, как на резервный канал, а Beeline сделать основным.
Слышал, что все произведения кинематографа сводятся по сюжету к семи сказкам Шарля Перро. Не помню точно к каким, но «Золушка» среди них — наиболее часто встречающаяся.

Ну иногда еще «Золушок» встречается.
Если бы каждый вручную всё вырезал — проблем бы не было, потому что нашелся бы процент людей, которых бы это заинтересовало и реклама была бы актуальна.

Некоторое противоречие кроется в слове «актуальна».

Тут дело в том, что таргетированная реклама выдается постфактум, т.е. ее актуальность уже под вопросом.

Примеры из недавнего:

1. Ищу в Инете планку памяти. Сразу же директ начинает мне подсовывать баннеры типа «Купить память бла-бла-бла».
Ну не нужно мне ее покупать! Мне просто надо было проверить, есть ли у нее контроль ECC и registered буферизация!

2. Ищу сравнительные характеристики и цены на ViPNet. Мне опять-таки начинают пихать баннеры «Купить ViPNet».
Ну не нужны мне какие-то продавцы из рекламы. Цены на этот продукт одинаковые и задаются партнерам разработчиком. Я позвонил ему и узнал адреса ближайших партнеров, куда удобно будет съездить и забрать пакет документов.

3. Для составления плана закупок посмотрел на цены на Windows 10 Pro. Тотчас мне начали предлагать купить десятку за 3-4 тысячи.
Ну не может у легального поставщика она столько стоить! Это мошенники и один раз мы уже нарвались на таких.

Это я к тому, что таргетированная реклама априори запаздывает, не поспевает за моими запросами. А, следовательно, мне она не интересна. Так зачем же мне ее смотреть? Тратить время и электроэнергию на ее загрузку?
Не-не-не…

Речь идет не о задержке на чтение, а о числе итераций цикла посимвольного сравнения хеша.
Если уже первый символ не совпадает, то число итераций равно 1 и отклик о несовпадении придет быстрее.
Если первый символ совпадает, то число итераций будет не меньше двух и задержка до отклика будет больше.

Послав несколько десятков тысяч хешей с разными первыми символами можно определить при каком первом символе средняя задержка максимальна и тем самым узнать первый символ. Затем — второй. И т.д.

Но если каждый хеш посимвольно сравнивать с образцом начиная не с первого символа, а с произвольного, то понять, какой именно символ на каком месте вызывает наибольшую среднюю задержку — уже затруднительно.

Эффект аналогичен введению произвольной задержке после сравнения каждого символа, но при этом не будет нагружать сервер холостыми операциями, а вычленить злоумышленнику полезную информацию из задержек будет не только дольше, но и сложнее.
А у меня сначала высветилась эта картинка, а потом все равно страничка загрузилась.
XOR делать незачем. Ибо не поможет. Во всяком случае в той редакции, которую предлагает автор:
Для сравнения строк мы можем воспользоваться тем фактом, что XOR любого байта с самим собой даст 0. Всё, что нам надо сделать — применить операцию XOR к каждой паре соответствующих байтов из строк A и B, сложить получившиеся результаты и вернуть true, если сумма равна 0, и false в противном случае.

Если разрядность суммы ошибочно сделать 1 байт, или вместо арифметической суммы использовать поразрядное логическое суммирование, то можно просто подавать на вход хеши с 256 разными значениями сумм байтов. Рано или поздно — сойдется.

Если же разрядность арифметической суммы больше 8 бит, то уже может казаться надежным. Но это надо еще проверить, совпадает ли время сравнения двухбайтовых (четырехбайтовых) чисел, если у них старшие байты нулевые/не нулевые. Если есть хоть небольшая разница, то это уже можно попытаться использовать.

Интересно, а легко ли будет уловить разницу во времени, если сравнение начинается не с первого байта, а с рандомного и по циклу?
Можно подавать на вход хеш из одинаковых символов. Чем их больше в хранимом хеше, тем больше будет среднее время задержки до отлупа. Затем перейти к поиску пар и т.д. Алгоритм, будет сложным и длительным, но, возможно, все же эффективнее брута.
А почему смеялись? У него веб-камеры нет? :D :D :D
Токен приобретается на средства сотрудника, при его увольнении уничтожается.
Выдается под роспись при приходе сотрудника на работу, сдается им в первый отдел и опечатывается при уходе в т.ч. на обед и покурить.

Сколько же еще всякой херни придумать можно при желании…
А теперь:

«Хорошая жена, хороший дом — что еще надо человеку, чтобы встретить старость?!»
Ну да, прошу прощения за неточность. Конечно, 8 бит — размер индекса палитры. Т.е. цветов можно было вывести много, но одновременно — не более 256. А в Windows 3.x — не более 236, т.к. 20 индексов были зарезервированы под палитру самой Винды. Их тоже можно было заменить, но это приводило к тому, что шрифты, рамки, шапки окон — все меняло цвет. И работать было невозможно.
Но их можно было тоже включить в общую палитру без замены цветов. Но это уже чуть усложняло алгоритм оптимизации палитры. Хотя, она при этом становилась более адекватной, т.к. системные цвета лежали на границах цветового куба, т.е. хорошо подхватывали цвета, которые выбивались из кластеров в сторону границ.
Сделал агрессивную рекламу — год исправительных работ.

Не-не-не… Год просмотра неотключаемой рекламы с обязательными кликами по ней и звонками по телефонам!

Не говоря уже об обязательной покупке всего рекламируемого товара!

Information

Rating
2,598-th
Location
Коломна, Москва и Московская обл., Россия
Date of birth
Registered
Activity