Pull to refresh

Интернет ставит на Apple iPhone

Reading time 1 min
Views 420
Lumber room
Сайт Bodog.com, на котором заключаются разнообразные спортивные пари, начал принимать ставки от желающих поспорить, выйдет ли в свет телефон Apple iPhone 30 апреля 2007 года, или же о нем объявят на январской конференции MacWorld.

Как сообщает CNet, тем, кто уверен в апрельском появлении iPhone, для того чтобы выиграть 100 долларов, надо поставить 150, а их противникам — 280, чтобы унести домой 100. Тем же, кто вообще не верит в выход нового устройства, для получения заветной сотни надо поставить 110 долларов (для не-игроков сообщаем, что в случае выигрыша ставка тоже возвращается, иначе эта затея теряет всякий смысл).

Просадить свои кровные или немного заработать можно на сайте Bodog.com.
Total votes 7: ↑6 and ↓1 +5
Comments 0

Спасуют ли люди перед машиной?

Reading time 1 min
Views 905
Artificial Intelligence
Unabomber играет с Polaris в 2007 годуОтвет на вынесенный в заголовок вопрос мы получим уже через пару дней, когда пройдут все игры очередного этапа Мировой серии покера в Лас-Вегасе. Дело в том, что в этот раз в рамках состязания пройдет игра между канадской программой Polaris и тремя карточными профессионалами Ником Грундзиным (Nick Grundzien), Айджеем Полански (Ijay Palansky) и Мэттом Гавриленко (Matt Hawrilenko). Детище разработчиков из Университет Альберты уже «садилось» за стол с серьезными противниками в прошлом году, однако тот раз оказался для нее неудачным.

Впрочем, удача — это лишь один из факторов, влияющих на исход игры в покер. Выяснить насколько она важна по сравнению с умением всегда делать самые вероятностно-оправданные решения и задумали организаторы турнира.

Турнир будет состоять из нескольких матчей по 500 раздач каждый. Белковые и электронный джентельмены будут играть в семикарточный лимитированный Техас-холдем. Преимущество Polaris, кроме гигафлопсов вычислительной мощи — полное спокойствие и собранность. Впрочем, анализировать поведение оппонента программа не умеет, так что психологический фактор в такой игре сводится на нет.

В общем итоге хочется сказать, что такой покер нам не нужен.
Total votes 24: ↑21 and ↓3 +18
Comments 42

Погрешности, толпы, измерения, или где-то я это всё слышал.

Reading time 3 min
Views 3.1K
Crowdsourcing

Написать этот пост меня побудил пост про орешки. К сожалению, я не читал книгу на которую ссылается автор, но всё-таки позволю себе некоторым образом по-обсуждать данную тему.

Предлагается эксперимент, в котором люди измеряют количество орешков в посуде. Орешков много и лежат они не аккуратно, поэтому измерить точно их количество представляется довольно затруднительным. И вот тут начинается особая магия.

Читать дальше →
Total votes 122: ↑95 and ↓27 +68
Comments 80

Узники и коробки

Reading time 1 min
Views 998
Entertaining tasks Mathematics *
Ещё одна задача про узников. На этот раз не такая теоретическая.

Есть 30 узников, пронумерованных от 1 до 30. Каждый знает все номера, в том числе свой. У них есть время на обсуждение алгоритма. Дальше их по одному заводят в комнату, где есть 30 пронумерованных коробок. В каждой коробке по одному ключу с номером какого-то узника (номер коробки и номер ключа в ней могут быть различными). Ключи по коробкам распределены совершенно случайно (т.е. все перестановки ключей в коробках равновероятны). Каждый узник по очереди открывает 15 коробок и смотрит, какие в них ключи, причём, открывая очередную коробку, он может сначала посмотреть, какой в ней ключ, а потом решить, какую открывать следующей. Если в одной из этих 15 коробок оказался ключ с его номером, то его отпускают, если нет — расстреливают. Комната и все коробки в ней после этого приводятся в изначальное состояние, т.е. следующие узники не получают никакой информации о том, что было с предыдущим узником.
Придумайте алгоритм, чтобы с вероятностью не меньше 30% выжили все узники.

PS Можно использовать калькулятор.

UPD Решение в комментах.
Total votes 13: ↑8 and ↓5 +3
Comments 57

Первый сон моего товарища

Reading time 4 min
Views 861
Mathematics *
Узнав, что у меня есть «выход на Хабр», мой товарищ по работе возликовал, сбегал к себе в кабинет и вернулся с флешкой.
— Вот, Вовчик! — воскликнул он. — Опубликуй там! Прошу тебя! Я не математик, но чувствую, это — нечто!
— Вот ис зис?? — не понял я.
— Это… Это, — замялся товарищ. — Это мой сон.
-??!!!
— Ну, там все написано. Это, ммм, новый закон Гаусса, понимаешь?! Да не смотри на меня так! Все было как наяву! Там все написано! Пусть математики посмотрят! Только я писал второпях, ночью, и возможны опечатки…
Вот, что было написано ночью (со всеми «опечатками»):
Мне приснился странный, но очень логичный сон. Я нахожусь в какой то аудитории и четкий голос рассказывает мне о Первом законе Гаусса. Из школьной программы я помню, что Гаусс открыл что-то в области электромагнитной индукции, и его именем названа единица индуктивности -1 Гаусс. Но больше ни о каких его законах я не слышал. И конечно же спросил в пустоту, а разве Гаусс открыл несколько законов? И мне ответили, что самый первый закон, который он вывел, относится к теориям вероятностей, и для того времени он был не только очень сложным, но и чреватым непредсказуемыми последствиями. Поэтому этот закон не увидел свет. И голос сказал, чтобы я запомнил все, что услышу, ибо это основное, а детали, мол, выведешь сам.
Читать дальше →
Total votes 132: ↑70 and ↓62 +8
Comments 48

Введение в Байесовские методы

Reading time 6 min
Views 170K
Algorithms *Mathematics *
Tutorial
Sandbox

В качестве введения


В настоящее время Байесовские методы получили достаточно широкое распространение и активно используются в самых различных областях знаний. Однако, к сожалению, не так много людей имеют представление о том, что же это такое и зачем это нужно. Одной из причин является отсутствие большого количества литературы на русском языке. Поэтому здесь попытаюсь изложить их принципы настолько просто, насколько смогу, начав с самых азов (прошу прощения, если кому-то это покажется слишком простым).
Подробности
Total votes 78: ↑70 and ↓8 +62
Comments 37

Фильтрация смс спама с помощью наивного байесовского классификатора (код на R)

Reading time 8 min
Views 27K
Data Mining *Algorithms *
Привет. В этом посте мы рассмотрим простую модель фильтрации спама с помощью наивного байесовского классификатора с размытием по Лапласу, напишем несколько строк кода на R, и, наконец, протестируем на англоязычной базе данных смс спама. Вообще, на хабре я нашел две статьи посвященные данной теме, но ни в одной не было наглядного примера, чтобы можно было скачать код и посмотреть результат. Также не было упоминания про размытие, что существенно увеличивает качество модели, без особых затрат усилий, в отличие, скажем, от сложной предобработки текста. Но вообще, запилить очередной пост про наивного байеса меня побудило то, что я пишу методичку для студентов с примерами кода на R, вот и решил поделиться инфой.

Читать дальше →
Total votes 24: ↑24 and ↓0 +24
Comments 12

Количество ложно-положительных срабатываний фильтра Блума [перевод]

Reading time 3 min
Views 7K
Algorithms *Mathematics *
Sandbox

Количество ложно-положительных срабатываний фильтра Блума.


Описание

Фильтр Блума — это рандомизированная структура данных для запросов, разработанная Бёртоном Блумом в 1970 году. Фильтр Блума даёт ошибочный ответ на запрос, т.н. ложно-положитеное срабатывание. Т.е. если мы добавляем некоторый элемент, то существует отличная от нуля вероятность, что фильтр Блума вернет ответ что элемент находится в векторе, хотя его там нет.

Грубо говоря, фильтр Блума возвращает 2 возможных ответа:
  1. элемента нет в векторе
  2. элемент возможно есть в векторе


Блум проанализировал вероятность таких ошибочных ответов, но его анализ является некорректным.
Читать дальше →
Total votes 31: ↑26 and ↓5 +21
Comments 5

Автоматическая проверка орфографии, модель Noisy Channel

Reading time 11 min
Views 9.9K
Data Mining *Algorithms *
Доброго времени суток. На днях у меня возникла задача по реализации алгоритма пост-обработки результатов оптического распознавания текста. Для решения этой проблемы не плохо подошла одна из моделей для проверки орфографии в тексте, хотя конечно слегка модифицированная под контекст задачи. Этот пост будет посвящен модели Noisy Channel, которая позволяет осуществлять автоматическую проверку орфографии, мы изучим математическую модель, напишем на c# немного кода, обучим модель на базе Питера Норвига, и под конец протестируем то что у нас получится.

Читать дальше →
Total votes 13: ↑9 and ↓4 +5
Comments 0

Как Роберт Моррис на 8-ми битах до 10 000 считал

Reading time 3 min
Views 36K
Programming *Java *Algorithms *


Как все знают с помощью n-бит, можно реализовать счетчик считающий до 2n-1, но если у вас очень ограниченные ресурсы, или вам просто хочется поэкспериментировать и объединить в одно целое последовательности, вероятности, рандом и увеличение счетчика, то прошу под кат.

Читать дальше →
Total votes 61: ↑52 and ↓9 +43
Comments 51

Метод Монте-Карло в физике элементарных частиц

Reading time 4 min
Views 26K
Programming *Algorithms *Mathematics *
Данная статья посвящена широко известному методу Монте-Карло, который основан на теории вероятностей и математической статистике, в физике элементарных частиц. Так же, я расскажу, как можно разыгрывать дискретные и непрерывные случайные величины методом Неймана, а на закуску посмотрим, как применять ММК в ФЭЧ.

Сразу замечу, что моделирование будет производится в САВ WM, которую я применял (не так давно) в своей первой статье.
Читать дальше →
Total votes 39: ↑32 and ↓7 +25
Comments 27

В погоне за стульями

Reading time 2 min
Views 5.8K
Algorithms *Mathematics *
В соседнем посте была приведена интересная задача, условие которой звучит следующим образом:

Вероятность того, что в один из двенадцати стульев зашиты бриллианты, равна 0.9. При предположении, что стулья вскрывают поочерёдно, причём к следующему переходят только в том случае, если в текущем стуле не нашлось бриллиантов, найти вероятность того, что бриллианты окажутся в 12 по счёту стуле.

На ближайшее время позволим себе абстрагироваться от точных численных значений и положим вероятность того, что бриллианты зашиты, равной p, а количество стульев — n.

Хотите узнать правильное решение этой задачи? Добро пожаловать под кат!

Читать дальше →
Total votes 12: ↑4 and ↓8 -4
Comments 21

Оценка связанности событий с помощью Байеса

Reading time 6 min
Views 10K
Entertaining tasks Algorithms *Mathematics *
В своей книге Нейт Сильвер приводит такой пример: допустим требуется разместить инвестиции в нескольких предприятиях, которые могут обанкротиться с вероятностью $5\%$. Требуется оценить свои риски. Чем выше вероятность банкротства, тем меньше мы будем вкладывать денег. И наоборот, если вероятность банкротства стремится к нулю, то можно инвестировать без ограничений.

Если имеется 2 предприятия, тогда вероятность того, что они оба обанкротятся, и мы потеряем все вложения $P = 0.05 \cdot 0.05 = 0.0025$. Так учит стандартная теория вероятности. Но что будет, если предприятия связаны, и банкротство одного ведет к банкротству другого?

Крайним случаем является ситуация, когда предприятия полностью зависимы. Вероятность двойного банкротства $ P$( банкрот1 & банкрот2 ) = $P$( банкрот1 ), тогда вероятность потери всех вложений равна $P = 0.05$. Методика оценки риска имеет большой разброс $P$ от 0.05 до 0.0025 и реальное значение зависит от того, насколько правильно мы оценили связанность двух событий.


При оценке инвестиций в $N$ предприятий имеем $P$ от $0.05$ до $0.05^N$. То есть максимальная возможная вероятность остается большой $P=0.05$, и старая поговорка «не клади яйца в одну корзину» не сработает, если упадет прилавок со всеми корзинами сразу.

Таким образом наши оценки имеют колоссальный разброс, и сколько куда вкладывать остается вопросом. А ведь надо хорошо считать, прежде чем вкладывать. Нейт Сильвер говорит, что незнание этих простых законов аналитиками привело к крахам фондового рынка в 2008 году, когда рейтинговые агенства США оценивали риски, но не оценивали связанность рисков. Что в конце концов привело к эффекту домино, когда сначала свалился крупный игрок и увлек за собой других.

Попробуем разобрать эту проблему, решив простую математическую задачу после ката.
Читать дальше →
Total votes 16: ↑15 and ↓1 +14
Comments 28

Как запутать аналитика — 4. Вероятность и точность

Reading time 3 min
Views 6.5K
Semantics *System Analysis and Design *IT Standards *Mathematics *
В прошлой статье я сказал, что числовые атрибуты напрямую связаны с операциями, которые мы проводим над объектами. При этом натуральные числа – самый простой из рассматриваемых нами атрибутов. Есть и более сложные. Например, матрицы. Если мы говорим о свойстве линейного преобразования в трехмерном пространстве, то оно записывается 9-ю числовыми значениями, из которых удобно сформировать матрицу размером 3 на 3. Причина этого в том, что два преобразования, выполненных последовательно, — тоже преобразование, числовые атрибуты которого могут быть получены путем перемножения двух матриц. В этом сила моделирования преобразования при помощи матрицы.

Я бы много отдал, чтобы преподавание математики строилось именно таким способом: через практическую задачу, через ввод нужных объектов (чисел, матриц, волновых функций) и объяснение, как операции над ними помогают решать конкретные задачи. Именно так строилось обучение в физмат школе, в которой мне довелось учиться – в интернате №18 при МГУ, спасибо преподавателям!
Читать дальше →
Total votes 21: ↑14 and ↓7 +7
Comments 15

Вероятностный анализ сейсмической опасности

Reading time 12 min
Views 8.9K
Mathematics *
Sandbox
Причиной написания этой статьи стала распространенная рядом СМИ информация о прогнозе «мощнейшего» землетрясения, которое может произойти в ближайшие 30 лет в Японии и на Курилах с вероятностью до 40%. Ссылались журналисты на японских ученых. Нам удалось найти оригинал статьи, откуда, по всей видимости, и взяты сведения. Она была опубликована 20 декабря в Japan News и сейчас находится в платном архиве, но у нас есть замечательный ресурс wayback machine.

Ниже мы постараемся разобрать, о чем же действительно первоисточник, погружаясь в дебри математики и основы вероятностного анализа сейсмической опасности. Если в двух словах, то японские сейсмологи дали не прогноз мега-землетрясения на Курилах, а описали модельные характеристики сейсмических источников, которые учитываются при составлении карт сейсмического районирования со сроком службы зданий и сооружений на ближайшие 30 лет. Попытаемся произвести вычисления. Без суперкомпьютеров…
Читать дальше →
Total votes 28: ↑28 and ↓0 +28
Comments 0

Я смоделировал цену биткойна за весь 2018 год. Вы не поверите в результат (прим. перевод. и будете правы)

Reading time 5 min
Views 110K
Cloud4Y corporate blog Mathematics *Research and forecasts in IT *Studying in IT Reading room
Translation
Дисклеймер: статья написана из любопытства и интереса, является личным мнением автора и не предназначена для принятия решений о инвестициях. Для этих целей примите личные меры должной осмотрительности, не совершайте глупостей и не вкладывайте денег больше, чем можете себе позволить потерять.

Дисклеймер 2: нет никаких гарантий, что доходы в будущем будут похожи на доходы в прошлом, а предыдущий рост не указывает на будущий. Я понимаю. Я уже говорил, что это из чистого любопытства? Не относитесь к этому как к строгой науке, для этих целей я бы опубликовал научную статью, а не публикацию в блоге с гифами и мемами. Take it easy:)

Однако, в конкретном случае с bitcoin, я (автор оригинального текста, это перевод) считаю, что bitcoin — это «правильные, крепкие» деньги, а фиатные — нет. Поэтому, если вы считаете также и таких людей достаточное количество, это может стать причиной того, что будущие доходы будут похожи на доходы в прошлом.



Это будет всего лишь 5-минутное приключение.

Я делаю простую симуляцию методом Монте-Карло по ежедневным приростам долларовой цены биткойна, чтобы попытаться узнать, какова будет его самая вероятная цена к концу 2018 года. Вы можете найти весь код, используемый мной для этого, на GitHub.
Читать дальше →
Total votes 42: ↑29 and ↓13 +16
Comments 74

«То, чего на белом свете вообще не может быть…»

Reading time 6 min
Views 39K
Popular science
Дорогие друзья, я рад представить вам еще одну статью из серии своих путешествий по миру удивительного. Мы начали с разговора о числах-гигантах, где я попытался поделиться с вами своим восхищением от того, какие невероятные по своей величине числа окружают нас во Вселенной и как близко мы можем подойти по ним к самой бесконечности. Вторая статья рассказывала о микроскопически малых объектах, находящихся далеко за пределами видимости не только невооруженного глаза, но и самого сильного микроскопа. Сейчас я предлагаю вам отправиться в третье путешествие — путешествие в мир вероятностей. Мы рассмотрим примеры невероятных, но, тем не менее, математически возможных событий. Нам снова придется работать с числами, так что я заранее прошу прощения у гуманитариев (если, конечно, таковые есть на данном ресурсе). В общем, если вы, так же как и я, любите забивать голову бесполезными фактами, то добро пожаловать.

image
Читать дальше →
Total votes 61: ↑56 and ↓5 +51
Comments 106

Орел или решка?

Reading time 7 min
Views 105K
Popular science Brain
Человек должен мыслить вероятностно. Просто потому, что наш мир так устроен, что каждое событие происходит с той или иной степенью вероятности. И этот «железобетонный» факт нужно всегда принимать во внимание.
Читать дальше →
Total votes 23: ↑14 and ↓9 +5
Comments 62

Можно ли выиграть в азартные игры? Симуляция на языке Python

Reading time 10 min
Views 29K
Popular science Lifehacks for geeks
Привет, Geektimes.

В процессе праздного ничегонеделания возникла идея поизучать разные азартные игры, заодно получше разобраться с тем как это работает. Результаты оказались хотя и в целом очевидными, но достаточно интересными, чтобы поделиться ими с общественностью.



Кому интересны подробности, прошу под кат.
Total votes 32: ↑29 and ↓3 +26
Comments 119

Вероятностный метод майнинга Bitcoin

Reading time 19 min
Views 19K
Cryptography *C++ *Mathematics *


Думаю немного бреда на вторник не сильно повредит рабочей неделе. У меня хобби, на досуге я пытаюсь придумать, как взломать алгоритм майнинга bitcoin, избежать тупого перебора нонсе и находить решение задачи подбора хэша с минимальным расходом энергии. Сразу скажу результата я, конечно, пока не достиг, но тем не менее, почему бы не изложить в письменном виде идеи, которые рождаются в голове? Куда-то же их нужно девать…

Несмотря на бредовость изложенных ниже идей я думаю эта статья может быть полезна тому, кто изучает

  1. язык C++ и его темплейты
  2. немного цифровой схемотехники
  3. немного теории вероятности и вероятностной арифметики
  4. детально алгоритм хэширования bitcoin
Читать дальше →
Total votes 51: ↑41 and ↓10 +31
Comments 30