Pull to refresh

Comments 358

Ваша математика совершенно не учла, что последними подсчитыааются голоса присланные по почте. А там существенный перевес сторонников Байдена, т.к. он неоднократно просил своих избирателей голосовать заочно, дабы не рисковать на участках, имея в виду коронавирус.
Вот когда учтете это в модели, тогда она будет иметь смысл. А чистая математика без понимания подоплеки событий — это что сова и глобус.

Согласен, я и говорю, что не хочу обсуждать политику, у меня модель, а не обвинения в фальсификациях. Хотя «голосование по почте» — отличная отмазка, чтобы объяснить соотношение 70% / 30% в пользу Байдена на последних процентах подсчета. Интересно будет сравнить с другими штатами.
Тут вопрос не в политике, а в достоверности вашей модели. Я охотно верю в то, что выборка «почтовых голосов» имеет принципиально иное соотношение, по крайней мере, это намного более вероятно, чем махинации при подсчёте голосов, когда наблюдатели обеих партий чуть ли не на плечах у членов комиссий сидят.
Каждый канал нанимает аналитиков, социологов и математиков (!), чтобы раньше всех достоверно предсказать и посчитать. Они считают, ожидаемое распределение досрочного голосованию, по почте, по присутствию, все это делается по каждому county и потом все это отслеживается в реальном времени.

Вот лучше бы про это рассказали, ей-богу.
Голосование по почте — это факт, а не отмазка. А ваши 70% на 30% преувеличение.

Для простоты допустим в штате 5 млн избирателей (на самом деле чуть больше).
Представим что 45% сторонников Байдена голосовали вживую, а 55% по почте.
Для Трампа ровно наоборот 55% голосовали вживую, а 45% по почте.
Для всех остальных оставим равномерное распределение 50% на 50%.

После подсчета 95% голосов результат будет очень похож на реальные данные:
— Трамп, 2.354 млн или 49.6%
— Байден, 2.339 млн или 49.2%
— остальные, 0.057 млн или 1.2%

Могут ли оставшиеся 5% голосов по почте повлиять на исход выборов?
— Байден, +0.136 млн
— Трамп, +0.111 млн
— остальные, +0.003 млн

Даже соотношения 45% на 55% оказывается достаточно, чтобы перевернуть исход выборов в последний момент, финальные цифры по голосованию будут:
— Байден, 2.475 млн или 49.5%
— Трамп, 2.465 млн или 49.3%
— остальные, 0.06 млн или 1.2%
Соотношение почтового голосования к живому.
image
70/30 — это факт, который лично наблюдал. Я, в общем, случайно, записал 5.11 стрим, ссылка на него в статье. Там зафиксированы абсолютные цифры на момент 95% подсчета. Вы можете посмотреть и сравнить. Аналогичные данные подсчета между 5 и 8 ноября по Неваде: 69/45 тыс. в пользу Байдена, а по Аризоне 164/213 в пользу Трампа. Это все требует объяснения и дальнейшего исследования.
Ваши 70% говорят о том вы что-то посчитали, но даже сами не понимаете что.
Посмотреть и сравнить цифры можно и без вашего стрима, web archive в помощь.

Попробую произвести расчет максимально приближенный к реальным данным.
Исходя из оценки оставшихся бюллетеней примерное число проголосовавших: 5.025 млн
Допустим что финальное распределение не сильно изменится, что само по себе уже излишнее допущение в пользу Трампа:
— Байден, 2.486 млн или 49.5%
— Трамп, 2.477 млн или 49.3%
— Джоргенсен, 0.062 млн или 1.2%

Примерная оценка проголосовавших по почте 40%
Пусть за Байдена по почте проголосовал 41%, за Трампа 39%, а за Джоргенсен 40%.
Проверим данные на 5 ноября:
— Трамп, 2 429 783 голосов из них 1 510 970 вживую и 918 813 по почте
— Байден, 2 406 774 голосов из них 1 466 740 вживую и 940 034 по почте
— Джоргенсен, 60 259 голосов из них 37 200 вживую и 23 059 по почте

Неужели разница в пару процентов по почте может на что-то повлиять?
Еще как может, на 8 ноября данные должны быть такие:
— Трамп, дополнительно 25 645 голосов по почте
— Байден, дополнительно 59 007 голосов по почте
— Джоргенсен, дополнительно 1 635 голосов по почте
Как же так? «Нас обманули», соотношение новых голосов 68.4% к 29.7%!

Все что тут «требует объяснения и дальнейшего исследования» это ваше математическое образование.
Спасибо, вы правы, что почтовые голоса надо отдельно учитывать. Если отвлечься от политики, то ваши цифры означают, что для корректного прогноза надо понимать, какую часть почтовых голосов осталось посчитать и взять в схеме Бернулли вероятность успеха не р=0.5, а р=0.3.
Там есть и еще более разительные расхождения. В Атланте есть участки, где соотношение 85/15 за Байдена, а в пригороде — есть 15/85 за Трампа.

Город и пригород это разные социальные слои, отсюда и разброс.
Аналогично более продвинутая Калифорния суммарно показала 64% за Байдена против 34% за Трампа (Санта Клара 73% на 25%, Санта Круз 79% на 18%, Сан Франциско 85% на 13%)
А там существенный перевес сторонников Байдена, т.к. он неоднократно просил своих избирателей голосовать заочно, дабы не рисковать на участках, имея в виду коронавирус.

Как это должно работать, по-вашему? Он это делает лично? Или протрамповцы назло бабушке дедушке морозят уши? Почему при этом местами все присланные бюллетени за Байдена? Какова вероятность этого?


Вот когда учтете это в модели, тогда она будет иметь смысл.

Тут тогда по-хорошему надо учитывать кучу других факторов. Околонулевую посещаемость ралли Байдена при многотысячных ралли Трампа, например. Или «глитчи» в компьютерных голосовалках, которые до починки показывали перевес в пользу Байдена, а после — почему-то всегда в пользу Трампа. Или количество проголосовавших больше количества зарегистрированных для голосования, причём не совпадающее с количеством проголосовавших за состав сената. Или перевес в пользу республиканцев в сенате, к слову о. Или подобная ерунда с поздними голосованиями по почте по большей части в swing states. Или недопуск наблюдателей от республиканцев на ряд пунктов подсчёта. Или голосования давно мёртвых людей, в конце концов.


Если вы начинаете такие вещи объяснять совпадениями или ещё чем подобным, то в этом мире не существует выборов, которые бы не подошли под вашу модель с совпадениями. Включая недавние белорусские, например.


В любом случае, посмотрим. Ближайшие несколько недель обещают быть очень интересными.

Или протрамповцы назло бабушке дедушке морозят уши?

Если принять во внимание «короновирусные пати» то это не кажется чем-то сильно удивительным и невероятным. Говорят среди сторонников Трампа больше COVID-диссидентов.
Говорят, если учесть массовые протесты этого лета, где было около нуля социального дистанцирования, то диссидентов скорее больше слева.

Как вы вообще сделали такой вывод? Если вы не увидели среди протестующих сторонников Трампа, это совершенно не означает, что они не ковид-диссиденты, их там нет по совершенно иным причинам.

О, а кстати, вот это считается за ковид-диссидентство, интересно?

Так они в масках же все?

А вы видео точно смотрели? Далеко не все.

Ну, вот кто без — те, возможно, диссиденты. Но большинство — в масках, насколько я вижу.

Я почему-то вижу наоборот. Ну, среди тех, где лица не смазаны так, что непонятно, маски это или артефакты.

Я вижу без масок только две компании, сидящие на траве кучками. Ну, и ещё пара человек.

Именно. А в масках — пара проходящих в начале, если рассматривать первые кадры. Остальные на заднем фоне — фиг их знает, не поймёшь, разрешения не хватает.

Вы шутите? Вот я взял пару случайных кадров примерно за четверть до конца видео, на которых видно побольше лиц, красным обвёл людей точно в масках, белым людей точно без:
Кадры

(картинки нужно в полном размере смотреть, разумеется, на превьюшке мало что видно)

Энивей (независимо от вашего начального тезиса «все в масках»), вы зачем-то вместо ненужных социальных собраний начинаете обсуждать вопрос масок. Но масок, как известно, недостаточно для того, чтобы остановить передачу вируса.

Я не обсуждаю вопрос масок, я отвечаю на тезис об их диссидентстве. Ковид-диссиденты не стали бы носить маски, вот и весь мой поинт.

Не-ковид-диссиденты не стали бы устраивать ненужные массовые собрания, вот и весь мой поинт.

Но ведь из каждого утюга несётся, что маски помогают не заразить окружающих, но кто-то без маски покашляет (или покричит как следует) — то окружающим ношение маски никак не поможет, потому что заражение бывает и через коньюктиву.

потому что заражение бывает и через коньюктиву.
Только площадь поверхности глаз — несколько квадратных сантиметров, причём, прикрытых от потоков воздуха ресницами, а площадь лёгких — до 120м², через которые постоянно принудительно продувается внешний воздух.

Ну так ведь утверждение-то что оно бывает — то есть, иногда, а не только так и никак иначе.
Моя (и, кстати, многих прочих говорящих голов) главная состоит в том, что в любой толпе человек без маски в условиях пандемии представляет немалую опасность. А конкретная критика конкретно в этом треде состоит в том, что почему-то в митингах против локдауна не носящих маски чуть не вяжут ОМОНом, но вот при погромах или таких вот народных гуляниях о вирусе почему-то не вспоминают, будто вирус умеет дискриминировать по политическим убеждениям.

Но ведь маски не гарантируют защиту от вируса. Людей не пускают к родным в госпитали (даже в масках), на похороны (в масках), и так далее. А тут такое вот нулевое дистанцирование. Так что да, на самом деле неважно, в масках они или без.

Речь же идёт не про гарантии защиты, а про снижение вероятности заражения.

чтобы снизить вероятность не надо переть толпами в парк

Возможно, но на улицах, в помещениях и ОТ был бы ещё хуже, чем в парке. Так что если уж им не сидится дома, то пусть хоть в парке.

Это же классика, когда выходят твои противники на улицу, то ой-ой корона, а когда твои сторонники то всё норм.

Ну, это же for a good reason… :)
Ну, очевидно, что товарищ считает маски более эффективными, чем считаете вы. Поэтому он против домашних сборищ (первый твит), на которых никто, разумеется, не будет в масках, хотя бы потому, что будут есть всякую еду.
Во втором примере что-то похожее. Вообще, оба примера сравнивают именно пребывание в замкнутом пространстве без масок и уличные собрания в масках. Да, одно опаснее другого. Разве нет?

Во втором примере явно написано stay home unless for essential reasons.


А что у людей магическое мышление, я уже давно понял. Маску надел — вируса избежал. Вышел протестовать за BLM, а не за Трампа — вируса избежал.

Второе — это вы уже додумываете. Тут, скорее, что они считают свои митинги «essential».

Как это додумываю? Прям в твите мэра написано же.

Где там написано, что протестующие за BLM избегут вируса?

А, вы про это. Это не там, это летом по телевизору было. Ну, типа, по CNN или подобным каналам показывали, что протестная деятельность в Нью-Йорке (который тогда был эпицентром) не связана с вирусом (ещё бы, contact tracer'ам по протоколу запрещено про протесты спрашивать), ну и какие-то типа видные учёные активно денаунсили белый супрематизм и говорили, что этот самый белый супрематизм является основной долговременной угрозе жизней американцев, поэтому протестовать против него можно (а собраться на условное 4 июля или похороны бабушки — нет).

поэтому протестовать против него можно (а собраться на условное 4 июля или похороны бабушки — нет).
Потому что протесты несут практическую функцию, а сбор на похороны — нет?

Или наоборот, похороны несут практическую функцию, а BLM-протесты — нет.

Или наоборот, похороны несут практическую функцию
И какую же практическую функцию несёт ритуал похорон, если не секрет?

Облегчить моральные страдания от смерти близкого человека, например.


А какую практическую функцию несут протесты за BLM и против полиции? Напомню, что копы убивают белых чаще, чем чёрных (на душу населения), и что любители defund the police очень любят звать эту полицию, когда у них самих проблемы.

А какую практическую функцию несут протесты за BLM и против полиции?
Политическую. Влияние на политику, законы, етц.
Напомню, что копы убивают белых чаще, чем чёрных (на душу населения)
Что-то ваше «напомню» с реальностью не совпадает. Я, вот, смотрю статистику за 2017 год, и белых к чёрным примерно 2:1 (457:223), при том, что в населении США, за тот же 2017 год, белых к чёрным примерно 5:1 (60.6:12.3). Выходит, для чёрного шансы быть застреленным в 2.5 раза больше.
Политическую

А ещё virtue signalling, это да. Не, понятно, что все действия несут некоторую практическую функцию, иначе бы их не выполняли, но тут мы ударимся в философию.


Что-то ваше «напомню» с реальностью не совпадает. Я, вот, смотрю статистику за 2017 год, и белых к чёрным примерно 2:1 (457:223), при том, что в населении США, за тот же 2017 год, белых к чёрным примерно 5:1 (60.6:12.3). Выходит, для чёрного шансы быть застреленным в 2.5 раза больше.

Если хотите обсуждать конкретные цифры, то тут уже надо смотреть конкретную статистику (и формулировать вещи аккуратнее — это в укор мне, да). Например, графу unintentional здесь — β для признака «чёрный» существенно отрицательный, то есть, смерть без причины антикоррелирует с чёрной расой. Плюс, на хабре писали довольно неплохие статьи со статистическим анализом.


А то ещё, знаете, 97% убитых полицией мужчины, но что-то маршей против системного сексизма я не наблюдаю.

Например, графу unintentional здесь — β для признака «чёрный» существенно отрицательный, то есть, смерть без причины антикоррелирует с чёрной расой.
А о чём это должно сказать? Там же в их определении „unintentional“ не попадают застреленные по подозрению, например. И даже застреленные намеренно при попытке к бегству — только „accidental injury/death while the victim was fleeing crime scene or arrest“.
Unintentional (total) 50 (6.2) Death occurred as a result of ( a ) injuries sustained while in custody, ( b ) LE use of force to restrain/capture, ( c ) accidental injury/death while the victim was fleeing crime scene or arrest, or ( d ) victim was an innocent bystander killed by LE. Fatalities resulting from use of force were not intentional.
А о чём это должно сказать?

О системном расизме. Иначе см. аргумент про то, что большинство убитых — мужчины.

Так если расист кого-то застрелил из расистских побуждений — это не «ненамеренное» (unintentional) убийство. Зачем их рассматривать-то?

А вы посмотрите на список категорий там, и, надеюсь, вопрос снимется.

Политическую. Влияние на политику, законы, етц.

Политическая цель там только одна — пропиариться, выиграть выборы, етц.


Все нашумевшие блм дела возникли из-за сопротивления при аресте. Сопротивление было скорее всего по двум причинам: или челик был под какими то препаратами, или очень не хотел ехать в участок потому что за ним числилось гораздо больше чем то на чём его непосредственно схватили, а скорее два факта сразу.


Если бы хотели действительно исправить ситуацию пытались бы найти причину, но тогда оказалось бы что дело в провальной социальной политике демократов. Поэтому демократы просто подливают масло в огонь расизма, тем самым усиливая социальный конфликт в сша, чтобы получить себе очки.

Пофиг в масках или нет, всё равно толпа и расстояния 1.5 метра нету.

А как «давно мертвые люди» голосуют? С кладбища на избирательный участок, а потом обратно? Или они во время Хэллоуина досрочно проголосовали?
Вопрос хороший. Надеюсь, суд выяснит.
А что, кто-то конкретные факты голосования «мёртных душ» предоставил, вместо слухов? А то я пока только про такие случаи слышал:
«Turns out 118-year-old 'William Bradley' voted via absentee ballot in Wayne County, Michigan,» Fletcher tweeted Thursday. «How long has this been going on?» he added.

A search of public records revealed a man named William Bradley was born in March 1902 and died in I984 in Michigan's Wayne County. But public records also show that his son, also named William Bradley and living at the same address, is very much alive — and a voter.
Спасибо за очередное подтверждение, что CNN в этом не сильно отличается от отечественного «Первого канала». Дело в том, что во всех этих записях также указывается дата рождения, поэтому тот Вильям, что постарше, устанавливается однозначно. Процитированные вами слова не означают, что отец тоже не был зарегистрирован.

Смешное опровержение, короче.
Ссылку на записи не дадите?

Например.


Voter Status: Active
born 1858

Это, правда, другой Вильямс, мне лень (и нет нужды) опровергать конкретный CNN'овый пример.


Видел список на несколько десятков тысяч таких голосующих мертвецов, из которых я проверил несколько случайных (и все действительно были из 19-го века), но с мобильника в истории ковыряться тяжко, извините.

По той же ссылке написано:

Lawrence Garcia, the principal attorney for the city of Detroit, confirmed to CNN that «a man with a nearly identical name [to the deceased Bradley] requested a ballot and voted properly in both the primary and general elections.»
«When his ballot was initially logged, however, it was incorrectly attributed to the William Bradley born 118 years ago through a clerical error,» Garcia added. The younger Bradley told PolitFact that he reached out to the city after Fletcher's video was posted but was told not to worry since officials check for a matching signature and date of birth.

//---------------------------------//

Спасибо за очередное подтверждение, что CNN в этом не сильно отличается от отечественного «Первого канала».

Как это всё подтверждает что CNN не сильно отличается от Первого канала?

Смешное опровержение

Что смешного?
Что смешного?

Риторика. Нельзя доказать утверждение о несуществовании фрода рассмотрением конкретного случая, который не является фродом. Поэтому я в комментарии выше с ссылкой на конкретный пример и указал, что нет нужды опровергать конкретный CNN-овский контрпример. Контрпримеры бывают к кванторам всеобщности, а не существования.

Он это делает лично? Или протрамповцы назло бабушке дедушке морозят уши?
Трамп лично попросил своих сторонников не голосовать по почте, а приходить на избирательные участки очно. Пруф.
Так Байден-то тоже не на ушко шептал, когда просил голосовать по почте.
Ну вот и получилось, что на избирательных участках больше пришло за Трампа, а по почте больше проголосовало за Байдена. Потому что оба именно так и попросили своих избирателей.
Надо бы вообще, чтобы сверхдержавы обменивались опытом. Путин вот пусть в следующий раз скажет, чтобы его электорат голосовал из дома по почте, а в США пусть поработают над статистической правдоподобностью циферок.
Потому что есть ещё provisional бюллетени, когда из-за всяких несостыковок в данных человеку дают проголосовать, но потом проверяют, что он имеет право голосовать и не проголосовал два раза. И другие случаи, когда требуется вмешательство живых людей для проверок бюллетеня.
www.vote.org/absentee-ballot-deadlines посмотрите на дедлайны «голосования по почте». В некоторых штатах отправлять можно было даже в сам день выборов (невада, например, среди них, а для калифорнии, например, прописано, что дедлайн получения бюллетеней комиссией для подсчета «17 дней после выборов»). Голоса будут считать еще неделю.
Спасибо, посмотрел. Можете объяснить про Джорджию? Я понял так, что надо было за 4 дня до дня голосования подать заявление. А считают те голоса, что пришли до дня голосования включительно. Или я не прав?

Georgia
Absentee Ballot Application Deadline
In Person: Received 4 days before Election Day.
By Mail: Received 4 days before Election Day.
Online: Received 4 days before Election Day.
Voted Absentee Ballot is Due
Received by the time the polls close on Election Day.
Вам там выше уже написали, но конкретно (и чуть подробнее) про Джорджию преса в пятницу писала, что у них остается еще 13000 тех самых provisional ballots (https://en.wikipedia.org/wiki/Provisional_ballot), которые перед принятием нужно «разъяснить» (используется термин clear, у которого довольно широкая трактовка). В их числе и бюллетени с ошибками, допускающими исправление перед подсчетом. А т.к. выборы — это вообще-то серьезно и там помимо президента еще куча всего выбирается (включая разные совсем локальные штуки, уровня города или даже «района») — надо считать все.
Вы абсолютно правы. Единственный вывод из моих расчетов: в рамках модели Бернулли результат выборов в Джорджии невозможный. Поэтому все эти странности требуют объяснения.
А там существенный перевес сторонников Байдена

А вообще, подтверждения у этой гипотезы есть какие-то? Т.е., окей, те бюллетени что прислали по почте считают в конце. Но каким образом определили, что за Байдена больше по почте голосуют?

Я всего лишь мониторил динамику подсчета голосов в паре штатов. На момент 95%-подсчета в Джорджии Трамп вел полпроцента (см. скрин в статье). Сейчас подсчитано 99%, т.е. последние 5% дают Байдену выигрыш 70%/30%. По крайней мере, это странно и требует объяснений. Данные за 5.11 у меня в стриме, а текущие — на сайте CNN, можете проверить цифры.
По крайней мере, это странно и требует объяснений

Ну так может быть много объяснений. Например — голосование по почте гораздо проще фальсифицировать и то, что мы видим — именно результат данных фальсификаций.

голосование по почте гораздо проще фальсифицировать и то, что мы видим — именно результат данных фальсификаций
Это потому что Трамп так сказал, а ему можно верить?

По факту дай бог один реальный случай из семи миллионов найдут, когда за бывшую жену без её разрешения проголосовали и то вообще на местном уровне:
Over that time period, Mayer testified, there had been 7,079,953 mail/absentee ballots cast in Montana. Of that total, he had found one instance of illegal voting, where a man filled out and submitted his former wife's ballot, without her permission, for an election for a school board.
А ваши доказательства строятся на том, что CNN, с давней историей топления за демократов, против республиканцев вообще и Трампа в частности, сказал, что фальсифицировать нельзя?
А что доказывать-то? Что фальсификаций по почте нет? Ну так вы дайте достоверный источник с реальными подтверждениями, что есть (да ещё в таких масштабах).

А то пока получается нужно доказать отсутствие того, чего нет.
А что доказывать-то? Что фальсификаций по почте нет? Ну так вы дайте достоверный источник с реальными подтверждениями, что есть (да ещё в таких масштабах).

Так что такое для вас достоверный источник-то? Вы вон на CNN ссылаетесь, можно я вам на твиттор сошлюсь для простоты, или в другую сторону вам нужны доказательства серьёзнее?


А то пока получается нужно доказать отсутствие того, чего нет.

Доказывать отсутствие того, чего на самом деле нет, часто просто и приятно. Но да, я здесь соглашусь с Druu рядом.

А то пока получается нужно доказать отсутствие того, чего нет.

Доказать можно все при желании. Например, Трамп создал комиссию после 2016 о фальсификациях, которая несколько лет искала и ничего не нашла. По моему скромному мнению это отличное доказательство отсутствия.

Это потому что Трамп так сказал, а ему можно верить?

Это не "потому что" — это гипотеза. Которая, в общем и целом, ни чем не лучше и не хуже гипотезы о голосующих по почте демократах.


Ну так вы дайте достоверный источник с реальными подтверждениями, что есть (да ещё в таких масштабах).

Это так не работает. У выборов есть презумпция недостоверности.
Если есть рациональные причины усомниться в достоверности результатов выборов (т.е. если эта достоверность не была строго доказана), то результаты выборов следует считать недостоверными, а сами выборы — несостоявшимися де-факто.
При этом доказывать недостоверность не требуется, конечно же.

У выборов есть презумпция недостоверности.
При этом доказывать недостоверность не требуется, конечно же.

Вы это серьёзно сейчас?
Ваше утверждение не соответствует ни реальному положению дел, ни здравому смыслу.

В реальном мире выборы считаются состоявшимися, когда в результате совершения законодательно установленной процедуры об их результатах объявят наделённые таким правом лица/официальный орган.
Совершение законодательно установленной процедуры само по себе считается достаточным основанием достоверности результатов, если отдельно не будет доказано иное.

В РФ и Беларуси были достоверные выборы?


О результатах объявлено, доказательств (ну вот чтоб прям в суде — какие ещё доказательства вас устроят?) нарушений, существенных для инвалидации результатов, нет.

А почему вы только про РФ и РБ спрашиваете? Это прямо страны с эталонными выборами?

Доказательств нарушений было более, чем достаточно. Но уполномоченные органы просто закрыли на них глаза, или даже активно пытались скрыть информацию о них. Но это говорит только о коррупции в этих органах в данных конкретных странах. И не говорит ничего о самой изначальной концепции выборов.

Я не говорю, что выборы в США были честными. Напротив, я более чем уверен, что какие-то нарушения там были с обеих сторон.

Но глупо же утверждать, что несомненно были именно фальсификации при голосовании по почте и несомненно массовые, только на том основании что презумпция недостоверности.
А почему вы только про РФ и РБ спрашиваете? Это прямо страны с эталонными выборами?

Потому что если предлагаемый вами логический фреймворк даёт разные результаты для РФ, РБ и США при одинаковых релевантных для этого фреймворка вводных, то, очевидно, вы что-то оставляете за кадром. Априорные предположения об уровне коррупции в странах, например.


Априорные предположения вообще очень важны. Я на тему выборов за последние дня три общался с несколькими разными знакомыми, живущими сейчас в России, и их позиция довольно забавная — не может быть фальсификаций, потому что ну это же США, там всё же честно, и вообще, все доказательства не доказательства, подождём решений суда.


А если пойти чуть дальше, это поднимает кучу других вопросов о всяком релятивизме и прочем солипсизме. Потому что у нас с вами (и у подавляющего большинства читающих этот комментарий) нет никакого способа определить, на самом деле доказательства — не доказательства, если суды их не приняли, или это суды врут. Выступает ли против Путина (против Лукашенко, за #stopthesteal) десять тыщ фриков или десять миллионов человек. Являются ли видеозаписи с участков, откуда выгоняют республиканцев/оппозицию легитимными видео, или это снято на квартирах русских хакеров/госдепа (срсли, я видел аргумент про видео о том, что республиканцам не давали быть наблюдателями, мол, «эти видео не доказательства, это постановка и русско-китайское вмешательство»). Стопроцентная явка за Путина на некоторых участках или стопроцентные бюллетени по почте на некоторых участках — на самом деле следствие того, кто каким избирателям что говорил, или таки статистически неправдоподобная ерунда.


Либо это я просто переупарывал математики, и к социальным вещам подобные методы не применимы.


Собственно, если вы такое


Доказательств нарушений было более, чем достаточно. Но уполномоченные органы просто закрыли на них глаза, или даже активно пытались скрыть информацию о них. Но это говорит только о коррупции в этих органах в данных конкретных странах.

скажете про текущие выборы в США, то вас обзовут сторонником теорий заговоров, ольгинским ботом и насуют минусов в карму. Но вот если вы такое скажете про РФ — то вы не бот, а всё понимаете.

Потому что если предлагаемый вами логический фреймворк даёт разные результаты для РФ, РБ и США при одинаковых релевантных для этого фреймворка вводных, то, очевидно, вы что-то оставляете за кадром.

А вы сейчас вообще о чём?
Я всего лишь говорю, что не может быть презумпции наличия фальсификация. Тупо потому, что такая презумпция — совершенно нелепая вещь.
И заговорил я об этом только потому, что выше в ветке человек на полном серьёзе заявляет, что наличие фальсификаций не требует доказательств, это пусть его оппоненты строго докажут отсутствие таких фальсификаций.

Нет, не настолько уж и нелепая. В выборах очень много стимулов считерить.


И человек выше говорит о немного другом тезисе.

В реальном мире выборы считаются

Считаются кем? Мной вот — не считаются.
Выборы — они, знаете, как рыба, у них бывает только первая свежесть — она же и последняя. И если выборы "с душком" — то это не выборы, это вонючее говно.


Так что вы лично, конечно, вполне себе можете верить всем этим товарищам
про честно набранные 146% на слово — для меня же это все одна тухлятина, что мумия, что усатый, что солнцеликий и свидетели чучхе.


Но глупо же утверждать, что несомненно были именно фальсификации при голосовании по почте и несомненно массовые, только на том основании что презумпция недостоверности.

Вы не забывайте один важный момент — чисто математически, в отличии от избирательных систем России или Белоруссии, где для преимущества в Х% надо вбросить Х% бюллетеней, в Америке можно получить любое сколь угодно большое преимущество любым сколь угодно малым вбросом.


Опять же, инвалидация результата в Америке существенно затруднена тем, что это ж не какая-то там Россия — камер нет, подсчеты ведутся хз где и хз как (и бюллетени каких-нибудь реднеков будет считать не местная тетя глаша, а куколд-джон в метрополии, который эти бюллетени натурально сожрет — потмоу что заворот кишок лучше, чем "literally hitler"), сколько-нибудь полная для анализа статистика отсутствует де-факто.
Так что можно творить все, что угодно — никто ничего не заметит. Ведь нет способов заметить. Если у нас-то при всей "наблюдательной мощи" умудряются десятками процентов вкидывать — то что уж говорить об Америке. А ведь надо не десятки процентов — надо зачастую какие-нибудь 0.5%.


И заговорил я об этом только потому, что выше в ветке человек на полном серьёзе заявляет, что наличие фальсификаций не требует доказательств, это пусть его оппоненты строго докажут отсутствие таких фальсификаций.

Вы упустили один важный момент — "наличие рациональных сомнений". Если их нет — ничего никому доказывать не надо, конечно.

Вы понимаете разницу между утверждениями «достоверность результатов выборов вызывает сомнение» и «наверняка имело место именно вот такая конкретная фальсификация»?
В первом случае можно полагаться на некие общие соображения и «наличие рациональных сомнений». Тут можно сколько угодно расуждать, что кандидаты — люди мутные, имели и возможность и мотивацию и т.п. И это будет вполне убедительно.
Но во втором случае это уже конкретное утверждение, которое требует конкретных аргументов.

Из более частного утверждение однозначно следует более общее, но никак не наоборот.
Вы понимаете разницу между утверждениями «достоверность результатов выборов вызывает сомнение» и «наверняка имело место именно вот такая конкретная фальсификация»?

Конечно. Точно так же как я понимаю разницу между утверждениями "эта рыба попахивает" и "эта рыба полностью протухла".
Есть я при этом ни ту ни другую не стану, т.е., хоть формально это и разные утверждения — разделять их практического смысла нет.


Выборы можно считать несостоявшимися де-факто — в этом смысл.


Потому что суть выборов — выяснить волеизлияние населения. И вы не можете утверждать, что волеизлияние населения было действительно выяснено (т.е. то, что выборы совершились) если не докажете корректность процедуры (ну или, по крайней мере, отсутствие рациональных сомнений в ее корректности).
Иными словами — считаем выборы несовершившимися, пока обратный факт не доказан. Ну как с чайником Рассела, короче — пока не доказано, что он есть, считаем, что его нет.

Ну как с чайником Рассела, короче — пока не доказано, что он есть, считаем, что его нет.

Но ведь ваша логика же как раз доказывает существования чайника Рассела. В солнечной системе крутятся миллионы разных объектов, соответственно и чайник наверняка есть. А если кто-то утверждает, что чайника нет, то пусть докажет.
Обожаю, блин, хабр.
Никого не обидел, не оскорбил, только пытался следовать идеалам рационализма в теме о политике. И мне за что-то минусуют карму.
Ну, если здесь считают, что очень конкретное утверждение не требует никаких аргументов тупо потому, что «ну это же выборы!», то не очень-то мне и нужна местная карма.

Во-первых, вы не следуете идеалам рационализма, по крайней мере, в том моменте, когда из ваших сообщений стало ясно, что выборы в РФ и выборы в США — этожедругое!


Во-вторых, не волнуйтесь, мне тоже что-то там наминусовали, и я не очень понимаю, за что.

Да, блин, вы вообще мои сообщения читали?
Где я хоть словом сказал, что выборы в РФ и США нужно как-то по разному оценивать?
Я конкретные политические реалии старался вообще не затрагивать! Я всего лишь говорил, что из более общего утверждения ещё не следует более конкретное! Это чистая логика, не политика!
Если мы знаем, что Вася — преступник, из этого ещё не следует, что кошелёк у бабы Маши вытащил именно он. Если выборы нечестные, то это ещё не значит, что можно взять и объявить, что абсолютно любое сомнение по абсолютно любому конкретному эпизоду можно считать априори доказанным.
Как, чёрт возьми, можно в здравом уме думать иначе?
Если выборы нечестные, то это ещё не значит, что можно взять и объявить, что абсолютно любое сомнение по абсолютно любому конкретному эпизоду можно считать априори доказанным.

А кто-то разве это говорил? Вы с ветряными мельницами воюете.

Тогда возвращаемся на второй круг.


Давайте тезисно, ведь чем меньше текста, тем сложнее его почитать неправильно:


  1. Достоверные ли выборы в США в 2020-м году?
  2. Достоверные ли выборы в Беларуси в 2020-м году?
  3. Достоверные ли выборы в РФ в 2012-м? В 2018-м?
  4. Достоверное ли голосование за поправки в Конституцию в РФ в 2020-м?

Можно в ответ получить пять булевских значений?

Если мы знаем, что Вася — преступник, из этого ещё не следует, что кошелёк у бабы Маши вытащил именно он.

Утверждение "Вася — преступник" не является более общим по отношению к утверждению "Вася вытащил кошелёк у бабы Маши". Это вообще не общее утверждение.

Если выборы нечестные, то это ещё не значит, что...

Совершенно аналогично.

Но ведь ваша логика же как раз доказывает существования чайника Рассела. В солнечной системе крутятся миллионы разных объектов, соответственно и чайник наверняка есть. А если кто-то утверждает, что чайника нет, то пусть докажет.

Чайник Рассела в данном случае — это прошедшие в США честные выборы. Пока мне эти честные выборы не предъявят — я считаю, что их нет. Мне пока что показывают какой-то чайник. Но без доказательства того, что его сняли с орбиты Юпитера. Я разумно делаю вывод, что чайник не с Юпитера, а из ближайшего магазина.

Вот вы опять скачете от общего к частному и не понимаете разницу.
Ещё раз: в данной ситуации можно обосновано сомневаться в честности выборов в целом. Но из этого ещё никак не следует, что по каждому конкретному эпизоду любые сомнения можно считать априори подтверждёнными.

Если продолжать метафору с космическими телами в Солнечной системе:
1. Нам известно, что между орбитами Марса и Юпитера летает туева хуча разных камней.
2. Поэтому если кто-то возьмёт какой-то конкретный достаточно большой участок между этими орбитами, и будет утверждать, что он абсолютно чистый, прозрачный и свободный от камней, то почти наверняка это неправда. Даже если про данный участок мы пока ничего не знаем, мы обоснованно предполагаем, что он в этом похож на остальные участки в этом районе космоса.
3. Если кто-то нам скажет, что наблюдал в этом участке камень такого-то размера, с таким-то альбедо и такой-то траекторией, то в целом это утверждение вполне правдоподобно.
4. Но теперь предположим, что кто-то говорит, будто никакого наблюдения вообще не нужно. Что можно просто заявить о существовании астероида конкретного размера и с конкретной орбитой в этом районе, и что такое заявление без всяких наблюдений изначально должно рассматриваться как истина. Просто потому, что в этом районе дофига камней, а значит это подтверждает существование любого камня, с любым более-менее правдоподобным набором характеристик. А если кто-то не согласен, то он, конечно же, сторонник плоской земли, и его надо заминусить.
Теперь понимаете о чём я?
Ещё раз: в данной ситуации можно обосновано сомневаться в честности выборов в целом. Но из этого ещё никак не следует, что по каждому конкретному эпизоду любые сомнения можно считать априори подтверждёнными.

Вы упорно продолжаете воевать с мельницами. Никто и не говорил, что дурно пахнущую рыбу следует считать полностью протухшей. Это два объективно разных явления. Речь шла о том, что две такие рыбы нет смысла различать с той (чисто практической) точки зрения, с которой есть не стоит ни ту, ни другую.


Т.е. да, выборы для которых факт фальсификаций доказан и те, для которых их факт существует в рамках рациональных сомнений — это разные явления. Но относится к ним следует одинаково — как к выборам, которые де-факто несостоялись, т.е. — не демонстрируют народное волеизлияние.

Вмешаюсь в ваш разговор, как сторонний наблюдатель :)

Druu, в ваших словах слишком много противоречий, именно на это обращают внимание. К примеру:
Выборы — они, знаете, как рыба, у них бывает только первая свежесть — она же и последняя.

Никто и не говорил, что дурно пахнущую рыбу следует считать полностью протухшей.
Вы уж определитесь со своей рыбой.

Ну и по поводу выборов:
У выборов есть презумпция недостоверности.
При этом доказывать недостоверность не требуется, конечно же.
Окей, допустим, доказывать недостоверность не требуется. Допустим, для круглого числа, что проголосовало 100 миллионов человек. Каков шанс на то, что среди этих сотни миллионов не найдется никого, кто бы не сказал «я считаю, что результаты подтасовали», вне зависимости от результатов этих выборов? Я думаю, что на уровне статистической погрешности. Это означает, что любая страна обречена раз за разом проводить выборы заново, до тех пор, пока их всех это настолько не заколебет, что уже пофиг, кто там будет президентом, лишь бы закончить.
Вы уж определитесь со своей рыбой.

Там нет противоречия.


Я думаю, что на уровне статистической погрешности.

Нет, не так.


Смотрите, выборы — это ни что иное, как статистическое исследование. Притом это очень важное статистическое исследование. По-этому к его анализу мы должны подходить не менее строго чем к любому исследованию, опубликованному в каком-нибудь научном журнале.


Если мы читаем статью в журнале, то мы не верим во все, что там написано просто потому, что "не доказано, что авторы что-то фальсифицровали". Мы поступаем ровно наоборот — придирчиво анализируем постановку эксперимента, условия его проведения, логику того, как делаются выводы. И если у нас есть хоть какие-то сомнения в том, что результат 100% достоверен (причем эти сомнения могут возникнуть не только изза намеренных фальсификаций — а и из-за того что авторы просто забыли что-то учесть) — то мы не считаем вывод статьи доказанным.


В случае выборов это значит — мы не считаем, что доказана победа кого-либо из кандидатов.

Смотрите, выборы — это ни что иное, как статистическое исследование.
Не совсем. В статистических исследованиях используются выборки, на основании которых делается предположение, что остальное население с некоторой вероятностью поступает так же. В выборах участвует всё население (даже те, кто не пришел — им, значит, по каким-то причинам, всё равно на результат).

Но это не важно. Важно другое. Вы часто используете слово «мы». «Мы считаем», «мы изучаем», «у нас есть сомнения» и тд. Но кто такие эти «мы»?

Допустим, автор этой статьи сделал модель, сравнил её с реальностью и решил, что было мошенничество. Это значит, по вашим словам, что не доказана победа кого-либо из кандидатов. Допустим, ему говорят, мол, вы не учли в модели такой-то параметр. Допустим, он с этим не соглашается. Что теперь будет с вашими выборами?

Представьте теперь, что у каждого кандидата есть свой поклонник. Каждый раз, когда его фаворит не побеждает, он публикует статью, где через подогнанную под свои выводы модель он доказывает, что была фальсификация. Неважно уже, были выборы честными или нет — «вы» каждый раз будете решать, что победа кого-либо из кандидатов не доказана.

Почему я это пишу, потому что у меня очень яркие воспоминания. Есть на том же хабре один человек, не фрик конечно, но несомненно пристрастный по поводу коронавируса. Примечателен он тем, что раз за разом писал статьи со статистикой и исследованиями, полные фактических ошибок. При этом он учитывает только то, что подтверждает его точку зрения, а контраргументы пропускает мимо ушей. Каждый раз в комментариях разбирают его ошибки и каждый раз через некоторая время выходит новая статья, в которой снова по кругу идут те же самые ошибки.

Если в стране, в которой проходят выборы, найдутся хотя бы два подобных человека с противоположными мнениями — наступит коллапс.

На мой взгляд, результат выборов считается невалидным только в двух случаях — либо если есть доказанные случаи фальсификации, либо если большая часть населения выходит на улицы. Если говорить про нашего соседа — это яркий пример: люди спрашивают друг друга, понимают, что никто из них не голосовал за победившего кандидата, начинают возмущаться и это возмущение расходится по всей стране.
Если в стране, в которой проходят выборы, найдутся хотя бы два подобных человека с противоположными мнениями — наступит коллапс.

Почему же коллапса ещё не наступило в науке, которая работает именно так?


либо если большая часть населения выходит на улицы

Больша́я или бо́льшая?


люди спрашивают друг друга, понимают, что никто из них не голосовал за победившего кандидата

Статистическая сила таких проверок ещё меньше, чем рисование разных графиков.

Почему же коллапса ещё не наступило в науке, которая работает именно так?
Потому что вы пытаетесь троллить, вот почему. Что именно в науке рабоатет именно так?

Больша́я или бо́льшая?
Сначала больша́я, потом бо́льшая.

Статистическая сила таких проверок ещё меньше, чем рисование разных графиков.
Да ну? А настроение окружающих людей никто не видит?

Вы голосовали за А, но победил Б. Вы считаете, что это довольно странно, ведь окружающие вас люди тоже голосовали за А. Подозрения укрепляются, вы начинаете уже целенаправленно опрашивать людей. Вы узнаете, что в вашем избирательном участке за Б проголосовало только несколько человек, хотя в официальных данных написано, что за Б проголосовало подавляющее большинство. Другие люди на других участках приходят к подобным выводам. Вы устраиваете голосование по интернету, где каждый пишет номер своего участка и за кого он голосовал. Вы выходите на улицу и вся страна вас поддерживает. Вы убеждаетесь, что да, голосование действительно подделали.
Потому что вы пытаетесь троллить, вот почему. Что именно в науке рабоатет именно так?

Как писал Druu. В науке тоже есть противоборствующие школы, подковёрная грызня и прочие замечательные вещи.


Сначала больша́я, потом бо́льшая.

Замечательно. Тогда выборы в США невалидны: на митинги и протесты #stopthesteal выходит больша́я куча людей.


Да ну? А настроение окружающих людей никто не видит?

А это только для выборов работает или и для каких-нибудь других вещей тоже? Если вокруг меня никто не болеет ковидом, то ковида нет?


Вы узнаете, что в вашем избирательном участке за Б проголосовало только несколько человек, хотя в официальных данных написано, что за Б проголосовало подавляющее большинство.

В официальных данных по этому же участку? А я точно опросил всех? Как я могу это сделать, если я даже не факт что знаю их адреса?


Знаете, у меня довольно много политически активных знакомых в РФ, которые и наблюдателями на выборах были, и на протесты ходили, но самостоятельными опросами из них не занимался никто. И никто не знал кого-то ещё, кто занимался такими опросами.


Другие люди на других участках приходят к подобным выводам. Вы устраиваете голосование по интернету, где каждый пишет номер своего участка и за кого он голосовал. Вы выходите на улицу и вся страна вас поддерживает. Вы убеждаетесь, что да, голосование действительно подделали.

Как говорится, кул стори, бро. Где конкретно этот сценарий реализовывался за последнее время?

В науке тоже есть противоборствующие школы, подковёрная грызня и прочие замечательные вещи.
Грызня есть много где.

В науке можно годами и десятилетиями не принимать новую теорию и перепроверять там всё раз за разом. Так, в общем-то, там и происходит по умолчанию. Но часто ли вы видели, как какая-нибудь страна остается без правительства лет так на 5 хотя бы? Не говоря уже о том, что в науке срок действия отдельно взятой теории не ограничен четырем годам.

А еще наука — это больше аналог феодального строя. Право голоса там имеют лишь ученые, которых выбрали другие ученые. Представьте, если за каждую научную теорию будет идти голосование всего населения мира.

Как говорится, кул стори, бро. Где конкретно этот сценарий реализовывался за последнее время?
Беларусь, к примеру. Запустили интернет-голосование, поняли, что их по полной на… дурили, вышли на улицы, к ним присоединилось остальное население. Теперь в факте подделки результатов там не сомневается практически никто.

Игра «а вы докажите», в которую предлагают (не вы, впрочем) играть, увлекательная, и в неё можно играть во все стороны.


Запустили интернет-голосование, поняли, что их по полной на… дурили, вышли на улицы

Как проверить, что цифры в интернет-голосовании не подделаны?


к ним присоединилось остальное население.

Как проверить, что вышло на самом деле всё население, или хотя бы большинство населения, а не несколько тысяч или десятков тысяч человек?


А что до науки…


В науке можно годами и десятилетиями не принимать новую теорию и перепроверять там всё раз за разом. Так, в общем-то, там и происходит по умолчанию.

Но там и требования к статистической значимости таки повыше, но это не мешает применять тот же философский подход.

Как проверить, что цифры в интернет-голосовании не подделаны?
А оно не для проверки на самом деле, оно для объединения. Если за А там проголосуют 150 миллионов, а выйдет потом на улицу 15 человек, значит, можно возвращаться по домам.

Как проверить, что вышло на самом деле всё население, или хотя бы большинство населения, а не несколько тысяч или десятков тысяч человек?
Это из тех филосовский вопросов вроде «как проверить, что ваза, пока я на неё не смотрю, не превращается в это время в кота»? Если вы настолько оторванный от реальности философ, что не верите даже своим глазам, то вам уже ничего не поможет :)

Но там и требования к статистической значимости таки повыше, но это не мешает применять тот же философский подход.
Знаете, что мне это напоминает? Как если бы я сказал, что концентрированную серную кислоту нельзя наливать в пластиковые стаканчики, а в ответ вы начнете говорить что-то вроде «но ведь в пробирках всё нормально, а это тоже ёмкость, куда можно что-то налить». Если вы на полном серьезе утверждаете, что выборы ничем не отличаются от науки, то поищите себе другого пациента.
А оно не для проверки на самом деле, оно для объединения.

Отталкиваться от ложных цифр в таком деле — это уже хорошее начало!


Это из тех филосовский вопросов вроде «как проверить, что ваза, пока я на неё не смотрю, не превращается в это время в кота»? Если вы настолько оторванный от реальности философ, что не верите даже своим глазам, то вам уже ничего не поможет :)

Нет. Просто я не могу определить, вышло на улицы сто тысяч человек, миллион человек или (гуглю население Беларуси…) пять миллионов человек.


Если вы на полном серьезе утверждаете, что выборы ничем не отличаются от науки, то поищите себе другого пациента.

Если вы хотите спорить с соломенными чучелами, то поищите себе другого пациента.


Вы определитесь с целью — вам волеизъявление народа определить, или чтобы в администрации кто-то был? Похоже, что скорее второе, так что почему бы вам просто не подкинуть монетку? Орёл — Байден, решка — Трамп. Если достаточному количеству людей не понравится, то они выйдут на улицы и всё такое. Зачем этот промежуточный цирк с голосованием, агитацией, подсчётом голосов? Только трата ресурсов.

Вы определитесь с целью — вам волеизъявление народа определить, или чтобы в администрации кто-то был? Похоже, что скорее второе, так что почему бы вам просто не подкинуть монетку? Орёл — Байден, решка — Трамп. Если достаточному количеству людей не понравится, то они выйдут на улицы и всё такое. Зачем этот промежуточный цирк с голосованием, агитацией, подсчётом голосов? Только трата ресурсов.
Учитывая, что они идут практически ноздря в ноздрю, так оно и есть. Я, в общем-то, больше говорю о ситуациях, когда реальное распределение на уровне 90-10 или там 70-30 не в пользу существующей власти.
Учитывая, что они идут практически ноздря в ноздрю, так оно и есть.

За последние 20 лет именно так и было каждый раз, а не только в эти выборы. Самый большой разрыв был в 2008-м году, когда один кандидат получил 52.9% голосов, а другой — 45.7%.


Короче, думаю, по результатам этих 20 лет выборы можно впредь отменить.

Вот вы наверное шутите, а я всерьез об этом задумался. Понятно, что демократия — это когда большинство указывает меньшинству. Это не идеально, но терпимо — грубо говоря, десять человек важнее одного. Но когда большинство больше меньшинства всего на несколько процентов — это какая-то дичь.

Какая-то дичь — это по факту двухпартийная система, когда люди голосуют не за наиболее им нравящихся из всех, а за наименее ненравящихся из мейнстрима.

Не совсем. В статистических исследованиях используются выборки, на основании которых делается предположение, что остальное население с некоторой вероятностью поступает так же. В выборах участвует всё население

Неверно. В выборах тоже участвует только часть населения — те, собственно, кто пришел на выборы. Более того — есть даже кое-где такая штука как "порог явки", которая явно указывает характеристику данный выборки, при неудовлетворении которой исследование считается невалидным.


Вы часто используете слово «мы». «Мы считаем», «мы изучаем», «у нас есть сомнения» и тд. Но кто такие эти «мы»?

Ну, анафора, как обычно.


и решил, что было мошенничество

Не решил.


Неважно уже, были выборы честными или нет — «вы» каждый раз будете решать, что победа кого-либо из кандидатов не доказана.

Ну да, если претензии осмысленны и ответа на них нет. А почему это проблема?


Примечателен он тем, что раз за разом писал статьи со статистикой и исследованиями, полные фактических ошибок

Ну, основной корпус фактов у него был как раз валидный, придирались там в комментах по большей частью к вещам, которые вообще не влияли на выводы.


Если в стране, в которой проходят выборы, найдутся хотя бы два подобных человека с противоположными мнениями — наступит коллапс.

В науке же почему-то не наступает, хотя там вообще есть специальные люди, у которых работа такая, придираться к исследованию, — "рецензенты" называются.


На мой взгляд, результат выборов считается невалидным только в двух случаях — либо если есть доказанные случаи фальсификации, либо если большая часть населения выходит на улицы.

Фальсификации есть всегда (ну, кроме выборов в северной Корее), вопрос в том, повлияли они или нет — а это уже доказать нельзя. Что до выхода — выходы населения можно обеспечить всегда, когда у вас за кандидата проголосовало ну хотя бы 10%. За Трампа, напоминаю, по офиц. данным проголосовала почти половина Америки. Так что люди точно так же там могут ходить, спрашивать у знакомых и "ну вот, все за Трампа", и найти людей на митинги — тоже не проблема, кто-то же ходил на митинги за Трампа во время избирательной компании? Аналогичная ситуация была бы и с "победой" Байдена. Так что у вас, простите, очень хреновые критерии. Я буду все же придерживаться научного подхода, а не магического.

В том то и прикол выборов в Америке что там 50 на 50 почти всегда расклад. Если перевес в пару голосов, то тут и без умышленных фальсификаций проблема, потому что от человеческих ошибок при подсчёте никто не застрахован.


Если же как в беларуси пытаться накрутить себе +50% т.е. сфальсифицировать половину голосов, то тут достаточно очень грубой выборки (например того десятка участков где посчитали бюллетени на камеру) чтобы понять результат. Экзитполы и соц исследования перед выборами, обычно дают погрешность в пределах 3 процентов.


Такую же логику можно привести и к фальсификациям, если наблюдатели были почти на всех участках и в 90% у них нету претензий, то значит и фальсификаций было не много.


В любом случае выборы строятся на доверии. Можно сидеть в коментах в интернете на выборы не ходить и никому не верить, — тоже позиция. Но если вы голосуете за партию, следовательно ей доверяете, следовательно доверяете её наблюдателям, и их мнению на счёт того как прошел процесс. Очевидно что лично посчитать все голоса и лично всё проконтролировать возможности принципиально нету, так что я категорически не понимаю болтовню которую тут разводят философы про верю/не верю.

так что я категорически не понимаю болтовню которую тут разводят философы про верю/не верю.

Ну вы ж сами пишете:


В любом случае выборы строятся на доверии.

Но если вы голосуете за партию, следовательно ей доверяете, следовательно доверяете её наблюдателям, и их мнению на счёт того как прошел процесс.

А тут, например, Вася, который голосовал за R и за Трампа в частности, верит этому и называет статейки в WaPo/NYT/CNN фейк ньюсами. Петя, голосовавший за D и за Байдена, говорит, что Кейли — заинтересованное лицо, иски бред, показания под присягой бред, а CNN вместе с твиттором говорят правильные новости, и Байден уже давно господин избранный президент.


И нет никакого способа сказать, кто из них на самом деле прав.

А телефоны с камерами они по какой причине не пользуются, интересно почему?


saw batch of ballots, 60% had SAME signature

почему нельзя показать эти подозрительные бюллетени? Вторая сторона отказывается?


saw ballot batch scanned 5 times

вторая сторона должна быть согласна на пересчёт на этом участке. Если это заявляется на 1000 участков, до для проверки достаточно пересчитать на какой то выборке.


Если обе стороны специально идут на конфликт, то лично я бы выписал этим деятелям билет в одну сторону. Но в сша двух партийная система так что логика выборов из нормальных стран не работает. Интересно фальсификации (если они есть) это новая фишка этих выборов или раньше о них просто молчали (если они были) или это фишка Трампа их придумать (если их нет)?

А телефоны с камерами они по какой причине не пользуются, интересно почему?

Пользуются. Только вот я результаты этих съёмок не привожу — ну показано, как кто-то перекладывает бюллетени из одной кучки в другую. Откуда я знаю, плохо это или хорошо? Наблюдателем в американских выборах я никогда не был, поэтому для меня это доказательством нарушений не является, поэтому, собственно, я это и не привожу.


И на соседнем ресурсе мне уже писали, что это снято на квартирах Госдепа постановка.


почему нельзя показать эти подозрительные бюллетени? Вторая сторона отказывается?

Да.


вторая сторона должна быть согласна на пересчёт на этом участке. Если это заявляется на 1000 участков, до для проверки достаточно пересчитать на какой то выборке.

Ну да. Вторая сторона вообще себя ведет немного подозрительно. Вторая сторона по-хорошему должна сказать «проводите аудит выборов хоть в хвост и в гриву, проблем нет», а на деле «Трамп проиграл вы sore losers примите копиум)))», ну и Байден, идентифицирующий себя как president-elect (чего он делать не имеет права, так как официально выборы нифига не закончились, и, более того, чем вот просто сходу нарушающий предвыборные обещания ещё до инаугурации — во время дебатов у него прямо про это спрашивали).


Интересно фальсификации (если они есть) это новая фишка этих выборов или раньше о них просто молчали (если они были) или это фишка Трампа их придумать (если их нет)?

Можно снова вспомнить 2016-й и крики демократов про то, что русские хэккеры похэккали выборы. Я видел доказательства наличия фальсификаций и ещё до того, но сейчас их не найду (да и масштабы вроде были поменьше).

Только вот я результаты этих съёмок не привожу — ну показано, как кто-то перекладывает бюллетени из одной кучки в другую. Откуда я знаю, плохо это или хорошо?

Интересен же ход развития событий дальше. Возникает ли конфликт после того что кто-то сделал подозрительное что-то; прибегают ли воинственные черные трансгендеры от демакратов и мешают проводить съемку дальше; или наоборот вежливо показывают что то были за пачки и за кого в них голоса?

Возникает ли конфликт после того что кто-то сделал подозрительное что-то; прибегают ли воинственные черные трансгендеры от демакратов и мешают проводить съемку дальше

Там стримы с веб-камер, тяжко мешать. Но, опять же, мне не хватает знаний, чтобы сказать, легитимные ли действия на стримах или нет.


Впрочем, ну, вот, например, есть несколько видео (пример), как заколачивают окна типа избирательного участка. Я даже это не привожу как пример, так как непонятно, что это, где это, и на самом ли деле это ballot counting center — это не проходит мой собственный фактчекинг.


Но вот, кстати, что интересно, что об этом пишет CNN:


But Lawrence Garcia, an attorney for the City of Detroit, said that the windows were partially blocked because of concern voter information could be wrongfully revealed to the public. Those concerns were compounded by the fact that protesters standing outside the ballot-counting area were taking photographs and recording video.

Серьёзно? Там до столов несколько метров, они CSI обсмотрелись, что ли? Как там можно что-то разглядеть? И как тогда быть со стримами с камер наблюдения?


Одно такое поведение СМИ для меня поднимает больше флажков, чем видео.


А, ну и заголовок статьи хороший. Right-winger'ом в США нынче быть хуже педофила.

так как непонятно, что это, где это, и на самом ли деле это ballot counting center

вроде обе стороны признали что это там


Там стримы с веб-камер, тяжко мешать.

А зачем тогда через окно смотреть, если и так везде камеры — не понятно. А зачем окно закрывать — ещё более не понятно.


Там до столов несколько метров, они CSI обсмотрелись, что ли? Как там можно что-то разглядеть?

Если ничего нельзя разглядеть, то зачем снимать? Чтобы это понять надо знать процедуру подсчёта опять же, и что там на бюллетенях написано и куда эту информацию вводят.


Сми типа CNN очевидно топят за своих.


Там интереснее другое


Only the media is allowed to take pictures inside the counting place, and people outside the center were not listening to requests to stop filming poll workers and their paperwork.

Что такое медиа в 2020 году абсолютно не понятно, и довольно глупо их отделять от обычного человека с камерой. С другой стороны если там персональные данные — то надо иметь возможность отслеживать людей которые их потенциально могут слить.

А зачем тогда через окно смотреть, если и так везде камеры — не понятно. А зачем окно закрывать — ещё более не понятно.

Потому что камеры могут внезапно отключиться и всё такое. Запись с них может пожрать долгоносик. И да, это бывает не только в РФ в нескольких сотнях метров от Кремля, но и в том же США (про Эпштейна я тут рядом уже вспоминал).


Если ничего нельзя разглядеть, то зачем снимать? Чтобы это понять надо знать процедуру подсчёта опять же, и что там на бюллетенях написано и куда эту информацию вводят.

Не знаю, от одной съёмки смысла действительно мало. Но тут действительно интереснее смысл реакции на неё.


Что такое медиа в 2020 году абсолютно не понятно, и довольно глупо их отделять от обычного человека с камерой. С другой стороны если там персональные данные — то надо иметь возможность отслеживать людей которые их потенциально могут слить.

Включая считающих эти бюллетени, кстати.


Интереснее ещё вот что. Типа сейчас ручной подсчёт в Джорджии. Внушает доверие, да?

Потому что камеры могут внезапно отключиться и всё такое.

Ну там же внутри тоже есть пресса с камерами, в том числе и республиканцев — или нет?


Типа сейчас ручной подсчёт в Джорджии.

Расстояние до ближайшего стола метра три. А дальних не видно вообще. Если бы наблюдатели были на балконе, то с хорошей оптикой можно было бы всё видеть :) На самом деле зависит от того что там за люди внутри, думаю достаточно по три человека за каждым столом: тот что считает и наблюдатели. Всех желающих пускать тоже не получится.


Вообще я удивлён что такие большие залы для — это считают голоса скольки человек там?


Включая считающих эти бюллетени, кстати.

Я думаю и пресса и наблюдатели и счетоводы регистрируются, а вот прохожие — нет.

Серьёзно? Там до столов несколько метров, они CSI обсмотрелись, что ли? Как там можно что-то разглядеть?
Несколько метров? Какой тут CSI, достаточно просто камеры с зум-объективом.
Причём, даже не таким

А с трёх метров можно даже отпечатки пальцев подделать.
И как тогда быть со стримами с камер наблюдения?
А что с ними? Плохое качество видео? Так вебкамеры, во-первых, видео вещают, а не фото делают, во-вторых, ещё и пережимают при отправке в интернет. Много ли вы видели веб-камер, которые снимали бы видео качеством хотя-бы как средней цены мобильник?
Ещё про камеры и окна: на российских выборах, например, вебкамеры ставили так, чтобы в кадр не попадали персональные данные избирателей.
Ещё про камеры и окна: на российских выборах, например, вебкамеры ставили так, чтобы в кадр не попадали персональные данные избирателей.

А как можно убедиться, что, условно, галочку с бюллетеня в протокол правильно скопировали, но не словить данные?

В российских бюллетенях нет ПД, только кандидаты, галочки и подписи членов УИК. Как оно в Штатах — не знаю.
Несколько метров? Какой тут CSI, достаточно просто камеры с зум-объективом.

А, ну это хороший повод избегать наблюдателей, да. Ещё можно потребовать аппрувала ФБР (ну или какого-нибудь МВД в нашем случае). Вспоминая, как я получал справку о несудимости для бекграунд чека, это отсеет много желающих наблюдать.


А что с ними? Плохое качество видео?

Напротив, хорошее.


Много ли вы видели веб-камер, которые снимали бы видео качеством хотя-бы как средней цены мобильник?

Я видел несколько записей с этих выборов, где на некоторых столах (самых близких к камере) можно было рассмотреть содержимое бюллетеней.

А, ну это хороший повод избегать наблюдателей, да.
Вы под «наблюдателями» любых посторонних людей подразумеваете тут, что ли? Я под «наблюдателями на выборах» понимаю специальных людей, уполномоченных на то.
Я видел несколько записей с этих выборов, где на некоторых столах (самых близких к камере) можно было рассмотреть содержимое бюллетеней.
На американских бюллетенях есть ПД?
Вы под «наблюдателями» любых посторонних людей подразумеваете тут, что ли? Я под «наблюдателями на выборах» понимаю специальных людей, уполномоченных на то.

Ну вон CNN пишет, что уполномочены, например, медиа.


На американских бюллетенях есть ПД?

Они есть как минимум на конвертах для mail-in ballots (вокруг которых большая часть драмы) — там подпись и адрес. Подпись должна сличаться с подписью в заявлении на регистрацию на голосование по почте, и, насколько я понимаю процесс подсчёта, они неизбежно попадут в кадр, так как должны быть видимы тому, кто подсчитывает голоса.

В том то и прикол выборов в Америке что там 50 на 50 почти всегда расклад. Если перевес в пару голосов, то тут и без умышленных фальсификаций проблема, потому что от человеческих ошибок при подсчёте никто не застрахован.

Ну т.е. вы утверждаете, что мы не можем принимать результаты выборы даже при отсутствии фальсификаций?

Там же разница в 1%, т.е. тысячи голосов. Значит просто ошибка вряд ли повлияет а вот не очень большие фальсификации могут.

Значит просто ошибка вряд ли повлияет

Почему? Это же система выборщиков. Достаточно пары сотен голосов, чтобы 90%-10% поменять на 10%-90%

голоса ~600 выборщиков можно посчитать и пересчитать хоть 10 раз в течении пары часов и получить однозначный ответ.

Не, дело не в этом. Представим себе гипотетическую Калифорнию, где 55 выборщиков, и где за Трампа проголосовало 20000100 человек, а за Байдена — 20000000. Тогда достаточно Байдену накинуть 101 голос, чтобы все 55 голосов ушли Байдену, а не Трампу.

Это понятно. По факту там разница получается чаще в 1% т.е. это тысячи голосов и больше. Этот же ответ и для Druu

Так я про обычные голоса.
Смысл в том, что вам для того, чтобы получить голоса всего штата, нужен перевес в 1 голос. С-но, нужно 50 голосов, чтобы получить 100% на выборах. А если эти 50 голосов перекинуть к другому кандидату — то уже он выиграет, и тоже со 100% голосов.

Мне пока что показывают какой-то чайник. Но без доказательства того, что его сняли с орбиты Юпитера.

https://youtu.be/js7M0HkYozA?t=66

А вообще, подтверждения у этой гипотезы есть какие-то?
Опросы проводили, ещё до выборов, в августе

Все бы хорошо, вот только модель абсолютно неправильная. Вы делаете вывод, что


Итак, давайте считать, что голос каждого избирателя в Джорджии похож на бросание монеты, благо вероятность успеха (за Трампа) или неудачи (за Байдена), если судить по посчитанным 95% бюллетеней, практически равны.

В данном случае не равны, т.к. голоса, поданные лично, учитываются в момент подачи автоматически, а голоса по почте обрабатываются позже. С учетом того, что Байден агитировал своих избирателей голосовать по почте, а Трамп — лично, логично будет предположить что по почте будет гораздо больше голосов первого, чем второго.


Но даже если считать, что оставшийся один процент — это голоса поданные лично, все равно такая модель не будет корректной т.к. округа делятся на "синие" и "красные" с учетом социальной и расовой специфики, поэтому смотреть надо больше на то, как проголосовали в прошлом жители конкретного округа.

Вот вот, и окончательный результаты в округах считаются с разной скоростью, вполне бывает такое, что «красные» округа уже зарепортили 99% результатов, а «синие» только 90%.
«Процент» — это предсказываемая величина, так как никто не знает точного количества отправленных бюллетеней. Поэтому при большой явке это число может быть больше 100%, просто на картах голосования эту цифру ограничивают 99%.
А не должны они сначала регистрироваться, прежде, чем отправлять голос по почте? При личной явке на участок можно зарегистрироваться на месте. Отсюда, вроде бы, возникли пресловутые 114% явки, как бы, баг программистов.
Bloomberg News is estimating the percentage of total votes that have been counted using our own turnout model. This number is more difficult to calculate than in past years because of how many people chose to vote absentee or by mail instead of at their precinct on Election Day.

Even when the vote totals reach 100%, it doesn't necessarily mean that the count is final. Values can exceed 100% when turnout is higher than the model estimated. Right now, total vote estimates assume historic voter turnout, but this assumption may change throughout the night in response to early turnout reports.
Причем тут bloomberg news? Там проценты считаются от зарегистрированных людей.

И существенную разницу между голосами за президента и за сенат оно не объясняет.
Там проценты считаются от зарегистрированных людей.
Где «там», простите?

В явке. Впрочем, вы изначально обсуждали процент посчитанных бюллетеней, но потом начали обсуждать явку, да, что могло вызвать неоднозначность.

И это нормально, так как красные округа в основном это suburban areas где живет гораздо меньше людей. Города практически всегда демократические, и там живет большинство людей штата, но и считается дольше.

Еще необходимо учитывать, что прогнозы строить в США помогает регистрация избирателей и праймериз. Вы получаете информацию сколько людей собираются голосовать за одного и за другого кандидата, сильно заранее, поэтому не всегда ждут полного подсчета голосов, что бы объявить о результате. Дополнительно, при голосовании по почте в отдельных штатах надо запросить бюллетень, что тоже дает информацию о том кто будет как голосовать.

У них очень сложная система и довольно разнородная, но работающая.

rinaty
— средний класс и богатые больше за республиканцев чем бедные
— безработные больше за демократов, чем те кто имеет работу
А как тогда получается, что с колледжным образованием и выше в основном за демократов? Средний класс и богатые это необразованные люди? Или это ваше представление, а не статистика?
что с колледжным образованием и выше в основном за демократов

безработные больше за демократов, чем те кто имеет работу

ИМХО все сходится.
с колледжным образованием и выше в основном за демократов
безработные больше за демократов, чем те кто имеет работу

ИМХО все сходится.

По вашему Angmarets в США безработные большей частью состоят из людей с высшим образованием?! *фейспалм*
А редненки и хиллибилли — это никакой не white trash, а настоящие богачи?
image

PS именно поэтому вы утверждаете, что программеру не нужны ни высшее образование, ни какая-либо математика? (логика является разделом математики)
смешались в кучу люди кони.
Коледжное образование это не только программирование но и модные нынче gender studies, liberal arts и прочая хрень.
Программеры бывают разные. Для клепания форм и крадов на кровавом энтерпрайзе не нужны особо ни математика ни высшее образование.
В разработке ПО для 3D графики, высоконагруженных систем и т.д. математика нужна.
(логика является разделом математики)

и? Я закончил универ по специальности компьютерные науки. Логику нам не преподавали. Выходит не нужна она на специалисту по компьютерным наукам.
А редненки и хиллибилли — это никакой не white trash, а настоящие богачи?

Приметрно на том же уровне доходов как и вчерашние студенты, пишущие очередной «прорывной стартап» в старбаксе, цедя один стакан кофе весь день, мечтая одновременно и подороже продаться фейсбуку и побороть проклятых капиталистов.
Не вижу противоречий. Мем про бесполезность высшего образования появился на реддите не на пустом месте
пример мема, осторожно, местами немного грубо
image

PS именно поэтому вы утверждаете, что программеру не нужны ни высшее образование, ни какая-либо математика? (логика является разделом математики)

Большинству программистов действительно не нужно не высшее образование, ни какая-либо математика. Булева алгебра на школьном уровне не требует 4-6 лет протирания штанов.

Когда анализируют выборы в России приводят статистику по участкам, строят распределения, выискивают аномалии. А по США есть похожая статистика, чтобы тоже можно было аномалии поискать?
Вы бы ещё камеры и независимых наблюдателей попросили. У них там демократия, а не вот это вот, что у нас!

Для США даже общий список избирательных участков тяжело создается, "There is no national public database of polling place locations and addresses for past federal elections.", есть общественные проекты сбора адресов для части штатов (около 30) — https://github.com/publici/us-polling-places


На федеральном EAVS (https://www.eac.gov/research-and-data/datasets-codebooks-and-surveys) похоже выкладывают только суммы по округам (6,500 local election jurisdictions), https://www.eac.gov/sites/default/files/eac_assets/1/6/EAVS_Codebook_2016.pdf (каждый округ сообщает суммы и число его precint и polling place — D1a D2a). Местами данные в EAVS неполны — https://medium.com/mit-election-lab/filling-in-the-gaps-fffd01758053 (average data completeness rate… 97%.)


На странице https://libguides.princeton.edu/elections собраны ссылки на архивы данных, в частности на https://electionlab.mit.edu/data у которых есть в том числе данные с точностью до округов (county) (3 тысячи) и до precint, например 2016 год — 0.5 ГБ https://dataverse.harvard.edu/dataset.xhtml?persistentId=doi:10.7910/DVN/LYWX3D (https://dataverse.harvard.edu/dataverse/electionscience). Некоторые СМИ также собирают данные, например по 2016 году карта по precint https://www.nytimes.com/interactive/2018/upshot/election-2016-voting-precinct-maps.html

Вот какую-то статистику посчитали. Интересно, кстати, услышать мнение тех, кто говорит, что наблюдаемое поведение с mail-in ballots нормально.

И что там не так? Что в mail-in преобладает Байден, а если почту подвозят неравномерно, то и на графике разрывы?

Не так то, что соотношение голосов за Байдена и за Трампа даже в mail-in-бюллетенях меняется со временем (иногда — скачкообразно), для чего модель придумать сложно (кроме вбросов).

Ткнёте, где конкретно там в этой простыне твитов такой подтверждается? А то я там вижу только графики суммы всех подсчитанных голосов. И сумма меняется скачками, да — потому что распределение в сумме не такое, как в мейл-инах, а мейл-ины считают пачками.
Не очень понял, откуда он взял, что это подсчёт исключительно почтовых голосов, а не сумма всех подсчитанных голосов с участка — и если на участке как раз подсчитали пачку свежеподвезённых почтовых голосов с другим соотношением, то общая пропорция в очередном докладе об очередном батче подсчёта получит скачок.
Кроме того, фразы типа «нигде в стране больше так нет … кроме других штатов, которые я тоже подозреваю в махинациях» Ну это же фейспалм, «это махинация, потому что нигде так нет… точнее, есть, но это не считается, потому что их я тоже подозреваю. Подозреваю потому, что они такие же, как те, которые подозреваю из-за того, что они такие же».
Не очень понял, откуда он взял, что это подсчёт исключительно почтовых голосов

Потому что голоса вживую считаются раньше, днём. Участки закрываются в 8 вечера, что ли, поэтому за пару часов после этого досчитывается большинство бюллетеней, отданных вживую.


а не сумма всех подсчитанных голосов с участка

Потому что он так обработал данные?


и если на участке как раз подсчитали пачку свежеподвезённых почтовых голосов с другим соотношением, то общая пропорция в очередном докладе об очередном батче подсчёта получит скачок.

Ещё раз, это распределение голосов в каждом следующем батче.


Если бы эти скачки прыгали вокруг одной горизонтальной оси, как здесь:



то никаких вопросов, да. В самом начале люди голосуют вживую из разных слоёв, поэтому там точки раскиданы как угодно. Потом начинают обрабатывать почтовые бюллетени, и там выборка на самом деле случайная, и кривая получается очень ровной (даже слишком ровной, на мой вкус, ну да ладно).


Но потом мы видим такое:



где в какой-то момент (как раз после известного завезения кучи бюллетеней в 2:40 ночи) тупо меняется соотношение (а оно не должно меняться). И выглядит это так, будто в каждый настоящий батч тупо подмешивают фиксированную порцию бюллетеней за Байдена.


Кроме того, фразы типа «нигде в стране больше так нет … кроме других штатов, которые я тоже подозреваю в махинациях» Ну это же фейспалм, «это махинация, потому что нигде так нет… точнее, есть, но это не считается, потому что их я тоже подозреваю. Подозреваю потому, что они такие же, как те, которые подозреваю из-за того, что они такие же».

Так можно возразить на что угодно.

Потому что голоса вживую считаются раньше, днём. Участки закрываются в 8 вечера, что ли, поэтому за пару часов после этого досчитывается большинство бюллетеней, отданных вживую.
Эмм, вы когда-нибудь в подсчёте этом участвовали? Я на УИКе дважды работал, и раньше полуночи ничего не заканчивалось даже без почтовых голосов.
Потому что он так обработал данные?
С участка поступают данные обо всех бюллетенях, обработанных за данный промежуток времени, а не только почтовых.
Ещё раз, это распределение голосов в каждом следующем батче.
Да, и пропорция почтовых голосов к не-почтовым в каждом батче разная. И пропорция может скачком поменяться, если подвезли большую партию почты.
тупо меняется соотношение (а оно не должно меняться)
Как я написал выше, может — «сложных» бюллетеней и без почты хватает, и их тоже считают после остальных, вместе с почтовыми. Соответственно, если в них пропорции голосов не такие, как в почтовых, то при подвозе большого батча почты суммарные пропорции голосов меняются тоже скачком.
Так можно возразить на что угодно.
Вы хорошо свою аргументацию описали, в данном случае. Про что угодно можно написать «Х всегда верно, кроме случаев, когда оно неверно, но такие случаи мы рассматривать не будем, потому что Х всегда верно».
Эмм, вы когда-нибудь в подсчёте этом участвовали? Я на УИКе дважды работал, и раньше полуночи ничего не заканчивалось даже без почтовых голосов.

Поэтому к outlier'ам после закрытия вопросов нет.


С участка поступают данные обо всех бюллетенях, обработанных за данный промежуток времени, а не только почтовых.

Конечно. Но если обрабатываются в большинстве своём почтовые, то с участка будут поступать данные о в большинстве своём почтовых бюллетенях.


Да, и пропорция почтовых голосов к не-почтовым в каждом батче разная. И пропорция может скачком поменяться, если подвезли большую партию почты.

К тому моменту обрабатывались уже почти целиком почтовые голоса. Пропорция не может скачком поменяться без существенного изменения статистических параметров выборки, откуда семплятся голоса.


Как я написал выше, может — «сложных» бюллетеней и без почты хватает

И этому утверждению, конечно, доказательства не нужны.


Про что угодно можно написать «Х всегда верно, кроме случаев, когда оно неверно, но такие случаи мы рассматривать не будем, потому что Х всегда верно».

Не понял, где это я этим пользовался.


Вы хорошо свою аргументацию описали, в данном случае.

В данном случае все голосования всегда валидны, включая голосование в Беларуси этим летом. Не понимаю, чего там люди бунтуют, всё честно посчитано же, доказательств нарушений нет.

И этому утверждению, конечно, доказательства не нужны.
Где-то, вроде, и тут уже писали про проверки бюллетеней?
К тому моменту обрабатывались уже почти целиком почтовые голоса.
А вот этому утверждению у вас доказательства, конечно же, есть?
Не понял, где это я этим пользовался.
Пардон, это не ваша, это товарища по вашей ссылке:
Again, this should not happen, and it is observed almost nowhere else in the country, because all of the ballots are randomly shuffled in the mail system and should be homogeneous during counting. The only exceptions to this are other suspect states that also have anomalies.
Где-то, вроде, и тут уже писали про проверки бюллетеней?

Сложных? Которых и без почты хватает? В достаточных объёмах, чтобы дать наблюдаемые результаты?


Ещё раз, к любым наблюдаемым данным можно подогнать начальные условия. Вопрос исключительно в вероятностях, о чём и идёт разговор. Если для вас наблюдаемые результаты вероятностно приемлемы, то я ожидаю увидеть ваши негативные комментарии в анализе следующих выборов в более близких нам странах.


А вот этому утверждению у вас доказательства, конечно же, есть?

Да, описание процесса выборов от разных наблюдателей, включая не просто анонимусов из интернета, но и представителей сенаторов, attorney general'ов по штатам и так далее.


Пардон, это не ваша, это товарища по вашей ссылке:

Вы видите разницу между «Again, this should not happen, and it is observed almost nowhere else» и «Again, this should not happen, because it is observed almost nowhere else»?

Да, описание процесса выборов от разных наблюдателей, включая не просто анонимусов из интернета, но и представителей сенаторов, attorney general'ов по штатам и так далее.
И именно с таких участков, на которых наблюдались скачки?
Вы видите разницу между «Again, this should not happen, and it is observed almost nowhere else» и «Again, this should not happen, because it is observed almost nowhere else»?
Разницу-то вижу, только у него «should not happen» именно что эмпирическими данными и опровергается, а рассуждения про „random shuffling“ чисто теоретические.
И именно с таких участков, на которых наблюдались скачки?

Не только с них.


Разницу-то вижу, только у него «should not happen» именно что эмпирическими данными и опровергается, а рассуждения про „random shuffling“ чисто теоретические.

Should not happen опровергается тем, что в результате random shuffling… ладно, это излишне сложная для примера модель. Опровергается тем, что серия из почти всех орлов, а потом почти всех решек для честной монетки очень маловероятна.

Should not happen опровергается тем, что в результате random shuffling
Так вот распределение этого самого «random» он никак и не подтверждает, это чисто гипотетическая упрощённая модель. «Мы не знаем, как оно распределяется почтой, так что давайте будем считать равномерное распределённым».
Опровергается тем, что серия из почти всех орлов, а потом почти всех решек для честной монетки очень маловероятна.
А почта уехавших в Нью-Йорк демократов, которая будет идти, разумеется, дольше, и одним грузовиком, по сравнению с внутренней почтой — она насколько похожа на монетку? У вас проблемы с моделью.
Так вот распределение этого самого «random» он никак и не подтверждает, это чисто гипотетическая упрощённая модель.

А это здесь и не нужно, достаточно очень слабого предположения о шаффлинге. После этого для любого разумного распределения оно будет стремиться к матожиданию. Всякие там ЦПТ так работают.


А почта уехавших в Нью-Йорк демократов, которая будет идти, разумеется, дольше, и одним грузовиком, по сравнению с внутренней почтой — она насколько похожа на монетку? У вас проблемы с моделью.

Люди как правило голосуют по месту жительства, а не рождения.

А это здесь и не нужно, достаточно очень слабого предположения о шаффлинге.
Достаточно предположения, чтобы получить уверенность? Серьёзно?
Люди как правило голосуют по месту жительства, а не рождения.
А не по региону налоговой приписки?
Достаточно предположения, чтобы получить уверенность?

В любой модели мира есть предположения. Что вас так удивляет?


А не по региону налоговой приписки?

Нет. Насколько я понимаю, по тому, в каком штате у вас место жительства.


Когда вы регистрируетесь в новом штате после переезда и получаете state ID, вы заодно имеете право выбрать опцию зарегистрироваться там как голосующий (если вы вообще имеете право голосовать). Как конкретно считается ваше, ээ, residence, я не знаю (у разных штатов разные требования), но при смене места жительства вы вроде как в любом случае обязаны уведомить власти о том, где вы теперь будете голосовать.


К слову о налогах, у меня есть знакомый, под 180 дней живущий в NJ, под 180 дней живущий в NY, и ещё дней десять ездящий по миру (таким образом он избегает налога штата). Вот где он голосует, я не знаю.

В любой модели мира есть предположения. Что вас так удивляет?
Что предположение используется как аргумент, а не как что-то, что само требует подтверждения.

У вас всегда, в любой модели будут предположения (например, о воспроизводимости результатов независимо от места). Поэтому сказать про, ну, например, условный emdrive, что он у меня в подвале работает, а у вас не работает потому, что вы не у меня в подвале, не получится.

Воспроизводимость — это не предположение, это один из критериев признания эксперимента научным. И как раз в вашем примере вы не можете что-то доказывать, опираясь на то, что предполагаете воспроизводимость своего подвального емдрайва, не проверив её и не приняв мер к её обеспечению.

Воспроизводимость — следствие предположения об изотропности Вселенной и всяких других подобных свойствах.

Каким образом у вас свойство (наличествующее или отсутствующее) оказывается следствием предположения?

Требование этого свойства оказывается следствием предположения.

Что мешает воспроизводимости в анизотропной вселенной? Требование воспроизводить в точке вселенной с аналогичными свойствами?

Всегда можно сказать, что в той точке, где у вас не воспроизводятся мои эксперименты, некоторые неизмеримые, скрытые параметры отличаются, но мы просто не знаем, какие.


Правильнее, кстати, это называть однородностью пространства, и это один из постулатов современной физики. Сорри за неправильную терминологию.

Так можно же просто воспроизводить, например, в одной и той же точке. Условия воспроизведения просто должны быть описаны достаточно для воспроизведения. Наука постоянно обнаруживала неоднородность пространства, а потом описывала это, училась воспроизводить и называла, скажем, «магнетизмом». Или «гравитацией».

В физику уже лет сто двадцать как завезли четырёхмерное пространство-время. Вы не можете попасть в ту же точку.


Магнетизм и гравитация — измеряемые параметры. Тут же речь идёт, если хотите, о принципиально неизмеряемых.

Вы не можете попасть в ту же точку.
Так если воспроизведение невозможно, то и ценность у эксперимента ничтожна.
Магнетизм и гравитация — измеряемые параметры. Тут же речь идёт, если хотите, о принципиально неизмеряемых.
Принципиально неизмеряемые — это ненаучно. Наука — это учение о познавании, непознаваемым она не занимается. Но если что-то «неизмеряемое» как-то измеряемо влияет на измеряемые процессы, то вот оно уже и измеряемо.

Всё это в предположении об однородности пространства.

Там ключевой вопрос — почему аномалии происходят именно в нескольких штатах? Чем эти штаты отличаются так принципиально от других?


Т.е. вы вроде как пытаетесь объяснить, почему аномалии — это норма. Ну окей принимаем вашу гипотезу. Но тогда "аномалией" становится наблюдаемое поведение во всех остальных штатах, коих большинство! А так быть не может.

Чем эти штаты отличаются так принципиально от других?
Правила разные, например. В разных штатах по-разному разрешали голосовать (где-то можно было и в день выборов отправить голос, а где-то было обязательно заранее). По-разному почта работает, по-разному считают. По-разному распределены географически сторонники демократов/удалёнки.

Нет, тут следует указать конкретно, чем отличаются правила, так, чтобы из этого можно было вывести такую разницу в наблюдениях.


Т.е. вот у нас есть некоторый набор штатов, и вот конкретно в этих штатах правила как-то по особому отличаются. Чем конкретно, в чем эта особенность состоит? "Где-то" — это где? Именно в тех штатах, о которых мы говорим? А в других точно было не так? В других штатах нету тех же особенностей работы почты? В других штатах нету тех же особенностей распределения сторонников демократов/удаленки?


Т.е. ваш ответ без соответствующих пояснений ни чем не отличается от ответа: "ну как-то вышло, хз почему". И вариант с фальсификациями, безусловно, на порядок более вероятен, чем "как-то вышло, хз почему".

Почему более вероятен? В разных штатах разные правила и условия, поэтому объявлять какие-то штаты подозрительными только потому, что они отличаются от каких-то других — бездоказательно. Я не утверждаю, что фальсификаций не было, я просто не вижу однозначных свидетельств в их пользу.

Если аномалии происходят в ключевых штатах, т.е. там где разрыв минимален и имеет смысл делать фальсификации, то это подозрительно.

У вас есть данные, что во всех (или значительном количестве) «сложных» штатах такое наблюдалось?

Надо читать тот твитер внимательно. Им же важно побыстрее вбросить, а не системно всё показать, поэтому разобраться сложно.

Почему более вероятен?

Потому что это маловероятно, когда случайное выглядит систематически. Например, если у вас две монетки, и одна ведет себя нормально, а другая падает на 30 орлов подряд — то, скорее, что-то конкретно не то с монеткой, а не "так само получилось, монетка ж может и 30 и 130 раз подряд орлом упасть".
Вы сейчас именно за то и топите, что "монетка просто сама взяла так и упала, бывает".

Не видел пока тут в обсуждениях подтверждений систематичности. Только отдельные случаи в 1-2 штатах.

Так подобная ерунда суммарно в этак четырёх-пяти штатах (GA, PA, MI, AZ, NV, если я ничего не путаю). Отвечая заодно на ваш вопрос чуть выше — да, аналогичные (имеющие матстатистически низкую правдоподобность) анализы были и для других штатов (например, кроме пропорций интересно посмотреть на долю mail-in ballots, которые голосовали только за президента, но не за сенаторов — для Трампа в одном из штатов таких в районе 800, для Байдена — на порядок-другой больше), при этом для non-swing-states анализ даёт результаты с высокой правдоподобностью.

В нескольких штатах, которые, по счастливому совпадению, и обеспечили Байдену преимущество.
Орел 30 раз.


Не, ну в самом деле, "есть какие-то факторы, но просто они нам неизвестны, хз как влияют, их существование ни чем не подтверждается, как они приводят к наблюдаемым явлениям неизвестно, но они есть" против "вот у нас есть конкретный фактор, который все объясняет и косвенно подтверждается другими свидетельствами" и вы выбираете первое?

В разных штатах по-разному разрешали голосовать (где-то можно было и в день выборов отправить голос, а где-то было обязательно заранее).

Это интересно. В каких штатах обязательно в день выборов отправить, и почему это влияет на наблюдаемое распределение?


По-разному почта работает

В смысле?


По-разному распределены географически сторонники демократов/удалёнки.

Это влияло бы на положение асимптоты, но не на наличие разрывов на ней или её наклон. Надо отличать модели, отличающиеся лишь параметрам, и модели, лежащие в разных классах.


по-разному считают

Бинго!

Это интересно. В каких штатах обязательно в день выборов отправить, и почему это влияет на наблюдаемое распределение?
Не «обязательно в день», наоборот — где-то разрешалось отправлять даже прямо в день выборов, а где-то нужно было это делать заранее.
По-разному почта работает
В смысле?
В смысле скорости и эффективности региональных подразделений USPS.
Это влияло бы на положение асимптоты, но не на наличие разрывов на ней или её наклон. Надо отличать модели, отличающиеся лишь параметрам, и модели, лежащие в разных классах.
Вы опять забываете про почту — я имею в виду, что из разных регионов почта доходит за разное время (взять, хотя бы, их удалённость от «домашнего»).
В смысле скорости и эффективности региональных подразделений USPS.

Я не спорю, что существует распределение, дающее такие результаты. Но оно маловероятно.


Это как объяснять строго кратные пятипроцентным явки-голоса на выборах в РФ тем, что «ну вот так получилось, бывает, законам физики не противоречит».


Вы опять забываете про почту — я имею в виду, что из разных регионов почта доходит за разное время (взять, хотя бы, их удалённость от «домашнего»).

Вот прям настолько по-разному доходит, что вся разница ограничивается масштабами часов?

Я не спорю, что существует распределение, дающее такие результаты. Но оно маловероятно.

Это как объяснять строго кратные пятипроцентным явки-голоса на выборах в РФ тем, что «ну вот так получилось, бывает, законам физики не противоречит».
Вы передёргиваете опять! Спрашивали, почему в одних штатах одно распределение, а в других — другое, а теперь переводите к очевидно не объясняемым ничем кроме махинаций скачкам на кратных результатах.
Вот прям настолько по-разному доходит, что вся разница ограничивается масштабами часов?
Всё, что больше часов, в дни — уже и приехало заранее либо приедет в другой день. А почта ездит именно физическими «батчами» — грузовиками и прочими машинами почтовой службы. Которые не едут непрерывным потоком, а собирают почту, накапливенную и отсортированную в местах отправления/транзита.
Спрашивали, почему в одних штатах одно распределение, а в других — другое, а теперь переводите к очевидно не объясняемым ничем кроме махинаций скачкам на кратных результатах.

Я не спрашиваю, почему распределения разные. Я спрашиваю, почему семейства распределений разные.


Всё, что больше часов, в дни — уже и приехало заранее либо приедет в другой день. А почта ездит именно физическими «батчами» — грузовиками и прочими машинами почтовой службы. Которые не едут непрерывным потоком, а собирают почту, накапливенную и отсортированную в местах отправления/транзита.

И как в эту модель укладывается резкий скачок в конкретный момент времени? Объясните, пожалуйста, как и откуда должна собраться почта, чтобы так получилось.

И как в эту модель укладывается резкий скачок в конкретный момент времени? Объясните, пожалуйста, как и откуда должна собраться почта, чтобы так получилось.
Почта из дем-регионов подъехала. Хотя, собственно, почта могла откуда угодно приехать, если её много скопилось, и где-то набирали прямо большой грузовик или ждали, пока соберут все конверты в нужную сторону.

И вот так прям получилось, что у всех этих конвертов (и только них) изменилось соотношение голосующих за Трампа или за Байдена.


Не, законы физики не запрещают, опять же, не спорю.

Тут два простых варианта: 1. Что соотношение голосов из определённого региона с практически 100% вероятностью будет отличаться от соотношения голосов из другого. Особенно, если это меньший по размерам регион. 2. Что сложные бюллетени не-удалёнщиков тоже всё ещё считали, и они составляли значительный процент, и, будучи внезапно «разбавленными» большим батчем почтовых, оказались мгновенно в меньшинстве.

P.S. Я не утверждаю, что это не вбросы, сама идея почтовых голосований при отсутствии списков избирателей, по-моему, противоречит здравому смыслу.

См. ниже пример с мешком и монетками.


Списки избирателей, кстати, теоретически есть, но там тоже довольно легко считерить. Если бы у меня было право голоса, мне было бы очень просто (хотя и уголовно наказуемо) оставить за собой возможность голосовать и в NY, и в TX, например (достаточно было бы не указывать в TX номер паспорта NY state ID при получении техасского state ID). Там есть какие-то кросспроверки по SSN и тому подобным вещам, но они тоже довольно легко обходятся.


Ну и в любом случае это как играть с наперсточником.

Расскажите наконец откуда почта едет и куда, где она хранится до подсчёта, в скольких местах ее считают, и какой размер батча на графике. Как можно строить модель пальцем в небо не зная процедуры.


Может быть решили посчитать сначала почту из регионов, а потом из городов. Но для этого нужно больше данных о том смешивается эта почта или лежит по стопочкам из каждого города.
Хотя бы нужно параллельно смотреть ещё несколько графиков. Ведь есть и данные отдельно по графствам (округам или как их) внутри каждого штата. Есть ли соотвествие между батчами на графике для штата и этими данными?

Присоединяюсь. Так и не понял, на чём основана идея о равномерном смешивании, если формального протокола, который предписывал бы соответствующий порядок подсчётов, никто не видел.

Такого протокола нету. Я говорю скорее о механизме того как там считают. Возможна ли корреляция между отношением D/R и временем подсчёта. Например гипотеза1: письма с округов где преобладают сторонники демократов по mail-in привезли позже. Для этой гипотезы надо знать — подвозят ли письма в течении всей недели (тогда гипотеза не верна) или же в течении ночи после голосования (тогда гипотеза может быть верна). По последнем случае надо знать сколько бывает подвозов почты по сравнению с размером батча. Если подвозов например всего два (первый из городов — второй из деревень или один с севера другой с юга) и с каждого репортится по 10 батчей, то ступенька возможна. Если подвозов 100 и батч примерно равен подвозу — тогда ступенька опять не возможна. Для этого всего надо хотя бы знать число голосов которому соответсвует график, тогда уже можно прикинуть хоть что-то. Сколько писем может быть в одной машине, которая приехала на видео в момент ступеньки и т.п. Пока мы не знаем что на графике рассуждать бесполезно, я не понимаю зачем вы и 0xd34df00d уже настрочили тут кучу коментариев.

Сорри за довольно долгий ответ на тему, это довольно тяжело проверять с достаточной степенью уверенности — США по части автоматизации выборов и открытости данных в этом плане примерно в пещерном веке (ну и федерализм ещё).


В любом случае, почта едет от людей, приезжает в окружной (в смысле county) офис подсчёта. В рамках этого офиса вся почта от разных населённых пунктов, принадлежащих этому округу. смешивается. Так, например, я живу в Остине, который в Travis County, и в этом Travis County есть, соответственно, как довольно синий Остин, так и красные города помельче и субурбы (а ещё там есть населённый пункт с прикольным названием, но это к делу не относится).


В большинстве штатов должна приехать к третьему ноября, но некоторые штаты собираются учитывать голоса, полученные вплоть до через 2-3 недели после выборов. Характерный размер батча — порядка сотни-двух голосов, но он ничем не ограничен ни сверху, ни снизу.


Однако, почти всё это неважно:


  1. Для любого адекватного размера батчей (мне лень открывать учебник матстатов и оценивать его численно) предположения модели работают. На то, что размер батчей адекватный, указывает околонулевая дисперсия отношений после начального подсчёта голосов вживую. Это валидирует адекватность размера куда лучше, чем любые писульки на официальных бумагах.
  2. Независимо от того, как и куда приезжает почта, вероятность того, что до времени T считались исключительно батчи с отношением D/R = X, а после — с отношением D/R = Y, при этом X существенно отличается от Y, околонулевая. Условно, представьте себе, что у вас есть мешок с монетками, и пусть даже эти монетки неравнозначны, и есть сколько-то монеток с вероятностью выпадения орла p₁ и сколько-то с вероятностью выпадения p₂. Вы достаёте по монетке из мешка, подкидываете её по сто раз и записываете долю орлов (и делаете вывод, что с некоторой вероятностью, даваемой ЦПТ и связанными теоремами, монетка принадлежит тому или иному классу). Вероятность того, что сначала вы вытащите все монетки из первого класса, а только потом — все монетки из второго, околонулевая.

Ведь есть и данные отдельно по графствам (округам или как их) внутри каждого штата.

Их хрен найдёшь. См. выше про пещерный век.

Да спасибо за ответ. про цпт я знаю =)
Примерно то и пытался написать, до того как увидел этот ответ.


Их хрен найдёшь. См. выше про пещерный век.

Я имел ввиду что-то такое где есть результат для каждой country. На графике уже данные по штату идут (типа Florida и т.п.). По моей грубой оценке там 1000 точек, а в каждом штате по ~50 округов, т.е. получается каждый округ репортит по 10 раз?

Я имел ввиду что-то такое где есть результат для каждой country.

Я видел эти графики в день выборов (они прям в гугле на странице результатов рисовались по запросу типа 2020 presidential elections), но я понятия не имею, откуда там данные, и как эти данные взять в неагрегированном виде.


По моей грубой оценке там 1000 точек, а в каждом штате по ~50 округов, т.е. получается каждый округ репортит по 10 раз?

Я бы ожидал даже большее количество репортов. В той же Флориде живёт где-то 20 миллионов человек, явка в эти выборы вроде 49% была (когда я последний раз смотрел), значит, проголосовало 10 миллионов. Либо батчей должно быть сильно больше, либо они получаются гигантские (что противоречит тому, что я читал от наблюдателей, нагугливал в руководствах по голосовальным машинам и так далее).

Сорян я наверное точки плохо посчитал. Там они сильно плотнее вначале идут. Их наверное тысяч 10, тогда все сходится. Но меня удивляет такое количество точек на линии, т.е. mail-in их там около половины, что половина голосований по почте?

О, deboonker'ы подъехали (не вы, а когнитивный экономист по ссылке, решивший поиграть в дата сайентиста)!


По беглому прочтению это какая-то наукообразная ерунда, и я так и не понял, откуда там логический переход к ошибкам округления. Надо вчитываться подробнее, но, в любом случае, ошибки округления чего именно? Почему на графике очевидно есть точки между этими двумя скачками? Почему ошибки округления сначала были только в одну сторону, а потом только в другую?


Ну и когда человек приводит такой график как пример случайного процесса, то неплохо было бы указать конкретные параметры. Потому что если у него в одном батче, как один крайний случай, по одному сэмплу, то точки будут прыгать от нуля до единицы, а если по десятку тыщ сэмплов, то они будут неотличимы от среднего (особенно если точки достаточно жирные).


И, собственно, когда он пишет


The probabilities are governed by the binomial distribution, and a real chart of these returns would look less like this (from the Pennsylvania graph above):

то ну как бы исходный автор тоже имеет претензии к такому тренду, внезапно.


Или вот:


Could it simply have been misinterpreted? One possibility was that they might have charted the cumulative D/R share instead of the D/R share of individual batches of ballots. That would explain why they converge on a stable value, because the cumulative share in a swing state quickly reaches a level close to 50% and changes very slowly after that.

Тогда откуда у него вылезают outlier'ы, не лежащие на прямой, после 11-04 12 для Пенсильвании, например?


Тут апеллировать к авторитету (вернее, его отсутствию), конечно, плохо, но очень хочется.

Не придирайтесь к форме изложения. Главное что там есть dataset и схема подсчёта обсуждена. Можете поиграть сами в датасайнс, мне лень...


Читайте последнюю треть, в начале там ни о чём. Если краткий пересказ — то смысл такой. Там в датасете nytimes дается кумулятивный результат. Процент за трампа/байдена с точность до 3его знака и число обработанных голосов с точность до 1го голоса, т.е. с точностью до 6 знака примерно. Потом мы делаем график по сути первого значения от второго, и получаем график функции y = round(x(t)). Но x(t) меняется вначале быстрее потом почти не меняется, но иногда есть выбросы когда x(t) сильно поменялся в конце.
Я тут чуть упростил, там ещё производная берется, не могу сообразить до округления или после выходит.

А мне вот стало не лень (да и четыре месяца уже на х-ле не писал, а тут повод есть). Я короч скачал датасет для Пенсильвании (wget https://static01.nyt.com/elections-assets/2020/data/api/2020-11-03/race-page/pennsylvania/president.json), и у меня есть некоторые вопросы.


Вот агрегированные данные для 2020-11-04T04:08:51Z и предыдущего снапшота:


          {
            "vote_shares": {
              "trumpd": 0.566,
              "bidenj": 0.42
            },
            "votes": 2984468,
            "eevp": 42,
            "eevp_source": "edison",
            "timestamp": "2020-11-04T04:07:43Z"
          },
          {
            "vote_shares": {
              "trumpd": 0.56,
              "bidenj": 0.426
            },
            "votes": 2984522,
            "eevp": 42,
            "eevp_source": "edison",
            "timestamp": "2020-11-04T04:08:51Z"
          },

Что это за фигня? Как так за минуту почти 18 тыщ (


λ> 2984468 * 0.566 - 2984522 * 0.56
17876.567999999737

) голосов ушло от Трампа к Байдену?

Это ещё ничего, там по этому штату есть места где votes тупо уменьшается на 600к

В общем, такие себе данные, чтобы по ним статистические аномалии искать.

Возникает два вопроса
Почему медиа используют такие плохие данные?
Почему на основе таких плохих данных в медия заявляется победа кандидата?

Я бы с радостью взял данные лучше. Не поделитесь ссылкой?

Вы как-то слишком-лично мои комментарии воспринимаете. Как будто это ваши личные данные. Или как будто отсутствие данных лучше оправдывает построение на этих кривых данных каких-то теорий.
Вы как-то слишком-лично мои комментарии воспринимаете. Как будто это ваши личные данные.

Уф, в интернете тяжко передавать эмоции. Я согласен, что это грязные данные с лажей, и я на самом деле хотел бы данные чище и адекватнее, и если они у вас есть, то я с радостью бы их взял. Никаких скрытых смыслов, обидок или чего там ещё такого.


Или как будто отсутствие данных лучше оправдывает построение на этих кривых данных каких-то теорий.

Включая теорию о том, что Байден победил?

Включая теорию о том, что Байден победил?
Так Байдена, вроде бы, не по этим данным победителем признали. Это же только API БД NYT, а не гос. данные.

Так а где эти госданные? Можно их пощупать?

Не знаю, это уже к гос. органам США вопрос. Может, их и нет в виде единой базы.

Так, ладно, с другой стороны. А откуда взялись эти данные?

Откуда в NYT их взяли? Не знаю. Вы же их принесли, вообще-то, эти ссылки. Могу только погуглить вместе с вами. Может, у них корреспонденты в местных избиркомах сидели и подсмотренные числа в редакцию Вацапом слали.

Короче, я тут поигрался ещё, и, во-первых, данные действительно очень грязные. Во-вторых, так выглядят базовые проверки на разумность для всех штатов:


тыц
ALABAMA (173 points, 2309900 total votes)
    agg non-mono: 1
    anti-biden non-mono: 0; sum: 0
    anti-trump non-mono: 0; sum: 0
    anti-biden flips: 1; sum: -1321; namely: [FlipData {trumpDelta = 1326, bidenDelta = -1321}]
    anti-trump flips: 0; sum: 0; namely: 

ALASKA (12 points, 349473 total votes)
    agg non-mono: 0
    anti-biden non-mono: 0; sum: 0
    anti-trump non-mono: 0; sum: 0
    anti-biden flips: 0; sum: 0; namely: 
    anti-trump flips: 0; sum: 0; namely: 

ARIZONA (123 points, 3385747 total votes)
    agg non-mono: 0
    anti-biden non-mono: 0; sum: 0
    anti-trump non-mono: 0; sum: 0
    anti-biden flips: 1; sum: -1626; namely: [FlipData {trumpDelta = 1684, bidenDelta = -1626}]
    anti-trump flips: 0; sum: 0; namely: 

ARKANSAS (168 points, 1212441 total votes)
    agg non-mono: 5
    anti-biden non-mono: 5; sum: -8132
    anti-trump non-mono: 3; sum: -1979
    anti-biden flips: 0; sum: 0; namely: 
    anti-trump flips: 0; sum: 0; namely: 

CALIFORNIA (181 points, 16874943 total votes)
    agg non-mono: 1
    anti-biden non-mono: 0; sum: 0
    anti-trump non-mono: 0; sum: 0
    anti-biden flips: 1; sum: -3740; namely: [FlipData {trumpDelta = 3777, bidenDelta = -3740}]
    anti-trump flips: 0; sum: 0; namely: 

COLORADO (142 points, 3256062 total votes)
    agg non-mono: 1
    anti-biden non-mono: 0; sum: 0
    anti-trump non-mono: 0; sum: 0
    anti-biden flips: 1; sum: -2452; namely: [FlipData {trumpDelta = 3376, bidenDelta = -2452}]
    anti-trump flips: 0; sum: 0; namely: 

CONNECTICUT (227 points, 1823932 total votes)
    agg non-mono: 4
    anti-biden non-mono: 0; sum: 0
    anti-trump non-mono: 0; sum: 0
    anti-biden flips: 0; sum: 0; namely: 
    anti-trump flips: 0; sum: 0; namely: 

DELAWARE (10 points, 504010 total votes)
    agg non-mono: 0
    anti-biden non-mono: 0; sum: 0
    anti-trump non-mono: 0; sum: 0
    anti-biden flips: 0; sum: 0; namely: 
    anti-trump flips: 0; sum: 0; namely: 

FLORIDA (298 points, 11066428 total votes)
    agg non-mono: 10
    anti-biden non-mono: 0; sum: 0
    anti-trump non-mono: 0; sum: 0
    anti-biden flips: 2; sum: -5451; namely: [FlipData {trumpDelta = 1394, bidenDelta = -1170},FlipData {trumpDelta = 6023, bidenDelta = -4281}]
    anti-trump flips: 0; sum: 0; namely: 

GEORGIA (550 points, 4992709 total votes)
    agg non-mono: 3
    anti-biden non-mono: 1; sum: -6399
    anti-trump non-mono: 1; sum: -13511
    anti-biden flips: 1; sum: -1297; namely: [FlipData {trumpDelta = 1359, bidenDelta = -1297}]
    anti-trump flips: 0; sum: 0; namely: 

HAWAII (4 points, 574341 total votes)
    agg non-mono: 0
    anti-biden non-mono: 0; sum: 0
    anti-trump non-mono: 0; sum: 0
    anti-biden flips: 0; sum: 0; namely: 
    anti-trump flips: 0; sum: 0; namely: 

IDAHO (72 points, 868125 total votes)
    agg non-mono: 0
    anti-biden non-mono: 0; sum: 0
    anti-trump non-mono: 0; sum: 0
    anti-biden flips: 0; sum: 0; namely: 
    anti-trump flips: 0; sum: 0; namely: 

ILLINOIS (254 points, 5942327 total votes)
    agg non-mono: 2
    anti-biden non-mono: 0; sum: 0
    anti-trump non-mono: 0; sum: 0
    anti-biden flips: 2; sum: -4162; namely: [FlipData {trumpDelta = 2395, bidenDelta = -2053},FlipData {trumpDelta = 2384, bidenDelta = -2109}]
    anti-trump flips: 0; sum: 0; namely: 

INDIANA (233 points, 3034617 total votes)
    agg non-mono: 1
    anti-biden non-mono: 0; sum: 0
    anti-trump non-mono: 0; sum: 0
    anti-biden flips: 2; sum: -1131; namely: [FlipData {trumpDelta = 801, bidenDelta = -539},FlipData {trumpDelta = 805, bidenDelta = -592}]
    anti-trump flips: 0; sum: 0; namely: 

IOWA (235 points, 1688233 total votes)
    agg non-mono: 2
    anti-biden non-mono: 0; sum: 0
    anti-trump non-mono: 1; sum: -6745
    anti-biden flips: 1; sum: -457; namely: [FlipData {trumpDelta = 576, bidenDelta = -457}]
    anti-trump flips: 0; sum: 0; namely: 

KANSAS (270 points, 1334330 total votes)
    agg non-mono: 2
    anti-biden non-mono: 2; sum: -1132
    anti-trump non-mono: 2; sum: -10507
    anti-biden flips: 2; sum: -7681; namely: [FlipData {trumpDelta = 312, bidenDelta = -221},FlipData {trumpDelta = 8030, bidenDelta = -7460}]
    anti-trump flips: 0; sum: 0; namely: 

KENTUCKY (273 points, 2135193 total votes)
    agg non-mono: 5
    anti-biden non-mono: 4; sum: -8334
    anti-trump non-mono: 2; sum: -390
    anti-biden flips: 0; sum: 0; namely: 
    anti-trump flips: 0; sum: 0; namely: 

LOUISIANA (72 points, 2148062 total votes)
    agg non-mono: 0
    anti-biden non-mono: 0; sum: 0
    anti-trump non-mono: 0; sum: 0
    anti-biden flips: 0; sum: 0; namely: 
    anti-trump flips: 0; sum: 0; namely: 

MAINE (349 points, 786337 total votes)
    agg non-mono: 1
    anti-biden non-mono: 0; sum: 0
    anti-trump non-mono: 0; sum: 0
    anti-biden flips: 2; sum: -438; namely: [FlipData {trumpDelta = 217, bidenDelta = -151},FlipData {trumpDelta = 385, bidenDelta = -287}]
    anti-trump flips: 0; sum: 0; namely: 

MARYLAND (79 points, 2907924 total votes)
    agg non-mono: 0
    anti-biden non-mono: 0; sum: 0
    anti-trump non-mono: 0; sum: 0
    anti-biden flips: 0; sum: 0; namely: 
    anti-trump flips: 0; sum: 0; namely: 

MASSACHUSETTS (348 points, 3498681 total votes)
    agg non-mono: 1
    anti-biden non-mono: 1; sum: -1043
    anti-trump non-mono: 0; sum: 0
    anti-biden flips: 1; sum: -985; namely: [FlipData {trumpDelta = 1235, bidenDelta = -985}]
    anti-trump flips: 0; sum: 0; namely: 

MICHIGAN (538 points, 5533240 total votes)
    agg non-mono: 3
    anti-biden non-mono: 2; sum: -5604
    anti-trump non-mono: 1; sum: -871
    anti-biden flips: 2; sum: -3354; namely: [FlipData {trumpDelta = 1455, bidenDelta = -1332},FlipData {trumpDelta = 2494, bidenDelta = -2022}]
    anti-trump flips: 1; sum: -2713; namely: [FlipData {trumpDelta = -2713, bidenDelta = 2748}]

MINNESOTA (344 points, 3268372 total votes)
    agg non-mono: 6
    anti-biden non-mono: 1; sum: -105688
    anti-trump non-mono: 1; sum: -79240
    anti-biden flips: 2; sum: -2163; namely: [FlipData {trumpDelta = 863, bidenDelta = -684},FlipData {trumpDelta = 1509, bidenDelta = -1479}]
    anti-trump flips: 0; sum: 0; namely: 

MISSISSIPPI (218 points, 1240749 total votes)
    agg non-mono: 2
    anti-biden non-mono: 1; sum: -1291
    anti-trump non-mono: 0; sum: 0
    anti-biden flips: 0; sum: 0; namely: 
    anti-trump flips: 0; sum: 0; namely: 

MISSOURI (184 points, 3010316 total votes)
    agg non-mono: 2
    anti-biden non-mono: 1; sum: -14144
    anti-trump non-mono: 1; sum: -3663
    anti-biden flips: 0; sum: 0; namely: 
    anti-trump flips: 0; sum: 0; namely: 

MONTANA (107 points, 605738 total votes)
    agg non-mono: 1
    anti-biden non-mono: 1; sum: -1767
    anti-trump non-mono: 0; sum: 0
    anti-biden flips: 0; sum: 0; namely: 
    anti-trump flips: 0; sum: 0; namely: 

NEBRASKA (75 points, 946256 total votes)
    agg non-mono: 1
    anti-biden non-mono: 1; sum: -29146
    anti-trump non-mono: 1; sum: -22793
    anti-biden flips: 0; sum: 0; namely: 
    anti-trump flips: 0; sum: 0; namely: 

NEVADA (75 points, 1405376 total votes)
    agg non-mono: 0
    anti-biden non-mono: 0; sum: 0
    anti-trump non-mono: 0; sum: 0
    anti-biden flips: 0; sum: 0; namely: 
    anti-trump flips: 0; sum: 0; namely: 

NEW-HAMPSHIRE (297 points, 804453 total votes)
    agg non-mono: 7
    anti-biden non-mono: 0; sum: 0
    anti-trump non-mono: 0; sum: 0
    anti-biden flips: 0; sum: 0; namely: 
    anti-trump flips: 1; sum: -385; namely: [FlipData {trumpDelta = -385, bidenDelta = 435}]

NEW-JERSEY (152 points, 4234630 total votes)
    agg non-mono: 1
    anti-biden non-mono: 1; sum: -77001
    anti-trump non-mono: 0; sum: 0
    anti-biden flips: 0; sum: 0; namely: 
    anti-trump flips: 1; sum: -79568; namely: [FlipData {trumpDelta = -79568, bidenDelta = 79568}]

NEW-MEXICO (56 points, 923724 total votes)
    agg non-mono: 1
    anti-biden non-mono: 1; sum: -1089
    anti-trump non-mono: 1; sum: -1577
    anti-biden flips: 0; sum: 0; namely: 
    anti-trump flips: 0; sum: 0; namely: 

NEW-YORK (232 points, 6751133 total votes)
    agg non-mono: 2
    anti-biden non-mono: 1; sum: -83345
    anti-trump non-mono: 2; sum: -522142
    anti-biden flips: 0; sum: 0; namely: 
    anti-trump flips: 1; sum: -4190; namely: [FlipData {trumpDelta = -4190, bidenDelta = 6209}]

NORTH-CAROLINA (229 points, 5522618 total votes)
    agg non-mono: 12
    anti-biden non-mono: 0; sum: 0
    anti-trump non-mono: 0; sum: 0
    anti-biden flips: 1; sum: -1784; namely: [FlipData {trumpDelta = 2593, bidenDelta = -1784}]
    anti-trump flips: 0; sum: 0; namely: 

NORTH-DAKOTA (89 points, 361808 total votes)
    agg non-mono: 3
    anti-biden non-mono: 0; sum: 0
    anti-trump non-mono: 0; sum: 0
    anti-biden flips: 0; sum: 0; namely: 
    anti-trump flips: 0; sum: 0; namely: 

OHIO (144 points, 5764587 total votes)
    agg non-mono: 1
    anti-biden non-mono: 0; sum: 0
    anti-trump non-mono: 1; sum: -2308
    anti-biden flips: 2; sum: -4036; namely: [FlipData {trumpDelta = 1756, bidenDelta = -1356},FlipData {trumpDelta = 2952, bidenDelta = -2680}]
    anti-trump flips: 0; sum: 0; namely: 

OKLAHOMA (133 points, 1560699 total votes)
    agg non-mono: 0
    anti-biden non-mono: 0; sum: 0
    anti-trump non-mono: 0; sum: 0
    anti-biden flips: 0; sum: 0; namely: 
    anti-trump flips: 0; sum: 0; namely: 

OREGON (69 points, 2357873 total votes)
    agg non-mono: 0
    anti-biden non-mono: 0; sum: 0
    anti-trump non-mono: 0; sum: 0
    anti-biden flips: 0; sum: 0; namely: 
    anti-trump flips: 0; sum: 0; namely: 

PENNSYLVANIA (621 points, 6863096 total votes)
    agg non-mono: 6
    anti-biden non-mono: 5; sum: -327480
    anti-trump non-mono: 3; sum: -611029
    anti-biden flips: 0; sum: 0; namely: 
    anti-trump flips: 2; sum: -20734; namely: [FlipData {trumpDelta = -17877, bidenDelta = 17930},FlipData {trumpDelta = -2857, bidenDelta = 3662}]

RHODE-ISLAND (39 points, 513602 total votes)
    agg non-mono: 1
    anti-biden non-mono: 0; sum: 0
    anti-trump non-mono: 0; sum: 0
    anti-biden flips: 1; sum: -86; namely: [FlipData {trumpDelta = 108, bidenDelta = -86}]
    anti-trump flips: 0; sum: 0; namely: 

SOUTH-CAROLINA (196 points, 2513329 total votes)
    agg non-mono: 2
    anti-biden non-mono: 1; sum: -576
    anti-trump non-mono: 0; sum: 0
    anti-biden flips: 0; sum: 0; namely: 
    anti-trump flips: 0; sum: 0; namely: 

SOUTH-DAKOTA (152 points, 422609 total votes)
    agg non-mono: 4
    anti-biden non-mono: 2; sum: -3913
    anti-trump non-mono: 1; sum: -453
    anti-biden flips: 0; sum: 0; namely: 
    anti-trump flips: 0; sum: 0; namely: 

TENNESSEE (124 points, 3049514 total votes)
    agg non-mono: 0
    anti-biden non-mono: 0; sum: 0
    anti-trump non-mono: 0; sum: 0
    anti-biden flips: 1; sum: -319; namely: [FlipData {trumpDelta = 443, bidenDelta = -319}]
    anti-trump flips: 0; sum: 0; namely: 

TEXAS (324 points, 11273402 total votes)
    agg non-mono: 6
    anti-biden non-mono: 1; sum: -2899
    anti-trump non-mono: 0; sum: 0
    anti-biden flips: 1; sum: -4789; namely: [FlipData {trumpDelta = 6375, bidenDelta = -4789}]
    anti-trump flips: 0; sum: 0; namely: 

UTAH (66 points, 1463880 total votes)
    agg non-mono: 0
    anti-biden non-mono: 0; sum: 0
    anti-trump non-mono: 0; sum: 0
    anti-biden flips: 0; sum: 0; namely: 
    anti-trump flips: 0; sum: 0; namely: 

VERMONT (72 points, 367792 total votes)
    agg non-mono: 6
    anti-biden non-mono: 0; sum: 0
    anti-trump non-mono: 0; sum: 0
    anti-biden flips: 0; sum: 0; namely: 
    anti-trump flips: 0; sum: 0; namely: 

VIRGINIA (248 points, 4442604 total votes)
    agg non-mono: 10
    anti-biden non-mono: 5; sum: -128914
    anti-trump non-mono: 5; sum: -650945
    anti-biden flips: 0; sum: 0; namely: 
    anti-trump flips: 0; sum: 0; namely: 

WASHINGTON (152 points, 4033774 total votes)
    agg non-mono: 0
    anti-biden non-mono: 0; sum: 0
    anti-trump non-mono: 0; sum: 0
    anti-biden flips: 1; sum: -1118; namely: [FlipData {trumpDelta = 1424, bidenDelta = -1118}]
    anti-trump flips: 0; sum: 0; namely: 

WEST-VIRGINIA (93 points, 793902 total votes)
    agg non-mono: 1
    anti-biden non-mono: 1; sum: -49429
    anti-trump non-mono: 1; sum: -25809
    anti-biden flips: 0; sum: 0; namely: 
    anti-trump flips: 0; sum: 0; namely: 

WISCONSIN (345 points, 3297174 total votes)
    agg non-mono: 11
    anti-biden non-mono: 0; sum: 0
    anti-trump non-mono: 0; sum: 0
    anti-biden flips: 1; sum: -620; namely: [FlipData {trumpDelta = 907, bidenDelta = -620}]
    anti-trump flips: 1; sum: -943; namely: [FlipData {trumpDelta = -943, bidenDelta = 1409}]

WYOMING (50 points, 276765 total votes)
    agg non-mono: 1
    anti-biden non-mono: 0; sum: 0
    anti-trump non-mono: 0; sum: 0
    anti-biden flips: 0; sum: 0; namely: 
    anti-trump flips: 0; sum: 0; namely:

где


  • agg non-mono — количество случаев падения суммарного количества голосов.
  • anti-biden non-mono — количество случаев падения количества голосов (например, как в примере выше для Трампа), и суммарное количество потерянных таким образом голосов, для Байдена. Так как количества голосов за каждого кандидата напрямую нет, а есть только процент (с тремя значащими цифрами), я считаю не t[i].votes * t[i].percentage - t[i - 1].votes * t[i - 1].percentage, а t[i].votes * (t[i].percentage + tolerance) - t[i - 1].votes * (t[i - 1].percentage - tolerance), где tolerance = 0.0005, что уменьшает количество результатов, но делает оставшиеся более сильными. Если это число меньше нуля, то это означает лажу, и соответствующая пара точек добавляется в список.
  • anti-trump non-mono — аналогично.
  • anti-biden flips — количество случаев, сумма потерянных голосов и список конкретных случаев, когда при переходе от i-й точки к i+1-й точке Байден терял голоса, а Трамп получал столько же голосов или больше (в точности как в примере для Трампа выше), и число потерянных голосов существенно (иначе получается много шума). Если бы non-mono считалось с tolerance = 0, то множество этих случаев было бы строгим подмножеством множества non-mono. Или в коде (сорян за не очень документированный хаскель, но общая идея понятна, надеюсь):
    f prePoint postPoint
      | dTrump + dBiden > 0
      , abs ((dTrump + dBiden) / (2 * (dTrump - dBiden))) < 0.1 = Just PairwiseFail { extraData = FlipData (round dTrump) (round dBiden), .. }
      | otherwise = Nothing
      where
        delta candidate = ptVotes candidate 0 postPoint - ptVotes candidate 0 prePoint
        dTrump = delta trumpd
        dBiden = delta bidenj
  • anti-trump flips — аналогично.

Ну это я начал прогонять какие-то базовые проверки, встретил такую ерунду, расстроился и пошёл спать. Вообще надо бы посмотреть внимательнее и по другим штатам, что там ещё вылезет.

Ладно от Трампа к Байдену, вот тут в Висконсине просто на 3343 голоса меньше стало за 9 секунд:

Можно это объяснение (как и другие подобные) полностью игнорировать, т.к. оно не релевантно обсуждаемому вопросу.


Человек объясняет, почему эти аномалии должны были возникнуть. А надо объяснять, почему они по факту не возникали.


Ну и чисто технически там рассматривается только один кейс из многих.

Это объясняет что ровные куски никакого отношения к mail-in не имееют.


А надо объяснять, почему они по факту не возникали.

Вы предлагаете придумать какие были данные до округления?


Вы предлагаете воспринимать всерьез график, где погрешность каждой точки больше чем 100% а некоторые d/r вообще отрицательные?


К исходым данным могут быть вопросы, и можно поискать если так хочется другие аномалии, но нет смысла обсуждать график не имеющий отношения к реальности.

Это объясняет что ровные куски никакого отношения к mail-in не имееют.

Так, а какая разница, имеют или нет? Нам это не важно. Нам важно, почему этих аномалий (претензия не к ровным кускам, кстати, ровный кусок — он только один) нету в других штатах.


Вы предлагаете придумать какие были данные до округления?

Нет, я предлагаю объяснить, почему в большинстве штатов таких аномалий нет. Там округляют как-то по-другому, или что?


Ну и да — на самом деле никакими округлениями наблюдаемые эффекты не объясняются. но это так, к слову, даже если бы объяснялись — это ровным счетом никакого отношения к обсуждаемому вопросу не имеет.

Ещё раз. Есть два эффекта 1) в некоторых штатах процент демакратов растёт со временем. 2) Если данные меняются, то меняются скачками — причём в обе стороны + выбросы в районе скачков. Последний эффект объясняется округлением. Первый подсчётом mail-in в конце.


Там есть другие проблемы с данными, — количество голосов меняется не монотонно. Это происходит и с общим количеством голосов, и с количеством голосов за кандидата даже с учётом погрешности округления. Это лютый трэш.


Upd. исправил.

Последний эффект объясняется округлением. Первый подсчётом mail-in в конце.

Я еще раз повторяю — нам абсолютно неинтересно, как объясняются эти эффекты. Т.е. вообще. Это неважно. Если бы эти эффекты наблюдались во всех штатах то и не было бы ни у кого никаких вопросов.
Но в большинстве штатов — они не наблюдаются. Почему? Вот это нам интересно.
Не откуда они берутся там, где они есть, а почему не возникают там, где их нет. Понимаете разницу?

Ну сложите 2+2 и получите 4 наконец =)
Эффекты наблюдаются только в штатах где реальное d/r менялось, и где были более более крупные батчи. Почему оно менялось эти данные не объясняют и не могут объяснить. Возможно крупные батчи это подтасовка, но проблема в том что эти данные не дают статистического распределения батчей достаточно точно, чтобы делать какие-то выводы.

Эффекты наблюдаются только в штатах где реальное d/r менялось, и где были более более крупные батчи. Почему оно менялось эти данные не объясняют и не могут объяснить.

Х было только там, где было Х, понятно. Я же и говорю — нам это утверждение совершенно неинтересно. Нам интересно, почему в других местах Х не было, раз он обязан возникать.

Что такое Х? Я могу для любых данных придумать свойство по которому выделить из них небольшое подмножество и сказать что это подозрительно.

Я могу для любых данных придумать свойство по которому выделить из них небольшое подмножество и сказать что это подозрительно.

Можете, конечно, но можно ли это свойство потом объяснить фальсификациями?

Согласен, и как связать аномалию округления с фальсификациями? Я думаю косвенно она связана с другим признаком в данных, но у меня логической цепочки не выстраивается. К тому же есть графики где у демократов падал рейтинг со временем


Надо чтобы объяснения через фальсификации были более правдоподобны чем другие. Иначе я буду склонятся к какому то другому объяснению.

Согласен, и как связать аномалию округления с фальсификациями?

А при чем тут аномалия округления? Мы связываем с фальсификацией не аномалию округления, а аномалию распределения.


Надо чтобы объяснения через фальсификации были более правдоподобны чем другие.

А есть другие? Пока что, вроде, ни одного никто не придумал.

Какое распределение? типа такого для относительно рандомых данных?


Это объясняет что ровные куски никакого отношения к mail-in не имееют.

Как это не имеют? Вернее, как это объясняется? Этого я не понял.


где погрешность каждой точки больше чем 100%

Почему?


а некоторые d/r вообще отрицательные?

Это где? Я не увидел ни одной такой точки.

а некоторые d/r вообще отрицательные?
Это где? Я не увидел ни одной такой точки.
А какое у вас значение выходит, когда за одного из кандидатов число расчётных голосов уменьшается, т.е., дельта (расчётное число голосов за кандидата в батче) меньше нуля?

Речь шла о графике и точках на нём.

График, который в твитах? Так он вообще с данными не соотносится, как видите. По данным там бы были отрицательные числа и прочие чудеса.

Для этого надо читать внимательно исходники и смотреть, как там человек предобрабатывал данные, а это мне делать неприятно (не люблю питон).

Кода с плоттингом данных нету, есть только код для конвертации json в сsv. В csv там сырые данные лежат, разве что сгруппированы по партиям, но это значения не имеет т.к. статистически значимых кандидата только два.


График делается так


dem = percent_dem * votes
rep = percent_rep * votes
plt.plot(np.diff(dem)/np.diff(rep))

np.diff это дискретная производная т.е. x_{n+1} — x_n.
погрешность значения dem примерно 1e6 * 1e-3 (миллион голосов на 3 знак округления percent_dem/rep) т.е. тысяча. Разных двух соседних dem равна размеру батча, т.е. тоже 1000. Получаем погрешность где-то 100%.


Upd в твиттере там обрезано от 0 до 2, но отрицательные точки есть как сказали выше.

Если кому-то не посвященному пытаться в этом разобраться то надо писать всё сначала.
1) Данные начинаются 03/11/2020 с 18-00 и с 20-00. Это время когда начинается подсчёт — оно разное в разных штататах?
2) Откуда идёт разброс вначале, какой размер одного батча? Живые голоса и почтовые имеют такую разную дисперсию? Непонятные выбросы продолжаются и ближе к концу…
3) Вообще что это за данные, это один участок или уже сумма по штату?
4) и так далее...


Может тут конечно ветка для избранных, но я мало что знаю про процедуру выборов в США, и думаю хабр в среднем тоже.

Данные начинаются 03/11/2020 с 18-00 и с 20-00. Это время когда начинается подсчёт — оно разное в разных штататах?

Зависит от того, считается ли по местному времени или по общему. Штаты живут в основном в трёх часовых зонах (хз, чо там на Аляске и в Гаваях).


Откуда идёт разброс вначале, какой размер одного батча? Живые голоса и почтовые имеют такую разную дисперсию? Непонятные выбросы продолжаются и ближе к концу…

Отличный, я бы даже сказал, ключевой вопрос.


Голоса имеют одинаковую дисперсию, группы голосов имеют разную. Сначала считаются голоса людей, пришедших голосовать ногами вживую, и каждый батч репортится с отдельного участка. Соответственно, в жутко консервативном месте у вас будет батч почти целиком за республиканцев, и D/R будет около нуля, а в другом месте у вас будет батч почти целиком за демократов, и D/R будет большим, а в третьем месте их будет плюс-минус поровну, и D/R будет в районе единицы.


Когда учитываются голоса по почте, то, если упрощать, голоса из разных округов с разной демографией перемешиваются, и поэтому можно ожидать, что пропорция D/R в каждом батче будет плюс-минус вокруг матожидания.


Выбросы ближе к концу — скорее всего, досчитываемые голоса от голосовавших вживую. Chamie правильно сказал про то, что учёт этих голосов прекращается не сразу, но вот большинство из них считается вначале, а не в конце, поэтому доля батчей, отклоняющихся от среднего, в самом начале почти сто процентов, а потом снижается до нуля (в соответствующем скользящем окне).


Вообще что это за данные, это один участок или уже сумма по штату?

Насколько я понимаю, это данные по всему штату.

Отличный, я бы даже сказал, ключевой вопрос.

правильно. надо понимать хотя бы что на графике по осям для начала :)


что есть этот батч подробнее? результат с одного изберательного участка или какой-то части штата (округ или как?). Т.е. на одном округе закончили весь подсчёт и отправили в центр и пошли по домам?


А почтовые голоса считают сразу в центре или тоже по округам сидят а потом отправляют батч в центр? В последнем случае у них разброс был бы такой же большой.


Я потому и спросил процедуру подсчёта от начала до конца. Потому что как устроено голосование по почте я не знаю. Это надо подбрасывать на каждом участке или сразу в цент привезти?


Простите что много вопросов )))

А вас не смутило, что было 95% и примерно всего 4.826млн голосов, а стало 99% и 4.920 голосов?) Мне кажется цифры от того и "EST", так как достаточно неточные.

UFO landed and left these words here
Согласен. А какую модель вы бы предложили для быстрой оценки? Я читаю лекции по мат.статистике студентам-журналистам, и стал для примера оценивать вероятность «переворота» пары штатов. Бернулли — довольно простая модель, конечно, не вполне адекватная. Если покопаться по опросам на сайте CNN-политика, то можно найти очень много интересного. Например, как голосуют белые и черные. Или отдельные графства в пределах одного штата (иногда — полярно).
UFO landed and left these words here
Хотя бы несколько полярных критериев, по расовой принадлежности, месту работы, возрасту

Но и эти критерии очень неоднозначно сработают. Потому что, например, в эти выборы единственная демографическая группа, которая в процентном отношении за Трампа голосовала меньше, чем в 2016-м — это "белые" мужчины.

UFO landed and left these words here
Да, последние 5% четко ложатся в 70/30. Если считать выборы честными, а объяснение — почтой или т.п., то надо было брать р=0.3, а не 0.5
UFO landed and left these words here
на Ваш ряд случайных числе абсолютно точно повлияли российские хакеры :)
доказательства потом
Не понимаю любви к республиканцам.
Республиканцы — это реднеки и хиллибилли.
image
Демократы — это Кремниевая Долина (без шуток, она расположена в демократическом штате).
Совершенно верно. Сторонники Трампа в среднем менее образованы(гуглите сами, если интересно) Что нам в очередной раз и продемонстрировал этот пост, кстати :)

Тут сразу несколько проблем: и отсутствие достаточного понимания предметной области, спекулятивные выводы на явно упрощенной модели, и субъевтиные взгляды и пристрастия автора, которые сквозят по всему посту и комментам, которые явно отразились на решении и выводах.

Хороший профессиоанльный аналитик — должен быть беспристрастен, когда речь идет о результатах его работы. Тем более, если он пытается кого-то обучать.
А сторонники Байдена — смузихлёбы и SJW. Дальше то что?
Без SJW вы бы сейчас могли не иметь возможность оставить этот коммментарий, так как в Интернет пускали бы только дворян.
Вы путаете борцов за свободу слова с SJW. SJW сейчас активно борются со свободой слова, потому что «я за свободу слова, но против хейтспича. Что такое хейтспич решаю а сам, поэтому забаньте все что мне не нравится».
В Калифорнии с 1983 по 2011 был только один губернатор от Демократической партии и тот всего 4 года. Ярко с