Как стать автором
Обновить
3
0
Михаил @Rebelqwe

Начальник отдела программирования

Отправить сообщение

Частичное обновление больших объемов данных в таблицах, которые активно используются пользователями на чтение осуществляется без всяких партиций выбором такого движка СУБД, который блокирует на чтение только ту строку, для которой сейчас идёт update, оставляя все остальные строки таблицы доступными для чтения.

Спасибо за адекватные комментарии. Гипотеза сравнения средних, используемая в анализе заключалась в том, что без РПУ среднее количество побед будет меняться случайным образом в пределах случайных отклонений. При включении РПУ средний процент побед статистически значимо изменится. Что и подтвердилось.

Приведенные факторы, как усталость, наличие в определенное время большего количества скиловых игроков, выходные и т.д. при отсутствии РПУ никак не могут повлиять на среднее количество побед статистически значимо.

Давайте разберем пример со скиловыми игроками. Доведем до абсурда, было 1000 ботов в игре и "скиловый игрок", "скиловый игрок" выигрывал в среднем 53% боёв в течении 100 дней. Допустим в игру еще на 100 дней добавили 50 "киберкотлет" и их разбрасывает по боям совершенно случайно. Давайте подумаем, поменяется ли статистически значимо средний процент выигрыша у "скилового игрока", если посчитать корректно вероятности? Вот тут и применяем гипотезу. Если "киберкотлет" по боям распределять только случайно, без подкруток РПУ, вероятность выигрыша не поменяется значимо. Будут изменения в пределах погрешности. Если упрощать, то в среднем за 100 дней совершенно случайного распределения 50 "киберкотлет", они будут попадать одинаково часто как за игрока так и против примерно в одинаковых количествах с одинаковой частотой. Статистически значимо поменяется процент побед только если распределение "киберкотлет" по боям искусственно изменено в пользу или против "скилового игрока".

Аналогичным образом случайно распределятся и моменты усталости/не усталости, игры в выходные/не выходные, игра при низком/высоком онлайне. Это всё не будет иметь статистически значимых влияний на показатель, все эти процессы случайным образом распределены. Если их не подкручивать, всё перечисленное не может оказать статистически значимого влияния на показатель.

Именно такое, статистически значимое отличие среднего и было найдено в результате анализа.

Особенно интересен такой вектор атаки, как "Невинмательонсть".

Очень похоже на новость о том, как исследователь, пойманный на фальсификации данных исследования, пытается отбелить свою репутацию через суд.

С пожертвованиями тоже не очень понятно, если жертвовали Донован на проект, как деньгами может распоряжаться университет? Пожертвования и гранты не так работают. Если пожертвовали именно университету, и университет распоряжается этими пожертвованиями, какое право на них имеет Донован?

Эффектом Даннинга-Крюгера является уменьшение разности у 4-й квартили на графике, представленном в исследовании, по сравнению с первой квартилью. Рисунок 9 наглядно демонстрирует картину отсутствия эффекта Даннинга-Крюгера. На Рисунке 9 разность в первой кваритиле равна разности в 4-й квартили, что и подтверждается в дальнейшем тем, что данные были совершенно случайными.

Кого пытается обмануть автор, утверждая, что на Рисунке 9 изображен "огромный эффект" Даннинга-Крюгера, при том, что рисунок явно демонстрирует полное отсутствие эффекта Даннинга-Крюгера, мне не понятно.

Естественно, и все остальные выводы, которые сделаны на основе такой некорректной интерпретации графика совершенно ошибочны. Рисунок 9 однозначно доказывает, что эффект Даннинга-Крюгера совершенно точно не автокорреляция.

В попытках перехитрить нас, перехитрили сами себя. На рисунке 9 прекрасно видно, что эффекта никакого нет, данные по оценке не коррелируют с результатами теста. Из графика видно, что хорошо ставшие тест, так и плохо сдавшие тест одинаково некорректно оценивают свои способности (что и подтверждается в дальнейшем, ведь данные случайные). Надпись под рисунком утверждает, что есть большой эффект. Кого вы пытались надуть неверно интерпретировав график и построив на этом опровержение? То, что в реальности график Даннинга-Крюгера отличается от случайного и доказывает наличие эффекта.

Вот так выглядят пластины из кремния. Покрытие кремния ирридием вообще никак не относится к технологиям производства микросхем и это именно прорези, сквозь них виден тряпичный материал, на котором лежит пластина с прорезями.

MEMS-based fabrication approach это совсем не про производство микросхем, да и на фото не кусок кремния, а обычный металл, скорее титан или алюминий. И прорези на фото значительно шире чем 200 𝜇m

Ширина папиллярных линий в различных частях узора неодинакова и колеблется от 0,4 до 0,6мм. Каналы там примерно в 2 раза тоньше папиллярных линий, т.е. самый тонкий как раз 0.2мм. 490 рублей такая фреза стоит.

Технологии для производства микросхем подразумевает травление кристалла кремния в кислоте. А на фото обычный кусок металла, обработанный обычной фрезой.

Все верно sample()генерит каждый раз разные последовательности, а не каждый раз одинаковую, также как бросая следующую монетку 100 раз вы никогда не получите то же распределение, что и с предыдущей.

Я утверждал, что если вы перевернете каждую пятую монетку, все параметры распределения изменятся и продемонстрировал, что в реальной жизни, независимо от ваших представлений о ней, параметры распределения меняются каждый раз когда вы пытаетесь так "сжульничать".

То, что поменяется тип распределения я, вроде, не утверждал никогда.

Я уже все проверил. Возьмите и проверьте в R самостоятельно. Код инвертирует каждое пятое значение, это очевидно, даже если его просто прочитать. Объясняется всё независимостью испытаний. Каждый из N бросков монетки не зависит от предыдущих N-1 результатов броска, так что в таких последовательностях из каждого пятого элемента не должно быть равное количество 0 и 1, каждого значения. Будет совершенно случайное количество, близкое к определенному пределу, но не ограниченное по максимуму ничем, кроме N, вплоть до всех нулей и всех единиц. А статистические характеристики не меняются только в случае, если вы одинаковое количество элементов перевернете.

Я сделал то, что было предложено, я проверил, что это изменяется каждое пятое значение и ставил цикл на 1000000 повторений этих операций, чтобы цикл прерывался, если параметры до и после подмены остались одинаковые. Цикл ни разу не прервался, это совершенно очевидно, что именно так работает случайность, когда вносишь какой-либо порядок в энтропию. Возможно, что раз в триллион операций такое случайно и может случиться, но это будет экстремально редкой удачей.

Код у вас есть, можете повторить или указать, где в нем ошибка, конкретно.

Если говорить о более понятном эксперименте, то представьте, что вы начали с 0 по х рисовать линию, кидаете монету и сдвигаете точку на +1 по y, если орел и на -1, если решка. Если монета сбалансирована и действительно выдает рандом, предел, на который вы можете отклонится по у за N бросков равен N, как бы парадоксально это не звучало. Точно так-же как в действительно рандомной последовательности все или большая часть пятых чисел могут оказаться только 0 или только 1.

Я написал

Внутри распределения бросков монетки, где каждая пятая перевернутая значительно перекосит все характеристики распределения 

Вы ответили

Ржунимагу. И этот человек пытается вещать про статистику!

Когда я показал, что все характеристики действительно искажаются, вы назвали это передергиванием. У меня кончились идеи как бороться с вашим эффектом Даннинга-Крюгера.

Вы утверждали, что такая операция не меняет свойств распределения, я показал обратное. Ничего личного, просто вы ошибаетесь.

Если я, скажем, каждую пятую монету буду жульнически переворачивать после броска, то это на статистику распределения монет не повлияет.

Давайте поменяем, таким способом выборку в 1000 значений, где 1 - орел, 0 - решка

> sequence <- sample(c(0, 1), 1000, replace = TRUE)

> mean(sequence)

[1] 0.51

> var(sequence) [

1] 0.2501502

> median(sequence)

[1] 1

> # Loop through each value in the sequence

> for (i in 1:length(sequence)) {

# Check if the index is a multiple of 5

if (i %% 5 == 0) {

# Change the value to its opposite

sequence[i] <- !sequence[i]

}

}

> mean(sequence)

[1] 0.504

> var(sequence)

[1] 0.2502462

> median(sequence)

[1] 0

Все параметры распределения существенно изменились. Особенно характерно изменение медианы. Оно сразу выдаёт подделку.

Распределения чего именно?

Уже этот вопрос выдаёт, что вы совсем не знакомы с теорией вероятности.

Статистическое распределение или распределение вероятностей, описывает, как распределяются значения для поля. Другими словами, статистическое распределение показывает, какие значения являются обычными, а какие - необычными.

Существует много видов статистических распределений, включая колоколообразное нормальное распределение. Мы используем статистическое распределение, чтобы определить, насколько велика вероятность того или иного значения. Например, если у нас есть значение хи-квадрат, то мы можем использовать распределение хи-квадрат, чтобы определить, насколько велика вероятность этого значения хи-квадрат.

Внутри распределения бросков монетки, где каждая пятая перевернутая значительно перекосит все характеристики распределения и уже на выборке из 1000 бросков можно будет уверенно выявить эту аномалию потому, что среднее такого распределения будет статистически значимо отличаться от случайного.

> А не смущает, что баланс побед команды при этом может быть нулевым или даже вовсе сдвинут в противоположную сторону?

Попробуйте сдвинуть в одну сторону, например, в сторону решки, баланс веса сорока монет и подбрасывать их так, чтобы среднее количество выпадений решки в 50-ти наборах испытаний по броску каждой из 40 монет статистически значимо не поменялось по сравнению с 50-тью испытаниях по броскам сорока не модифицированных монет. А ведь именно это вы и утверждаете, если задуматься. На мой взгляд довольно глупое и легко опровергаемое утверждение. Не получится вмешаться в случайные события так, чтобы статистические свойства распределения не менялись.

> Я такие сказки-оправдашки уже слышал - от тех, кому Улитка платит зарплату.

За это платят? Подскажете, где деньги получить?

Информация

В рейтинге
Не участвует
Откуда
Москва, Москва и Московская обл., Россия
Зарегистрирован
Активность

Специализация

Backend Developer, Data Scientist
Senior
От 200 000 ₽
Project management
Development management
Marketing research
Market research
Data Analysis
Tableau
R
Math statistics
Yandex DataLens
BI