Если бензопилой вы себе отрежете ногу это не значит что она не работает. Это значит, что вы не правильно ее применили.
У каждой формулы есть область применения. Вилсон применен не верно. Он для биномиального распределения (почитайте вики по ссылке) для других распределений есть другие формулы.
предложенный метод не будет работать только потому что смысл его не понятен из статьи
Смысл его должен быть понятен из статьи. Почему он применим? Кроме «формулы на стекле» доводов нет.
То что он будет работать я не спорю. Вопрос как.
Метод дал лучшие результаты из всего, что я перепробовал, включая собственные разработки.
Вот это сильный довод. Однако, нет никакой конкретики. Например, какие методы вы перепробовали? Взвешивание, корень из N пробовали?
P.S. Я не говорил про то, что Вилсон совсем рандом дает. Он увеличивается с ростом числа оценок, следовательно, дает защиту от «одного пятибального голоса». Но аналогичных формул великое множество
К посту предлагаются букмарклеты для Хабра
Не вижу их в вашем посте. Можно ссылку? Они что работают лучше чем ±?
Его можно переводить в рейтинг какими угодно способами (шкалы от 0 до 5, от -2 до 2 и т. п.)
«Формула на стекле» предназначена исключительно для биномиального распределения. Выбор из двух вариантов это частный случай и обобщать его на несколько вариантов нельзя. Для других вариантов есть другие формулы, но проблема в том, что нужно знать тип распределения.
В двухвариантном случае всегда распределение — биномиальное в этой и вся прелесть. В многовариантном случае возможны множество видов распределений и нет универсальной формулы для доверительного интервала. Нужно анализировать выборку голосов по всем статьям на тип распределения и его параметры и уже из этого считать доверительный интервал (получится больше 1000 строк кода, чтобы работало все правильно и быстро).
А для двухвариантного случая использовать сложные формулы не нужно, в плюсах и минусах нет описываемой проблемы.
Для общего случая формула не применима, для частного не нужна.
И в этом смысле нижняя граница доверительного интервала (иными словами, пессимистичный прогноз) — отличная метрика для сравнения.
Для сравнения двух вариантов в А/Б тестировании — да. Мы можем определить вероятность того, что вариант А лучше Б. Но мы должны сравнивать не нижние (или верхние) границы, а нижнюю лучшего с верхней худшего. Нижние границы нельзя сравнивать с друг-другом — это же границы диапазонов.
Ну, допустим, мы сравнили нижние границы доверительных интервалов для А и Б. Ну у А оказался больше. Ну и что? Какой вывод можно сделать? Да никакого! С таким-же успехом можно сравнить среднеквадратичные отклонения, моменты и еще кучу умных слов. Для сравнение выборок есть другие параметры: мат.ожидание, среднее, медиана и мода.
Если вам так нравится Вильсон и доверительные интервалы можно почитать «шанс побить всех» и по нему сортировать. Но это программировать долго, а работать будет крайне медленно.
Любой контент на сайте имеет вероятность того, что он понравится пользователю. Это физический параметр такого объекта как контент.
Нижнюю границу чего предлагает считать автор? Вероятности того, что если пользователь проголосует, то он проголосует плюсом. А не процента пользователей которым нравится эта статья. Это две большие разницы.
Для варианта с кнопкой «Мне нравится» или просто с плюсом без минуса, можно считать по «формуле на стекле» в этой есть какой-то смысл поскольку варианта 2 (голосовать плюсом и не голосовать) и мы считаем какуе-то реальную величину. В случае ± в реальности есть три варианта: (голосовать +, голосовать -, не голосовать). Мы либо считаем комбинацию величин, либо просто неправильно применяем формулу и заставляем бедного Вильсона переворачиваться в гробу.
По поводу второй версии, то она чуток быстрее и не требует ключа (для плагинов к CMS, например, это важно). Но с документацией напряженка пока, особенно с событиями.
Советская система образования была хороша в контексте «развитого социализма», при капитализме она основательно разложилась. Коррупция, уровень преподавателей, дипломы для галочки, несоответствие числа выпускников по специальностям и спросу на них.
Проблемы высшего образования:
1. Число бюджетных мест определяется чиновниками и не последнюю роль в этом играют личные отношения главы кафедры/факультета/ВУЗа и чиновника, а спрос отходит на второй план. В итоге на рынке возникает нехватка одних специалистов и переизбыток других. В случае рыночного подхода к высшему образованию — балансировать число мест на различных специальностях будут организации выдающие кредиты (далее — банки). У них есть интерес не выдавать кредиты будущим безработным и дворникам.
2. Взятки при приеме на бюджет. С этой проблемой сейчас борются с помощью ЕГЭ. При рыночном подходе — оценивать способности будут либо банки либо будущие места для трудоустройства. В интересах и тех и других не выпускать безработных.
3. Получение высшего образования для галочки. Сейчас значительная часть студентов не собирается работать по специальности. В итоге, деньги просто выкидываются в трубу. Очевидно, то что платное образование отпугнет их, думаю.
4. Низкая зарплата преподов. Преподавать сейчас идут невостребованные на рынке специалисты. Еще советский преподавательский состав пока компенсирует эту проблему, но кто будет преподавать лет через 15? «Кто не умеет работать, учит как работать.»
5. Огромное число ненужных предметов (отчасти следствие предыдущего пункта). Когда я учился на «программиста»(в дипломе написано), то на 4-5 курсе у нас было только 2 пары (меньше 10%) программирования в неделю и то «ЧМ аэрогидродинамики».
6. Высокая инертность образования, отчасти причина в 4, отчасти в том, что у преподавателей нет стимула обновлять программу и в наличии необходимости согласования с чиновниками.
7. Отсутствие механизмов обратной связи. Нет объективного критерия оценки эффективности того или иного вуза или направления. Часть специалистов нанимают по черному или по серому, поэтому данные из налоговой неактуальны и планирование затруднено. При рыночное системе будет четкий критерий возврат/не возврат кредитов (такими данными банки обмениваются).
8. Слабая востребованность среднего специального образования. Например, большинство студенток-экономисток планирует работать бухгалтерами. Из-за бесплатности высшего образования на подготовку специалистов тратиться больше времени, а профильных предметов им читается меньше.
Очевидно что все эти проблемы системные и решать их нужно переопределением источника финансирования.
Если бензопилой вы себе отрежете ногу это не значит что она не работает. Это значит, что вы не правильно ее применили.
У каждой формулы есть область применения. Вилсон применен не верно. Он для биномиального распределения (почитайте вики по ссылке) для других распределений есть другие формулы.
Смысл его должен быть понятен из статьи. Почему он применим? Кроме «формулы на стекле» доводов нет.
То что он будет работать я не спорю. Вопрос как.
Вот это сильный довод. Однако, нет никакой конкретики. Например, какие методы вы перепробовали? Взвешивание, корень из N пробовали?
P.S. Я не говорил про то, что Вилсон совсем рандом дает. Он увеличивается с ростом числа оценок, следовательно, дает защиту от «одного пятибального голоса». Но аналогичных формул великое множество
Не вижу их в вашем посте. Можно ссылку? Они что работают лучше чем ±?
Его можно переводить в рейтинг какими угодно способами (шкалы от 0 до 5, от -2 до 2 и т. п.)«Формула на стекле» предназначена исключительно для биномиального распределения. Выбор из двух вариантов это частный случай и обобщать его на несколько вариантов нельзя. Для других вариантов есть другие формулы, но проблема в том, что нужно знать тип распределения.
В двухвариантном случае всегда распределение — биномиальное в этой и вся прелесть. В многовариантном случае возможны множество видов распределений и нет универсальной формулы для доверительного интервала. Нужно анализировать выборку голосов по всем статьям на тип распределения и его параметры и уже из этого считать доверительный интервал (получится больше 1000 строк кода, чтобы работало все правильно и быстро).
А для двухвариантного случая использовать сложные формулы не нужно, в плюсах и минусах нет описываемой проблемы.
Для общего случая формула не применима, для частного не нужна.
И в этом смысле нижняя граница доверительного интервала (иными словами, пессимистичный прогноз) — отличная метрика для сравнения.Для сравнения двух вариантов в А/Б тестировании — да. Мы можем определить вероятность того, что вариант А лучше Б. Но мы должны сравнивать не нижние (или верхние) границы, а нижнюю лучшего с верхней худшего. Нижние границы нельзя сравнивать с друг-другом — это же границы диапазонов.
Ну, допустим, мы сравнили нижние границы доверительных интервалов для А и Б. Ну у А оказался больше. Ну и что? Какой вывод можно сделать? Да никакого! С таким-же успехом можно сравнить среднеквадратичные отклонения, моменты и еще кучу умных слов. Для сравнение выборок есть другие параметры: мат.ожидание, среднее, медиана и мода.
Если вам так нравится Вильсон и доверительные интервалы можно почитать «шанс побить всех» и по нему сортировать. Но это программировать долго, а работать будет крайне медленно.
Любой контент на сайте имеет вероятность того, что он понравится пользователю. Это физический параметр такого объекта как контент.Нижнюю границу чего предлагает считать автор? Вероятности того, что если пользователь проголосует, то он проголосует плюсом. А не процента пользователей которым нравится эта статья. Это две большие разницы.
Для варианта с кнопкой «Мне нравится» или просто с плюсом без минуса, можно считать по «формуле на стекле» в этой есть какой-то смысл поскольку варианта 2 (голосовать плюсом и не голосовать) и мы считаем какуе-то реальную величину. В случае ± в реальности есть три варианта: (голосовать +, голосовать -, не голосовать). Мы либо считаем комбинацию величин, либо просто неправильно применяем формулу и заставляем бедного Вильсона переворачиваться в гробу.
Проблемы высшего образования:
1. Число бюджетных мест определяется чиновниками и не последнюю роль в этом играют личные отношения главы кафедры/факультета/ВУЗа и чиновника, а спрос отходит на второй план. В итоге на рынке возникает нехватка одних специалистов и переизбыток других. В случае рыночного подхода к высшему образованию — балансировать число мест на различных специальностях будут организации выдающие кредиты (далее — банки). У них есть интерес не выдавать кредиты будущим безработным и дворникам.
2. Взятки при приеме на бюджет. С этой проблемой сейчас борются с помощью ЕГЭ. При рыночном подходе — оценивать способности будут либо банки либо будущие места для трудоустройства. В интересах и тех и других не выпускать безработных.
3. Получение высшего образования для галочки. Сейчас значительная часть студентов не собирается работать по специальности. В итоге, деньги просто выкидываются в трубу. Очевидно, то что платное образование отпугнет их, думаю.
4. Низкая зарплата преподов. Преподавать сейчас идут невостребованные на рынке специалисты. Еще советский преподавательский состав пока компенсирует эту проблему, но кто будет преподавать лет через 15? «Кто не умеет работать, учит как работать.»
5. Огромное число ненужных предметов (отчасти следствие предыдущего пункта). Когда я учился на «программиста»(в дипломе написано), то на 4-5 курсе у нас было только 2 пары (меньше 10%) программирования в неделю и то «ЧМ аэрогидродинамики».
6. Высокая инертность образования, отчасти причина в 4, отчасти в том, что у преподавателей нет стимула обновлять программу и в наличии необходимости согласования с чиновниками.
7. Отсутствие механизмов обратной связи. Нет объективного критерия оценки эффективности того или иного вуза или направления. Часть специалистов нанимают по черному или по серому, поэтому данные из налоговой неактуальны и планирование затруднено. При рыночное системе будет четкий критерий возврат/не возврат кредитов (такими данными банки обмениваются).
8. Слабая востребованность среднего специального образования. Например, большинство студенток-экономисток планирует работать бухгалтерами. Из-за бесплатности высшего образования на подготовку специалистов тратиться больше времени, а профильных предметов им читается меньше.
Очевидно что все эти проблемы системные и решать их нужно переопределением источника финансирования.