Да, такая опасность есть. На мой взгляд, избежать этого можно за счет атомарности контента + метаданных, описывающих каждый атом (скажем: пример на питоне; из электротехники; уровень = такой-то).
Да, я согласен. То, что сейчас у меня есть — прототип примерно такого сервиса. Я профессионально занимаюсь Маткадом, поэтому база знаний на его основе. Кстати, курс во ВШЭ был как раз с практикумом на NumPy. До этого я делал похожий курс математики + Питон для ГикБрейнс (права у них, поэтому публиковать не могу). Но такое производство курсов очень расточительное. Ведь по сути на 50-90% повторяешь то, что уже кем-то сделано (да еще и лучше, чем у меня).
Я думаю потому же, почему до Курсеры не выкладывали курсы в общий доступ — из-за того, что авторы и вузы дрожат над своими авторскими правами. Хотя идее уже много лет (Semantic Web), да и Википедия — один из примеров, хотя и не особенно заточенных под образование.
Не соглашусь категорически про open-source, хотя я сам сторонник именно такого подхода. Если бы было так, не продавались бы книги по несколько сотен долларов. У меня самого очень много бесплатного контента, он копится 20 лет, причем почти ничего я не делал бесплатно — либо по грантам, либо по договорам (когда права оставались у меня). Еще больше сделал, но не могу выложить, т.к. права проданы. Спасибо за ссылки, курсы хорошие. Речь как раз об объединении усилий. Ведь один автор может хорошо написать пару параграфов про криптографию, а другой — про что-то еще. Но обучение подразумевает траекторию, в том числе, общие курсы по той же математике. Траекторию выгодно собрать из имеющегося контента, не создавая вновь уже сделанное. Собственно, про это мой проект.
все верно, просто небольшая терминологическая путаница. По-русски принято называть «Вычислительная математика» или «Численные методы» — если предмет про алгоритмы. Если же с уклоном в приложения (как у меня), то обычно говорят «computational science» (по-русски обычно «вычислительная физика»). Я не знаю, честно говоря, как лучше, и то так, то так называю.
Да, согласен. В моем случае до этого было далеко, и свои конспекты я по своей инициативе делал, отчасти, чтобы тестировать и продвигать вот этот свой проект. Но тут попутно возникает вопрос, который еще больше неприятен для преподавателей. Некоторые понимают, что их курсы после «оцифровки» вполне могут быть от них отчуждены. Например, вуз, возможно, рано или поздно захочет взять более дешевого преподавателя, коль скоро курс оцифрован. Не везде такое в принципе реализуемо, но кое-где — безусловно. И я знаю, что это реальная проблема, которая пугает коллег и заставляет их противиться даже записи Зумов (думаю, что без особых шансов).
Меня наняли на чтение обычного курса. Так вышло, что часть занятий получилась очно, а часть онлайн — через Зум. Честно говоря, вообще не вижу, какие доп. затраты должен нести вуз для перевода на дистант. Конечно, с поправкой на то, что ВШЭ — обеспеченный вуз. Аудитории заранее оборудованы (компьютер + WiFi + проектор), и LMS заранее была. Я старался максимально оттягивать момент перевода всего курса на дистант. Но когда ситуация с ковидом стала ухудшаться просто сказал студентам, чтобы они приходили очно по желанию и здоровые. И включал Зум, транслируя в него десктоп + две камеры (себя и доску). Я из мира ДО и скорее мне самому было интересно поработать в вузе, где это все заранее продумано. До чего-то у меня просто руки не дошли — например, не сделал тесты в LMS и не воспользовался прокторингом (который централизованно есть).
Свои материалы не передавал, но меня и не просили (положил в LMS в виде ссылок на свои ресурсы). А записи внутренних занятий, наоборот, не стал расшаривать (думаю, что права на них как бы у вуза).
Теперь я гораздо больше знаю о Джорджии, чем неделю назад. Тогда я просто залез на общую карту и взял средние цифры по всему штату 50/50. Что было бы правильно, если бы они равномерно по всему штату оставшиеся 5% досчитывали. Но на деле оказалось, что они считают почтовые бюллетени, или городские или уж не знаю что. Конечно, если знать детально, что именно недосчитали, то можно более адекватно посчитать.
Статья и модель вообще не про вбросы и не про политику, хотя заголовок немного кликбейтный, признаю. Задача про штат, где 5 млн избирателей, а разница между кандидатами на последнем проценте подсчета порядка 10 тыс. А подсчитать осталось 100 тыс. бюллетеней. И вопрос который я себе ставлю — «какова вероятность того, что тот, кто ведет сейчас, проиграет?». Иными словами: «Какова вероятность того, что соотношение последних бюллетений будет не около 50/50, а 45/55 или еще больше?». Самое простое, что можно использовать — модель Бернулли. И она довольно адекватная. Только какую вероятность отдельного голоса взять в качестве входного параметра?
Я взял р=0.5, исходя из 95% посчитанных бюллетеней
Но если знать, что досчитывают почту, надо брать р=0.3
А если бы знать, что, скажем, досчитывают голоса из Атланы, где распределение отличается от среднего по штату, а именно, 80/20, надо брать р=0.2
и т.д.
…
Задача-то не про политику, а про статистику. И она аналогична задаче типа «Какова вероятность того, что на 10 бросаниях монеты, орел выпадет не более трех раз?». Только у нас не 10, а 100 тыс. бросаний, и вопрос не про 3/7, а про 45/55.
Честно говоря, я начал считать по теореме Муавра-Лапласа (она как раз про такие оценки), но не с первого и не со 2-го раза получил правильные числа. И формулы в учебниках часто неправильные, и сам ошибался. Монте-Карло — очень простой и надежный метод. В основном, им сейчас считают надежность и риски, а не аналитикой.
Ну, если есть объяснение, почему на последних 5% не 50/50, а 70/30, то надо взять просто не р=0.5 (как у «честной монеты»), а р=0.3. Еще раз (не вдаваясь в политику): моя задача — оценить вероятность переворота штата на последних %, когда перевес мизерный.
Спасибо, вы правы, что почтовые голоса надо отдельно учитывать. Если отвлечься от политики, то ваши цифры означают, что для корректного прогноза надо понимать, какую часть почтовых голосов осталось посчитать и взять в схеме Бернулли вероятность успеха не р=0.5, а р=0.3.
Там есть и еще более разительные расхождения. В Атланте есть участки, где соотношение 85/15 за Байдена, а в пригороде — есть 15/85 за Трампа.
Моя модель не так плоха, хоть она и грубая. Вы правильно говорите о перекосе в демократов на последних %. Чтобы адекватно его учесть, надо понять, что недосчитано и вставить в модель адекватные вероятности р / (1-р). Я брал р = 50%, но возможно, надо было брать 30% или 10%. И понимать, почему так. В частности, почему подсчет по разным графствам в той же Джорджии дает настолько разные результаты. Например:
Clinch County
Trump 73.5% 2,105
Biden 26.1% 747
Clayton County
Biden 85.0% 95,476
Trump 14.1% 15,813
Спасибо, посмотрел. Можете объяснить про Джорджию? Я понял так, что надо было за 4 дня до дня голосования подать заявление. А считают те голоса, что пришли до дня голосования включительно. Или я не прав?
Georgia Absentee Ballot Application Deadline
In Person: Received 4 days before Election Day.
By Mail: Received 4 days before Election Day.
Online: Received 4 days before Election Day. Voted Absentee Ballot is Due
Received by the time the polls close on Election Day.
Свои материалы не передавал, но меня и не просили (положил в LMS в виде ссылок на свои ресурсы). А записи внутренних занятий, наоборот, не стал расшаривать (думаю, что права на них как бы у вуза).
и т.д.
…
Задача-то не про политику, а про статистику. И она аналогична задаче типа «Какова вероятность того, что на 10 бросаниях монеты, орел выпадет не более трех раз?». Только у нас не 10, а 100 тыс. бросаний, и вопрос не про 3/7, а про 45/55.
Там есть и еще более разительные расхождения. В Атланте есть участки, где соотношение 85/15 за Байдена, а в пригороде — есть 15/85 за Трампа.
Clinch County
Trump 73.5% 2,105
Biden 26.1% 747
Clayton County
Biden 85.0% 95,476
Trump 14.1% 15,813
Georgia
Absentee Ballot Application Deadline
In Person: Received 4 days before Election Day.
By Mail: Received 4 days before Election Day.
Online: Received 4 days before Election Day.
Voted Absentee Ballot is Due
Received by the time the polls close on Election Day.