А я то уже подготовился увидеть разбивку по времени количества запросов к Яндексу от сотрудников организаций, спрашивающих про котиков, WoT, и где купить платье/гаджет. Хотя, наверное, это лучше ВКонтакт знает…
Я под полярным днем имел в виду постоянное освещение солнцем в течение круглых суток полярных областей летом. Поэтому перещелкивал на июнь. Сейчас ситуация не воспроизводится — все отображается корректно — и полярный день летом и полярная ночь зимой. Возможно, то что Вы исправили с «самопересечением» — решило и эту проблему.
Сын попросил показать полярный день на Северном полюсе — перещелкнул на июнь.
К сожалению, сначала наблюдали целые сутки полярную ночь, а потом по глобусу пошли сечения освещенности в виде секторов, да и спутники весьма хаотично перескакивали раз в сутки.
Где-то наверное переполнение…
Кстати, в РосРеестре за последние несколько месяцев появилось очень много космических снимков Европейской части с высоким разрешением.
Похоже они потихоньку выполняют свое обещание купить всю Европейскую часть и выложить в открытый доступ.
Как я понял, генетический алгоритм только распределяет правила «реакции мышц», но не модифицирует их количество и расположение.
Это скажем именно обучение конкретного вида страусов ходьбе, а не селекционирование гепардов из страусов.
Не все в теплицах тюльпаны выращивают — некоторые и огурцы.
Так вот с ними проблема вентилятором не решается — пчелы и шмели не любят такой способ попадания в теплицу — им открытое окно подавай.
Перед началом расчетов я задавал себе этот же самый вопрос — не должна ли формула ожидаемой частоты выглядеть как Ei=c*(bi/d)? Правда с другой аргументацией — я считал, что после объединения корпусов объединенный корпус становится слишком Хабра-ориентированным, т.к. доля Хабра в общем русском языке гораздо меньше, чем 33/(33+192), а следовательно мы сравниваем с уже достаточно про-ИТ-шным корпусом.
Но после размышлений, я решил оставить формулы авторов без изменений. Их мотивация тоже в принципе понятна — в статистике задача проверки принадлежности конкретной наблюдаемой выборки конкретному генеральному распределению хорошо изучена, а она подразумевает объединение корпусов.
В конце концов, масштабы корпусов адекватны — первый как минимум в 7 раз меньше объединенного. Поэтому я решил не изменять методику.
Умножает оценку вероятности (дробь) на объем первого корпуса (с), чтобы получить ожидаемую частоту появления слова в данном корпусе.
Аналогия:
Из 1000 (с) подбрасываний монеты с известной оценкой выпадения решки 0.5 (дробь) ожидается 500 (Ei) наблюдаемых исходов «выпала решка».
То есть Вы считаете, что компьютерный термин «лог» произошел от значения «овраг»?
Мне более привычна версия происхождения от «log-book» — «судовой журнал для периодической записи скорости судна», который в свою очередь произошел от «log» — лаг.
Искренне извиняюсь. Хотел успеть к пятнице, поскольку для буднего дня считаю такой пост слишком легкомысленным. Ну и соответственно в 2 часа ночи засыпающий мозг уже начинает выдавать подобные неологизмы.
Считаю корпус, созданный Muxto, вполне репрезентативным — 33 000 000 единиц, около 430 000 уникальных словоформ, частота 50 000-ой по частоте словоформы — 53 появления. Так что Ваша идея по корпусу Хабра вполне реализуема. Сложнее понять, какие именно срезы были бы интересны.
К сожалению, сначала наблюдали целые сутки полярную ночь, а потом по глобусу пошли сечения освещенности в виде секторов, да и спутники весьма хаотично перескакивали раз в сутки.
Где-то наверное переполнение…
и так почти везде, где «есть жизнь» хотя бы из одного домика
Похоже они потихоньку выполняют свое обещание купить всю Европейскую часть и выложить в открытый доступ.
Это скажем именно обучение конкретного вида страусов ходьбе, а не селекционирование гепардов из страусов.
Так вот с ними проблема вентилятором не решается — пчелы и шмели не любят такой способ попадания в теплицу — им открытое окно подавай.
Но после размышлений, я решил оставить формулы авторов без изменений. Их мотивация тоже в принципе понятна — в статистике задача проверки принадлежности конкретной наблюдаемой выборки конкретному генеральному распределению хорошо изучена, а она подразумевает объединение корпусов.
В конце концов, масштабы корпусов адекватны — первый как минимум в 7 раз меньше объединенного. Поэтому я решил не изменять методику.
Аналогия:
Из 1000 (с) подбрасываний монеты с известной оценкой выпадения решки 0.5 (дробь) ожидается 500 (Ei) наблюдаемых исходов «выпала решка».
Мне более привычна версия происхождения от «log-book» — «судовой журнал для периодической записи скорости судна», который в свою очередь произошел от «log» — лаг.