All streams
Search
Write a publication
Pull to refresh
222
0
Андрей @OLS

User

Send message
А я то уже подготовился увидеть разбивку по времени количества запросов к Яндексу от сотрудников организаций, спрашивающих про котиков, WoT, и где купить платье/гаджет. Хотя, наверное, это лучше ВКонтакт знает…
Я под полярным днем имел в виду постоянное освещение солнцем в течение круглых суток полярных областей летом. Поэтому перещелкивал на июнь. Сейчас ситуация не воспроизводится — все отображается корректно — и полярный день летом и полярная ночь зимой. Возможно, то что Вы исправили с «самопересечением» — решило и эту проблему.
Сын попросил показать полярный день на Северном полюсе — перещелкнул на июнь.
К сожалению, сначала наблюдали целые сутки полярную ночь, а потом по глобусу пошли сечения освещенности в виде секторов, да и спутники весьма хаотично перескакивали раз в сутки.
Где-то наверное переполнение…
Лед на произвольном участке Волги
и так почти везде, где «есть жизнь» хотя бы из одного домика
Кстати, в РосРеестре за последние несколько месяцев появилось очень много космических снимков Европейской части с высоким разрешением.
Похоже они потихоньку выполняют свое обещание купить всю Европейскую часть и выложить в открытый доступ.
Все подстроки — дают прибавку на арифметическую прогрессию, так что формула (с 4-мя if) выводится однозначно
Как я понял, генетический алгоритм только распределяет правила «реакции мышц», но не модифицирует их количество и расположение.
Это скажем именно обучение конкретного вида страусов ходьбе, а не селекционирование гепардов из страусов.
Вы не сравнивали, насколько этот метод лучше часто используемой нормированной суммы 12 равномерно распределенных случайных величин?
А почему Вы решили не пользоваться быстрыми криптостойкими хеш-функциями (в режиме счетчика)?
Не все в теплицах тюльпаны выращивают — некоторые и огурцы.
Так вот с ними проблема вентилятором не решается — пчелы и шмели не любят такой способ попадания в теплицу — им открытое окно подавай.
То есть детей все таки на бета-тестирование позвать можно?
Перед началом расчетов я задавал себе этот же самый вопрос — не должна ли формула ожидаемой частоты выглядеть как Ei=c*(bi/d)? Правда с другой аргументацией — я считал, что после объединения корпусов объединенный корпус становится слишком Хабра-ориентированным, т.к. доля Хабра в общем русском языке гораздо меньше, чем 33/(33+192), а следовательно мы сравниваем с уже достаточно про-ИТ-шным корпусом.

Но после размышлений, я решил оставить формулы авторов без изменений. Их мотивация тоже в принципе понятна — в статистике задача проверки принадлежности конкретной наблюдаемой выборки конкретному генеральному распределению хорошо изучена, а она подразумевает объединение корпусов.

В конце концов, масштабы корпусов адекватны — первый как минимум в 7 раз меньше объединенного. Поэтому я решил не изменять методику.
Умножает оценку вероятности (дробь) на объем первого корпуса (с), чтобы получить ожидаемую частоту появления слова в данном корпусе.
Аналогия:
Из 1000 (с) подбрасываний монеты с известной оценкой выпадения решки 0.5 (дробь) ожидается 500 (Ei) наблюдаемых исходов «выпала решка».
«лог» — есть, «логи» — нет
То есть Вы считаете, что компьютерный термин «лог» произошел от значения «овраг»?
Мне более привычна версия происхождения от «log-book» — «судовой журнал для периодической записи скорости судна», который в свою очередь произошел от «log» — лаг.
Искренне извиняюсь. Хотел успеть к пятнице, поскольку для буднего дня считаю такой пост слишком легкомысленным. Ну и соответственно в 2 часа ночи засыпающий мозг уже начинает выдавать подобные неологизмы.
Считаю корпус, созданный Muxto, вполне репрезентативным — 33 000 000 единиц, около 430 000 уникальных словоформ, частота 50 000-ой по частоте словоформы — 53 появления. Так что Ваша идея по корпусу Хабра вполне реализуема. Сложнее понять, какие именно срезы были бы интересны.

Information

Rating
Does not participate
Location
Россия
Registered
Activity