Сравнить два массива по 100 шинглов => 10000 операций сравнения
Во первых шинглы не нужно сравнивать, нужно сравнивать их хеши, а хешей 84*100 = 8400.
Во вторых хеши сравниваются с соответствующими т.е. CRC(1го шингла:1го сайта) с CRC(1го шингла:2го сайта) и т.д. до 100го шингла каждого сайта.
Ну и основной момент в том что поиск минимального значения хеша лишний.
Как я описывал выше, сравнивать элементы каждого из 84х массивов между собой — ресурсоемко. Для увеличения производительности выполним случайную выборку контрольных сумм для каждой из 84х строк двумерного массива, для обоих текстов. Например, будем выбирать самое минимальное значение из каждой строки.
Сравнение двух двумерных массивов по сложности такое же как и поиск минимального значения в одномерном с последующим сравнением их с соответствующими значениями из другого массива.
Для оптимизации предлагаю сравнивать не минимальные, а случайные или последовательно первый из первого шингла, второй со второго, 84й из 84го, а далее опять 1й,2й и т.д.
Сравнил вот с недавно вышедшим (есть уже в продаже и у нас) D90.
Отличается максимальной скоростью затвора 1/8000 у D300s против 1/4000 у D90, немного лучше вспышка, и скоростная съемка 6 кадров против 4.5, на этом все улучшения закончились. Из минусов тяжелее почти на 250грамм и отсутствие timelapse recording.
Не вижу смысла переплачивать 800$ за D300s.
Еще немного о краже велосипедов.
Паренек из NY решил поэксперементировать и вот что получилось www.youtube.com/watch?v=ZbklkFuFk-4 (англ.)
велосипед его :)
Во первых шинглы не нужно сравнивать, нужно сравнивать их хеши, а хешей 84*100 = 8400.
Во вторых хеши сравниваются с соответствующими т.е. CRC(1го шингла:1го сайта) с CRC(1го шингла:2го сайта) и т.д. до 100го шингла каждого сайта.
Ну и основной момент в том что поиск минимального значения хеша лишний.
Сравнение двух двумерных массивов по сложности такое же как и поиск минимального значения в одномерном с последующим сравнением их с соответствующими значениями из другого массива.
Пример: 100 шинглов * 84 хеша
8400 операции сравнения
поиск минимума 99 сравнений * 84 хеша + 84сравнения итого 8400 :)
Для оптимизации предлагаю сравнивать не минимальные, а случайные или последовательно первый из первого шингла, второй со второго, 84й из 84го, а далее опять 1й,2й и т.д.
Отличается максимальной скоростью затвора 1/8000 у D300s против 1/4000 у D90, немного лучше вспышка, и скоростная съемка 6 кадров против 4.5, на этом все улучшения закончились. Из минусов тяжелее почти на 250грамм и отсутствие timelapse recording.
Не вижу смысла переплачивать 800$ за D300s.
www.youtube.com/results?search_query=%D0%BD%D0%B5%D0%BD%D1%8C%D1%8E%D1%82%D0%BE%D0%BD%D0%BE%D0%B2%D1%81%D0%BA%D0%B0%D1%8F+%D0%B6%D0%B8%D0%B4%D0%BA%D0%BE%D1%81%D1%82%D1%8C&search_type=&aq=f
правда не так полезно как d3o :)
Если кто захочет поэкспериментировать сам, то такую жидкость можно приготовить из крахмала и воды. Смешиваем крахмал с водой до полного растворения потом отстаиваем часок и аккуратно сливаем почти всю воду, оставляем совсем немного, и жидкость готова:)
<html>
<body>
<form>
<input type="file" name="test" id="test" />
<input type="button" name="clear" value="clear" onclick="alert(document.getElementById('test').innerHTML); document.getElementById('test').innerHTML = document.getElementById('test').innerHTML;" />
</form>
</body>
</html>
Не очищает.
И alert в первый раз выдает пустую строку, а в последующие разы "<input>" N-1 раз подряд, где N — количество нажатий кнопки минус 1.
Паренек из NY решил поэксперементировать и вот что получилось
www.youtube.com/watch?v=ZbklkFuFk-4 (англ.)
велосипед его :)
:set cursorline
:set cursorcolumn