странно, что вспомнили Тимус с «очень большой базой» в 700 задач, а про Юву забыли.
Напоминаю :) uva.onlinejudge.org/, в придачу к действительно большой базе еще и регулярно проводятся контесты.
Кстати, а что случилось с ТТВ — белорусским аналогом топкодера?
Интересно, но уж слишком много magic numbers.
Почему 84 хэша? Для реализации алгоритмов, базирующихся на показанном? Странно, причинно-следственная связь не в ту сторону :)
Почему 10 слов в шингле?
Как уже упоминали выше, увеличения производительности путем выбора минимальных значений не достигается, все те же 8400 операций.
Ну и самое интересное — эффективность алгоритма. Почему следует использовать этот алгоритм? Насколько эффективно он позволяет найти дубликаты? Какова вычислительная сложность? Насколько критично количество сравниваемых документов? И т.д.
Напоминаю :)
uva.onlinejudge.org/, в придачу к действительно большой базе еще и регулярно проводятся контесты.
Кстати, а что случилось с ТТВ — белорусским аналогом топкодера?
Почему 84 хэша? Для реализации алгоритмов, базирующихся на показанном? Странно, причинно-следственная связь не в ту сторону :)
Почему 10 слов в шингле?
Как уже упоминали выше, увеличения производительности путем выбора минимальных значений не достигается, все те же 8400 операций.
Ну и самое интересное — эффективность алгоритма. Почему следует использовать этот алгоритм? Насколько эффективно он позволяет найти дубликаты? Какова вычислительная сложность? Насколько критично количество сравниваемых документов? И т.д.