Возьму на себя смелость выложить результаты моего грубого тестирования, которые я получил самостоятельно проверкой submissions, которые вчера выложили организаторы. Результат, в общем, не претендует на достоверность и не гарантирует точности.

Результаты под, Осторожно, Спойлером!

N  SUBMISSION                  ACCURACY	
1  5747452a63905b3a11d97c13    83.67	
2  5748dc6363905b3a11d97d03    83.11	
3  57581ef1bb50d92eb4000001    83.03	
4  57483bab63905b3a11d97c5c    83.00	
5  57487e6a63905b3a11d97c73    82.16	
6  5748dc5763905b3a11d97d02    81.62	
7  5748a0a363905b3a11d97c96    81.59	
8  5745fc8163905b3a11d97be3    81.53 (*)
9  5748df1c63905b3a11d97d0f    81.51	
10 5748dda963905b3a11d97d06    81.44	
11 5748dded63905b3a11d97d0a    81.30	
12 5748c16c63905b3a11d97cd0    81.29	
13 5747e9eb63905b3a11d97c45    81.25	
14 5747dbba63905b3a11d97c3d    81.25	
15 5748a0fe63905b3a11d97c99    81.20	
16 574893e463905b3a11d97c85    81.20	
17 57485c0f63905b3a11d97c65    81.17	
18 574713ca63905b3a11d97c03    80.60 (*)
19 5735b994a6200f187771219a    80.41	
20 5746978e63905b3a11d97bee    80.19	
21 5748a78563905b3a11d97ca3    80.13

О методике моего грубого тестировании

Для предварительного тестирования я использовал собственный скрипт, который я прогнал на 312 решениях на выборке из 1000 слов. В результате:

5 решений тестировались очень медленно и вообще не выдали результата за 30 секунд на 1000 слов. Я эти решения прервал и далее не тестировал
5 решений тестировались отностительно медленно (более 10 секунд на 1000 слов), выдали не очень большие результаты. Далее я эти решения не тестировал
44 решений завершились ошибкой. Я их далее не тестировал не разбираясь с причинами
258 решений прошли предварительное тестирование, были перетестированы мной на 10 тыс слов. На основании 10К тестирования я выбрал топ решений, которые преодолели 80% рубеж на 10000 слов. Всего получилось 21 такое решение. После этого перетестировал топ 21 с помощью скрипта организаторов. Два таких решения (помечены звездочкой) тестировались медленно, и я прервал тестирование, а в качестве оценки точности данных решений использовал результат, полученный на 10К тестовых слов