Да, причем его построение наиболее оптимально, на мой взгляд, следующий образом:
1) сортируются по числу вхождений серии
2) по ним строится дерево и маппинг битов на серии
3) по номерам создаем массив и в нем элементом будет битовая маска с записями всех серий с таким же номером
4) итого массив из 1000000 элементов
И уже по нему производим поиск.
Если не ошибаюсь, то в исходном файле есть записи хотя бы с одной серией для всех номеров от 000000 до 999999
У интела есть серия мини-пк Intel NUC
1) сортируются по числу вхождений серии
2) по ним строится дерево и маппинг битов на серии
3) по номерам создаем массив и в нем элементом будет битовая маска с записями всех серий с таким же номером
4) итого массив из 1000000 элементов
И уже по нему производим поиск.
Если не ошибаюсь, то в исходном файле есть записи хотя бы с одной серией для всех номеров от 000000 до 999999