Добрый день, Согласно AS_MUN_HIERARCHY_2_251_10_04_01_01.xsd в файлах AS_MUN_HIERARCHY_*.XML нет поля PATH. Да и в файлах AS_ADM_HIERARCHY_*.XML тоже. Можно узнать, откуда вы получили эту информацию?
Вы используете xml.etree.ElementTree и парсите XML целиком в память. Я столкнулся, что при обработке XML файлов размером по несколько сотен мегабайт и даже пару гигабайт, это происходит - ну очень долго:) Да и памяти нужно много. Я обрабатываю эти файлы, используя lxml, и делаю for event, element in ET.iterparse(xml_file, encoding='utf-8'). При этом сохраняю все данные в csv файл, который потом импортирую в постгрес, из которого уже можно делать все, что угодно. Получается относительно быстро.
Добрый день,
Согласно AS_MUN_HIERARCHY_2_251_10_04_01_01.xsd в файлах AS_MUN_HIERARCHY_*.XML нет поля PATH. Да и в файлах AS_ADM_HIERARCHY_*.XML тоже. Можно узнать, откуда вы получили эту информацию?
Вы используете xml.etree.ElementTree и парсите XML целиком в память. Я столкнулся, что при обработке XML файлов размером по несколько сотен мегабайт и даже пару гигабайт, это происходит - ну очень долго:) Да и памяти нужно много. Я обрабатываю эти файлы, используя lxml, и делаю for event, element in ET.iterparse(xml_file, encoding='utf-8'). При этом сохраняю все данные в csv файл, который потом импортирую в постгрес, из которого уже можно делать все, что угодно. Получается относительно быстро.
А вообще, ФИАС - очень веселая система:)