Специалисты по искусственному интеллекту (ИИ) из Google AI с использованием машинного обучения разметили почти весь африканский континент, выделив на нём местоположение, размеры и другую информацию о 516 млн жилых домов и других строений. База создавалась с использованием спутниковых фотографий, и уже выложена в открытый доступ под названием Open Buildings. Детали распознавания подробно описаны в работе, выложенной на сайте arXiv.
Целей подобной разметки домов на карте может быть много – оценка количества жителей, планирование развития городов, развитие наук об окружающей среде, гуманитарные миссии. После какого-нибудь стихийного бедствия властям нужно прикинуть, сколько домов пострадало. В идеале для таких вещей требуется база данных с актуальными сведениями, полученными во время переписи. В реальности подобные данные быстро устаревают, а то и вовсе не собираются. Тогда альтернативным источником информации может послужить база с данными о местоположении зданий и плотности застройки.
Спутниковые фотографии – идеальный материал для сбора подобных данных, однако автоматический сбор информации при помощи систем компьютерного зрения сопряжён с определёнными трудностями. Компьютер не всегда может правильно распознать здания на снимках, сделанных из космоса, даже при высоком (30-50 см на пиксель) разрешении. Проблем распознаванию также доставляют неформальные поселения, дома, сливающиеся с окружением из-за использования природных материалов, а также природные образования, похожие на дома.
![](https://habrastorage.org/r/w1560/getpro/habr/post_images/da7/d46/472/da7d4647270e206290771027923f3ca1.png)
Слева сверху по часовой стрелке: пруды, камни, заборы, транспортные контейнеры.
Применив машинное обучение, исследователи собрали базу из 516 млн зданий почти по всему африканскому континенту. База устроена так, что подойдёт для нескольких видов использования в практических, научных и гуманитарных целях – от реакции на катастрофы до демографической разметки и планирования.
Для построения обучающего набора данных исследователи вручную разметили порядка 1,75 млн зданий на более чем 100 000 изображениях. Пример разметки приведён на фото ниже.
![](https://habrastorage.org/r/w1560/getpro/habr/post_images/1fb/4b2/139/1fb4b21395ac462943513a12331328dd.png)
Учитывались особенности африканского континента, которые могут запутать компьютер. К примеру, в сельской местности нужно было описывать различные типы жилья и отличать их от природных объектов. В городах нужно было разработать свои правила разметки для очень плотной застройки или длинных структур.
На примере 1) показана группа строений, сочетающая в себе как жилые дома, так и пристройки типа магазинов. Пример 2) – фото круглого дома с соломенной крышей, который машине трудно отличить от дерева. Тут нужно учитывать наличие тропинок, очищенных от растительности участков и теней. 3) – пример нескольких стоящих вместе зданий, которые трудно разграничить.
Обучение модели шло «снизу вверх», когда каждый пиксель относят либо к зданию, либо не к зданию, а потом пиксели группируются. Распознавание работало при помощи популярной для разбора спутниковых снимков модели U-Net.
Целей подобной разметки домов на карте может быть много – оценка количества жителей, планирование развития городов, развитие наук об окружающей среде, гуманитарные миссии. После какого-нибудь стихийного бедствия властям нужно прикинуть, сколько домов пострадало. В идеале для таких вещей требуется база данных с актуальными сведениями, полученными во время переписи. В реальности подобные данные быстро устаревают, а то и вовсе не собираются. Тогда альтернативным источником информации может послужить база с данными о местоположении зданий и плотности застройки.
Спутниковые фотографии – идеальный материал для сбора подобных данных, однако автоматический сбор информации при помощи систем компьютерного зрения сопряжён с определёнными трудностями. Компьютер не всегда может правильно распознать здания на снимках, сделанных из космоса, даже при высоком (30-50 см на пиксель) разрешении. Проблем распознаванию также доставляют неформальные поселения, дома, сливающиеся с окружением из-за использования природных материалов, а также природные образования, похожие на дома.
![](https://habrastorage.org/getpro/habr/post_images/da7/d46/472/da7d4647270e206290771027923f3ca1.png)
Слева сверху по часовой стрелке: пруды, камни, заборы, транспортные контейнеры.
Применив машинное обучение, исследователи собрали базу из 516 млн зданий почти по всему африканскому континенту. База устроена так, что подойдёт для нескольких видов использования в практических, научных и гуманитарных целях – от реакции на катастрофы до демографической разметки и планирования.
Для построения обучающего набора данных исследователи вручную разметили порядка 1,75 млн зданий на более чем 100 000 изображениях. Пример разметки приведён на фото ниже.
![](https://habrastorage.org/getpro/habr/post_images/1fb/4b2/139/1fb4b21395ac462943513a12331328dd.png)
Учитывались особенности африканского континента, которые могут запутать компьютер. К примеру, в сельской местности нужно было описывать различные типы жилья и отличать их от природных объектов. В городах нужно было разработать свои правила разметки для очень плотной застройки или длинных структур.
На примере 1) показана группа строений, сочетающая в себе как жилые дома, так и пристройки типа магазинов. Пример 2) – фото круглого дома с соломенной крышей, который машине трудно отличить от дерева. Тут нужно учитывать наличие тропинок, очищенных от растительности участков и теней. 3) – пример нескольких стоящих вместе зданий, которые трудно разграничить.
Обучение модели шло «снизу вверх», когда каждый пиксель относят либо к зданию, либо не к зданию, а потом пиксели группируются. Распознавание работало при помощи популярной для разбора спутниковых снимков модели U-Net.