Ударим биспектром по бездорожью, или как найти золото в Сибири

    В предыдущей статье Ищем рудное золото на острове Сумбава, Индонезия я рассказывал про поиски золота в Индонезии, где при схожей геологической ситуации золотые жилы зачастую выходят на поверхность, в то время как в Сибири жилы обычно погребены под толщей осадочных пород. Конечно, десятки метров наслоений разных геологических периодов и состава сильно усложняют задачу поиска рудных ископаемых. Кроме того, есть проблема наличия геологических данных, собранных непосредственно на местности — задачи обследования территории теплой Индонезии и морозной болотистой Сибири не сравнимы. А еще следует помнить про специфику России — детальные геологические обследования времен СССР до сих пор засекречены (а после того не проводились, по крайней мере, в сопоставимых масштабах), при этом бумажные карты и данные бурения находятся в архивах, а номера скважин на картах и в отчетах о бурении намеренно изменены и таблицы соответствия хранит министерство обороны… как в сказке про смерть Кащея. Так что в реальности эти данные все равно что и не существуют.


    В связи со сложностью задачи, нам потребуются серьезные статистические методы, такие, как полиспектральный анализ. Что интересно, такой анализатор у нас уже есть… в голове. Это легко подтвердить тем, что мы способны различать так называемый «малиновый звон» колоколов — этот эффект не проявляется на спектре, зато отлично виден на биспектре. Большинство людей отличает колокола с малиновым звоном, для этого даже не требуется наличие музыкального слуха. Опытный геолог, занимающийся визуальной дешифровкой космоснимков, способен вручную выделить на них элементы, сопутствующие различным погребенным геологическим структурам. Мы же, как обычно, воспользуемся вычислительными методами и построим 3D геологические модели для автоматизированного анализа.



    Введение


    Благодаря доступности платформы Google Earth Engine мы получили возможность статистического анализа огромного массива спутниковых данных и это изменило все. В самом деле, анализируя один оптический или радарный снимок, где интересующая нас геологическая картина замаскирована помехами как самого снимка, прошедшего многостадийную обработку, так и толщей случайных пород, мы мало что можем сделать для улучшения результатов — спектральный синтез гравики высокого разрешения и последующее решение обратной задачи только добавляют помехи. Зато в случае с ансамблем в сотню таких радарных снимков мы можем эффективно удалить помехи (в силу центральной предельной теоремы ожидаем их гауссовово распределение) и изучать ранее скрытое от нас геологическое строение. Не будем здесь углубляться в фундаментальную радиофизику, отмечу лишь, что спектры высших порядков от гауссова сигнала равны нулю — значит, используя биспектральный анализ, мы можем исключить как помехи спутниковой съемки, так и влияние толщи случайно распределенных осадочных пород. Попросту говоря, это эффективный метод выделения не-гауссовых составляющих сложных процессов и сигналов. В комментариях к предыдущей статье меня спрашивали про применимость (сканированных) карт для подобных задач — очевидно, что они полностью бесполезны для статистического анализа. Для специалистов добавлю, что триспектры (и спектры высших порядков) тоже подходят, но и ошибка вычисления моментов высших порядков растет, так что даже с биспектром это представляет непростую техническую задачу. Кстати, фрактальные геологические объекты такие, как рудные жилы и зоны, выделяются в биспектре геологической модели — поскольку фрактальность подразумевает связь масштабов, это означает связь пространственных частот и автоматически выделяется на полиспектрах. Также для специалистов замечу, что для меня очень полезной оказалась идея вычисления фрактальности через производные дробных порядков.


    Мы уже использовали амплитудный биспектральный анализ для Индонезии — модели вертикальных аномалий получены именно этим методом. Но для Индонезии это не так важно, поскольку там для поиска достаточно модели плотности, полученной методом инверсии детального гравитационного поля, синтезированного на основе глобальной гравитационной модели низкого разрешения, рельефа ALOS 30 м и радарных снимков Sentinel-1 10 м. Как показано в предыдущей статье, построенная модель машинного обучения обеспечивает высокую точность, а дополнительный анализ позволяет нам непосредственно увидеть геологическое строение и понять логику работы нашей модели машинного обучения. С другой стороны, детальность биспектральной модели выше за счет снижения уровня шумов (это и визуально заметно на представленных картинках), а это важно всегда. По биспектру плотности можно восстановить исходную модель плотности с меньшим уровнем шумов, но на практике я этим не пользуюсь (в том числе, потому, что у нас нет способа оценить точность такой модели).


    Выбираем территорию


    Наша задача заключается в том, чтобы найти золото там, где его можно добывать, и на разумной глубине (обычно, несколько десятков метров) и, желательно, именно жилы рудного золота, а не рассеянное на большой территории так называемое вторичное золото (результат выветривания и эрозии выходов золотых жил). При этом, мы можем воспользоваться открыто доступными картами с известными месторождениями, обычно для них указаны содержание золота и глубина залегания. Выбор масштаба модели производится как поиск минимального уровня детализации, при котором на модели можно выделить известные месторождения по их геологическим свойствам. Каждое удвоение детализации почти удесятеряет размер модели (так как производится удвоение размера модели по трем координатам), что значительно увеличивает время и необходимые для построения и анализа модели вычислительные ресурсы.


    Для целей статьи нам подойдет относительно небольшой участок (чтобы удобно было рассматривать модель), где априори известно наличие золота и других минералов. Почему я говорю про наличие других минералов? Для первичного анализа нам необходимо точно знать, где золото есть, и где его нет, а для этого как нельзя лучше подойдет месторождение любых других ископаемых — очевидно, что добывая, скажем, бокситы (алюминий), нельзя было бы не заметить наличие там же золота. Для качественной классификации оптимальный вариант подготовки данных заключается в наложении карты известных месторождений на выходы руды по нашей модели и выбора для классификации их пересечения, но для предварительного анализа мы ограничимся контурами известных месторождений, полагая все воксели модели внутри контуров золотоносных участков продуктивными и все воксели внутри не золотоносных участков не продуктивными. Если у нас слишком малое количество известных вокселей в одном из классов (продуктивном или не продуктивном), то можно несколько уменьшить размер продуктивных контуров или увеличить размер не продуктивных (ни в коем случае не наоборот, по понятным причинам).


    Итак, возьмем на геологической карте СССР известное золоторудное месторождение в районе Егорьевского рудного узла на реке Суенга, рядом с которым находится месторождение молибдена. Смотрите региональные карты на сайте ВСЕГЕИ Материалы электронного издания ГГК-200/2, Материалы по листу N-45-XIII При наличии геологической модели региона таких карт вполне достаточно для наших целей. Для выбранного месторождения на нашей модели мы легко находим соответствующую рудоконтролирующую структуру подковообразной формы:



    Здесь участок внутренней границы структуры определяет залегание золота и соответствующий ему внешний — молибдена, цвета контуров золоторудного и молибденового участков (показаны кольцами на поверхности) совпадают с соответствующими рудными структурами на биспектральной модели (вертикальных аномалий плотности). Как видим, контуры с карты полезных ископаемых как-то странно сдвинуты от структуры на нашей модели. Эта загадка легко разрешается, если добавить к модели еще и рельеф:



    И теперь все становится совершенно понятно — выходы руды (обратите внимание на зубчатую границу подковообразной структуры ближе поверхности, похожую на старую разрушенную крепостную стену) за счет водной эрозии распределились по оконтуренным участкам, а за пределами этих участков из-за возрастающей крутизны склонов совсем смыты в реки. Выделяющиеся на рельефе желоба, простирающиеся с юго-запада на северо-восток и есть проявление одной из систем линеаментов для этой территории — именно к одному из них приурочено рудоконтролирующее разломное нарушение рассматриваемой геологической структуры. Явно перспективный участок нашей структуры дальше и левее, пересекаемый параллельным линеаментом, отличается более крутым уклоном к реке, так что близкое к поверхности золото оттуда просто смыто и без детального разведочного бурения рудные выходы там не найти (не исключено, что и этот участок известен и его можно найти на более детальных геологических картах, а возможно, золото там лежит и ждет нас… покажу геологу, на всякий случай, хотя для статьи я выбрал участок за границами нашего проекта). В реке здесь, кстати, присутствуют участки накопления рассеянного вторичного золота (которое нас сейчас не интересует, хотя мы уже даже могли бы его оконтурить). Таким образом, по структуре на геологической модели мы определяем (внутренний) золоторудный участок и (внешний) непродуктивный участок, необходимые нам для дальнейшего анализа методами машинного обучения.


    Структурный анализ


    Выбранных участков уже достаточно для создания модели машинного обучения и классификации всей интересующей нас территории на наличие золота, но сначала мы проанализируем геологические характеристики выбранных участков с помощью так называемого структурного геологического анализа. Как уже упоминалось в предыдущей статье, наличие выходов гидротермальных руд требует выполнения двух условий — присутствия глубинных структур, поднимающихся (почти) до поверхности, по которым просачивались гидротермальные растворы, и наличия нарушений этих структур, через которые растворы могли выходить наружу (приближаясь к выходу, растворы остывают и происходит процесс рудоосаждения в трещинах пород). Без подходящих структур рудоносные жидкости не могли бы подняться к поверхности, а без нарушения этих структур не могло быть постоянного притока, необходимого для рудонакопления. Хотя химические (и бактериальные) процессы намного сложнее и важны также температура, скорость остывания растворов и характеристики трещиноватости пород, не говоря уж о самих породах, мы ограничиваемся лишь рассмотрением рудоносных структур, которые можем увидеть на модели плотности. При анализе моделей плотности мы ищем ответ на вопрос, где могла образоваться золотая руда, но мы не можем сказать, где она действительно присутствует. Также мы можем определить связность выявленных структур и проследить другие выходы этих же структур — а потом выбрать те из них, к которым приурочены известные месторождения. Варьируя масштаб моделей, мы можем дать прогноз на территорию от небольшого лицензионного участка и до целого региона.


    Перейдем к практике. Геологические нарушения на модели плотности означают вариации плотности, значит, мы ожидаем увидеть значительную вариативность плотности в верхних золотоносных горизонтах (разрушенные структуры) и низкую вариативность (не нарушенные структуры) всей толщи пород глубже. При этом, наличие нарушений ниже интересующего нас горизонта делает его не продуктивным. Глубокие горизонты нас не интересуют с практической точки зрения — добывать проще с минимальной глубины, поэтому анализ мы проводим от поверхности вглубь. Поскольку фрактальность искомых структур подразумевает логарифмическую зависимость, рассмотрим графики логарифма плотности в зависимости от глубины:



    Из открытых данных известно, что рудные горизонты на этой территории залегают на глубинах 20-60 и 80 метров, и как раз для этих интервалов глубин мы нашли ожидаемые нарушения геологических структур.


    Снова возвращаясь к фрактальности строения рудоносных структур (жил, жильных зон и так далее), посмотрим корреляцию геологических горизонтов (то есть значений плотности на разной глубине), где визуально мы ожидаем найти некоторую периодическую структуру такой коррелограммы (в силу симметрии достаточно рассматривать лишь половину картинки выше или ниже диагонали, на которой значение корреляции равно единицы). Действительно, при анализе модели плотности на глубину 300 м мы можем увидеть отличие коррелограмм для участков с молибденом и золотом (для не рудных участков картина тоже отличается):



    Таким образом, полученные графики подтверждают все наши структурно-геологические предпосылки и свидетельствуют о верном выборе продуктивного и непродуктивного участков.


    Построим соответствующие графики и для биспектра нашей модели плотности (модели вертикальных аномалий):


    Как видим, у нас есть все инструменты для ручного анализа моделей и получения прогноза для золоторудных участков. Но мы не будем останавливаться на достигнутом и автоматизируем такой анализ с помощью методов машинного обучения.


    Анализ с помощью машинного обучения (классификатора)


    Для площадного анализа воспользуемся классификатором с гауссовым ядром, поскольку рудные области обладают типичным геологическим строением в плоскости поверхности. Дело в том, что мы ищем не отдельные (фрактальные) рудные жилы, а состоящие из групп таких жил геологические объекты. Как мы уже говорили, геологи не умеют работать непосредственно с фрактальными объектами, да и прекрасно без этого обходятся, поскольку в масштабе геологического исследования работают со скоплениями фрактальных структур, подчиняющихся гауссовой статистике. Итак, несмотря на фрактальное внутреннее строение рудонесущих структур, в плоскости выхода группы рудных жил наблюдается максимальная концентрация минерала в центре этой группы, а по радиальной координате плотность выходов жил и концентрации спадают приблизительно по гауссиане. При этом, крупные жильные выходы окружены более мелкими, образуя фрактальный рисунок гауссиан на поверхности. И на бумажных картах можно увидеть такую картину вокруг крупных месторождений, а при машинном анализе мы выделяем намного больше разномасштабных рудных зон. Для визуализации полученного прогноза мы исключаем мелкие объекты, при этом сохраняя их для последующей обработки такой, как вычисление индекса фрактальности золотоносных участков. Группируя найденные прогнозные участки по этому индексу, и сравнивая их с известными месторождениями, можно также сделать прогноз запасов руды и не только.


    Таким образом, для нашей задачи отлично работает классификатор SVC с ядром RBF. Хотя мы делаем классификацию поверхности территории, но при этом анализируем трехмерную модель плотности, где сами выходы руды могут находиться как на поверхности, так и под ней. Ничто не мешает построенный классификатор скорректировать по вертикальной координате, получив 3D карту, но на практике этого не требуется, поскольку и геологи и заказчики предпочитают работать с обычными картами на поверхности и отметками глубин на них.


    Заключение


    Как хорошо известно всем специалистам по работе с данными, много данных зачастую позволяют получить качественно иной результат. Как видим, и геология здесь не исключение. Используя доступ к огромным массивам спутниковых и прочих данных и соответствующие вычислительные ресурсы, возможно построить такие модели, которые еще недавно казались немыслимыми. При этом возникает ситуация, что геологу такие результаты просто не нужны, так как не в человеческих силах все это детально просмотреть и проанализировать. Ведь работа «по старинке» организована иерархически, так что огромное множество детальных карт и результатов объединяются в разные уровни с последовательным увеличением территории и уменьшением детальности. В ходе геологического исследования геолог оперирует разномасштабными картами и данными, на подготовку которых потрачены десятилетия работы целых отраслевых институтов и множества исследовательских экспедиций. И вот вместо всего этого, сегодня мы можем предложить геологу набор вычислительных моделей целого региона. К счастью, здесь нам на помощь приходят методы машинного обучения, так что обработка огромных моделей выполняется автоматизированно, а геолог получает карту перспективных участков и соответствующие этим участкам геологические модели. При этом обработка данных на всех масштабах выполняется с учетом требований конкретного проекта, что, конечно, раньше было просто невозможно. Мне нравится называть этот новый мир вычислительной геологией, хотя общепринятого термина еще нет.


    И несколько слов о том, о чем мы не поговорили. Модели плотности всем хороши, кроме того, что они ничего нам не говорят о характеристиках вещества. В то же время, если совместить модели по данным гравиметрии и магнитометрии, то разница между ними расскажет многое о химических процессах и составе пород. Можно ли извлечь соответствующую информацию со спутниковых снимков? Да, с помощью фильтра Габора. Дело в том, что, как минимум в региональном масштабе, магнитные аномалии связаны с нарушениями строения и линеаментами (выделенными направлениями простирания геологических структур и нарушений). Соответственно, ориентированные системы нарушений и аномалии отлично выделяются фильтром Габора. Итого, глубинные магнитные аномалии приводят к эффектам на поверхности, выделение которых асимметричным ориентированным фильтром и последующий анализ позволяют косвенно выявить исходные магнитные аномалии и сделать соответствующие выводы. Как раз в Сибири наблюдаются сложные системы разломов, которые плохо поддаются линеаментному анализу. На рассматриваемой нами территории Егорьевского рудного узла можно выделить три системы разнонаправленных разломов, присутствующих на всей территории.

    Реклама
    AdBlock похитил этот баннер, но баннеры не зубы — отрастут

    Подробнее

    Комментарии 13

      0
      Нагуглил статью 2005 года о «Егорьевском рудном узле». Думал речь о тоннах золота, а там две сотни килограмм:
      В настоящее время все месторождения и проявления золота Новосибирской области сосредоточены в пределах Егорьевского рудного узла. История открытия проявлений рудного золота в коренных породах начинается от рубежа веков, однако планомерное их изучение осуществляется лишь в последние 10–15 лет в процессе поисковых работ, предпринятых в 1980–1990 гг. Порезультатам поисковых и поисково-оценочных работ 1983–1993 гг. в пределах месторождения выявлено семь рудных тел (элювиальных россыпей) с преобладанием свободно извлекаемого гравитацией золота от 41 до 94%. Суммарные запасы россыпного золота в корах выветривания категорий С1 + С2 составили 3561,9 кг.

      Объекты добычи золота в Новосибирской области существенно уступают главным районам России – Магаданской области и Республике Саха. Они являются значимыми в масштабе Западно-Сибирского экономического района (второе место после Кемеровской области).

      Сейчас, учитывая малые экономические затраты на разработку месторождения, Новосибирская область оказалась в более выгодном положении по сравнению с другими районами, хотя за всю историю существования золотодобычи в Новосибирской области из недр изъято немногим больше 15 тонн золота, а в год добывается всего лишь 160–200 кг (по обиходным меркам золотодобытчиков меньше ведра).
        +1

        Вы смотрите оценку россыпного элювиального золота, которое образуется в ходе эрозии золоторудных пород. Именно его старатели с лотками могут намыть. А в статье речь про коренное, то есть сами золотосодержащие породы, которое еще поискать в глубине, но его там намного больше. Для его добычи нужно бурить, хотя для небольших глубин просто взрывают.

      0
      Евгений, здравствуйте! Подскажите пожалуйста — правильно ли я понял, что в данном случае, для построения предиктивной модели Вы использовали исключительно данные SRTM съемок? И уточните также — какова была площадь анализируемого участка?
        0

        Я не Евгений, но могу ответить. SRTM здесь я никак не использовал, а использовал рельеф ALOS. Поскольку компоненты пространственного спектра рельефа и графики совпадают с точностью до множителя, мы можем использовать результат полосовой фильтрации рельефа для решения обратной задачи и получения модели плотности. Ноутбуки для оценки компонентов и решения обратной задачи по ним я не раз выкладывал на гитхабе. Модель плотности служит исходными данными для классификатора (features), а известные участки с минералами — классами (class labels). Площадь рассматриваемого участка примерно 7 км. кв., по Сумбава 75 000 кв. м, но какая разница, если мы можем выбрать произвольную площадь.


        Если я вас правильно понял, то вы хотели бы прямо по рельефу построить классификатор — ничего хорошего не выйдет. Хотя так можно элювиальное золото искать, если у вас уже есть модель рудных жил такая, как мы рассматриваем в статье.

          0
          Алексей, извините непостижимым образом перепутал Ваше имя.
            0
            Насчет алгоритма действий — Вы берете модель рельефа, преобразуете ее в модель плотности, разбиваете на классы и смотрите в какие классы попадают эталонные участки? Правильно ли я понял?
            И кстати, россыпное золото — оно в большинстве случаев аллювиальное, а не элювиальное.
              0

              Вы сейчас говорите про обучение без учителя, то есть, кластеризацию. А в статье речь про обучение с учителем, классификацию, когда для известных участков присваиваются известные классы и по ним классифицируется вся территория. С моделью плотности вы правильно понимаете — идея в том, чтобы вместо ручного ее анализа сделать автоматизированный. На самом деле, модель и геологи смотрят и анализируют, но я рассказываю о том, что и как можно автоматизировать. Вообще существует множество методов построения обратных моделей, но дело в том, что без фильтрации исходной гравики они не дают однозначного решения, а с фильтрацией нам приходится оперировать набором разномасштабных моделей, что многократно усложняет работу геологов. Так вот для методов машинного обучения это как раз упрощает задачу — чем больше данных и чем они проще для анализа, тем лучше для всех таких методов.


              Я не геолог, так что просто посмотрел в открытых геологических отчетах на этот участок. Технически, литохимические потоки на рельефе сопоставляю с выходами руды на модели, это позволяет найти участки, где эти выходы расположены близко к поверхности. Удобно и для литохимических потоков делать классификатор по модели и рельефу и сопоставлять его с классификатором по рудным зонам.

                0
                Насчет кластеризации — я просто не стал приводить следующий шаг. Это моем понимании — автоматизированный поиск по эталонам.
                Хочу уточнить насчет исходных данных — это только модель рельефа или все же еще и гравитационное поле Земли?
                  0

                  Вот посмотрите статью с детализацией результатов известной статьи от НАСА: Spectral Coherence between Gravity and Bathymetry Grids Известной — потому что она включена в IHO-IOC GEBCO Cook Book
                  Пространственные спектральные компоненты гравики и рельефа совпадают с точностью до константного множителя, поэтому можно взять ИЛИ гравику, ИЛИ рельеф, ИЛИ их комбинацию. Прочитайте, как сделаны глобальные модели графики и топографии (GGMplus или Sandwell & Smith гравика, Gebco топография) — все они совмещают гравитационные данные и топографию, только используют не локальное преобразование (позволяющее совместить пространственные спектры для выбранной территории), а сферическое разложение (потому что это глобальные модели).


                  Аналогично и для спутниковых снимков, кстати. Вот экспериментальные статьи с исходным кодом:
                  The correlation between spatial spectrum components for global gravity models WGM2012 & GGMplus 2013 and global topography models ETOPO1 & SRTM 30
                  There is a high correlation between DEM and ortho photos

                    0
                    Спасибо, за ссылку на статью, обязательно посмотрю.
                0

                У меня на гитхабе есть пример классификации по набору каналов космоснимков и характеристикам рельефа: Linear classification for AU synthetic samples
                Такой подход как раз годится для поверхностного распределения минералов. Заменяем классификатор на гауссов и каналы снимков на плотности по горизонтам — и получаем то, что описано в статье выше.

          Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

          Самое читаемое