Знаете ли вы, что в период с 15 октября по 15 декабря проходит один из крупнейших в мире чемпионатов по анализу сейсмических данных «Rosneft Seismic Challenge» с суммарным призовым фондов в 1 миллион рублей и финалом 21 декабря в Москве?
Считается, что попасть в нефтяную отрасль, где зарплаты не уступают IT-индустрии, со стороны довольно сложно. В этом есть доля правды, потому как сфера довольно специфичная и не жалует людей “не в теме”. Данное мероприятие направлено на то, чтобы упростить вхождение в этот подземный мир для молодых и талантливых команд, работающих с распознаванием изображений и машинным обучением.
Я размещаю данный топик в разделе “Я пиарюсь”, потому что: а) хочу помочь землякам-уфимцам; б) верю в высокую квалификацию хабражителей. И будет здорово, если одни встретят других. Заодно немного побуду переводчиком с технологического на человеческий.
Задача звучит так: “Выделение сейсмических горизонтов в кубе амплитуд – сегментация данных с помощью распознавания изображений”. Чемпионат размещен на платформе Boosters.pro. Устроителем является корпоративный институт ООО “БашНИПИнефть”, один из лидеров (как это ни странно) в области разработки нефтегазового ПО. Показательным примером их успешной работы можно назвать разработку и внедрение РН-ГРИД – собственного промышленного программного обеспечения для математического моделирования и анализа процесса создания трещин в ходе гидроразрыва пласта.
Несмотря на страшное название, задача сводится к анализу изображений методом машинного обучения. Но, как водится, есть множество нюансов.
Сейсморазведка является основным методом обнаружения нефти и газа. Метод основан на возбуждении упругих колебаний и последующей регистрации отклика от горных пород. Эти колебания распространяются через толщу земли преломляясь и отражаясь на границах геологических слоёв с разными свойствами. Отраженные волны возвращаются на поверхность и регистрируются. На выходе получается так называемый сейсмический куб, который режется на слои по вертикали и по горизонтали. Получаем этакие срезы (кросслайны и интерлайны), на которых видны породы с разными свойствами.
Задача участников — достаточно точно определять и маркировать эти слои-горизонты на всем сейсмическом кубе на основании предварительного обучения на 10% от куба. Пока несложно, так?
“Под корреляцией в сейсморазведке понимается процесс выделения и прослеживания отражающих горизонтов, различных сейсмофациальных комплексов (рифы и др.) во времени, глубине и в пространстве, на сейсмограммах и суммарных временных и глубинных сейсмических данных.
В процессе прослеживания отражающих горизонтов используют совокупность кинематических и динамических сейсмических атрибутов. При их комплексном анализе осуществляется корреляция отражающих границ волнового поля в пространстве путем прослеживания наиболее ярко выраженных экстремумов (или перехода через 0) волнового поля, при этом главным образом учитывают признак подобия соседних сейсмических трасс.
Одновременно принимают во внимание свойство плавности изменения времени регистрации прихода волны. Линию, соединяющую характерные особенности (экстремумы) одной и той же волны на разных трассах, принято называть осью синфазности. Отражённые волны обычно коррелируются по наиболее четким экстремумам (фазам). При этом интерпретаторы обычно придерживаются принципа — от более надежного к менее надежному.
Вначале проследим горизонты, которые в изучаемом районе работ уверенно прослеживаются на значительной площади и имеют на должную геологическую привязку. Такие отражающие горизонты принято называть опорными или репорными. Они являются региональными маркерами. Их прослеживание и интерпретация позволяют существенно повысить понимание всего сейсмического материала, тектонической истории, условий осадконакопления”.
Кирилов А.С., Закревский К.Е., Практикум по сейсмической интерпретации в PETREL. М.: ИЗДАТЕЛЬСТВО МАИ-ПРИНТ, 2014. — 288 с.
По данному вопросу существует большой объем справочной информации на русском языке практически в любом из форматов. В том числе и на Youtube. К примеру, можно привести отличный наглядный ролик об автоматическом распознавании сейсмических горизонтов, выложенных в свободный доступ Казанским Центром Дополнительного Образования ИГиНГТ КФУ.
Мне кажется после него задача, заложенная в челендж, должна стать более понятной.
На основании первых 10% сейсмического куба, уже размеченных профессиональным интерпретатором, нужно разметить оставшиеся срезы в тестовом датасете по границам заданных классов с максимальным значением метрики.
Исходный датасет представляет собой трехмерный массив сейсмических данных (суммарный временной куб сейсмического атрибута). Как уже говорилось выше, куб можно представить в виде 2D-вертикальных срезов: кросслайнов и инлайнов.
Каждый срез состоит из одномерных векторов – трасс (trace) длиной 2562 миллисекунд с шагом 2 мс. Количество кросслайнов: 1896. Количество инлайнов: 2812.
Общее количество трасс > 5 млн.
Количество классов сегментации (т.е. разделений пород): 8.
Организаторы ждут к участию специалистов из области анализа данных. Сроки ограниченные и подойдет челендж для тек, кто «уже умеет». В конкурсном отборе могут участвовать как отдельные лица, так и команды до пяти человек.
Участники самостоятельно регистрируются через сайт RN.DIGITAL. на площадке Boosters.pro. По статистике на 4 ноября для участия в соревновании зарегистрировалось 402 команды.
Сроки проведения:
15.10.19 — 15.12.19 — проведение контеста
24.11.19 — окончание возможности объединять команды
15.10.19 — 01.12.19 — первый тур контеста
02.12.19 — 15.12.19 — второй тур контеста для лучших 30 команд из первого тура
21.12.19 — очное подведение итогов и награждение 10 команд из второго тура в городе Москва.
Интересна организация финала: экспертный совет оценивает итоговые работы, но при этом не влияет на выбор победителей. Распределение финалистов определяется по результатам заочной части соревнования на основе лучшей метрике качества сегментации (Dice Metrics). При этом участники могут получить дополнительную «плюшку» за лучшую презентацию своего решения в размере 50 000 рублей.
Я не являюсь организатором данного челенджа, поэтому вряд ли смогу детально ответить на вопросы в комментариях. Если у хабражителей есть вопросы/интерес, то я могу пригласить в комментарии представителя организаторов и ребят из boosters.
Считается, что попасть в нефтяную отрасль, где зарплаты не уступают IT-индустрии, со стороны довольно сложно. В этом есть доля правды, потому как сфера довольно специфичная и не жалует людей “не в теме”. Данное мероприятие направлено на то, чтобы упростить вхождение в этот подземный мир для молодых и талантливых команд, работающих с распознаванием изображений и машинным обучением.
Я размещаю данный топик в разделе “Я пиарюсь”, потому что: а) хочу помочь землякам-уфимцам; б) верю в высокую квалификацию хабражителей. И будет здорово, если одни встретят других. Заодно немного побуду переводчиком с технологического на человеческий.
Итак, в чем вызов?
Задача звучит так: “Выделение сейсмических горизонтов в кубе амплитуд – сегментация данных с помощью распознавания изображений”. Чемпионат размещен на платформе Boosters.pro. Устроителем является корпоративный институт ООО “БашНИПИнефть”, один из лидеров (как это ни странно) в области разработки нефтегазового ПО. Показательным примером их успешной работы можно назвать разработку и внедрение РН-ГРИД – собственного промышленного программного обеспечения для математического моделирования и анализа процесса создания трещин в ходе гидроразрыва пласта.
Перевожу задачу на русский
Несмотря на страшное название, задача сводится к анализу изображений методом машинного обучения. Но, как водится, есть множество нюансов.
Сейсморазведка является основным методом обнаружения нефти и газа. Метод основан на возбуждении упругих колебаний и последующей регистрации отклика от горных пород. Эти колебания распространяются через толщу земли преломляясь и отражаясь на границах геологических слоёв с разными свойствами. Отраженные волны возвращаются на поверхность и регистрируются. На выходе получается так называемый сейсмический куб, который режется на слои по вертикали и по горизонтали. Получаем этакие срезы (кросслайны и интерлайны), на которых видны породы с разными свойствами.
Задача участников — достаточно точно определять и маркировать эти слои-горизонты на всем сейсмическом кубе на основании предварительного обучения на 10% от куба. Пока несложно, так?
А теперь в общепринятых терминах:
“Под корреляцией в сейсморазведке понимается процесс выделения и прослеживания отражающих горизонтов, различных сейсмофациальных комплексов (рифы и др.) во времени, глубине и в пространстве, на сейсмограммах и суммарных временных и глубинных сейсмических данных.
В процессе прослеживания отражающих горизонтов используют совокупность кинематических и динамических сейсмических атрибутов. При их комплексном анализе осуществляется корреляция отражающих границ волнового поля в пространстве путем прослеживания наиболее ярко выраженных экстремумов (или перехода через 0) волнового поля, при этом главным образом учитывают признак подобия соседних сейсмических трасс.
Одновременно принимают во внимание свойство плавности изменения времени регистрации прихода волны. Линию, соединяющую характерные особенности (экстремумы) одной и той же волны на разных трассах, принято называть осью синфазности. Отражённые волны обычно коррелируются по наиболее четким экстремумам (фазам). При этом интерпретаторы обычно придерживаются принципа — от более надежного к менее надежному.
Вначале проследим горизонты, которые в изучаемом районе работ уверенно прослеживаются на значительной площади и имеют на должную геологическую привязку. Такие отражающие горизонты принято называть опорными или репорными. Они являются региональными маркерами. Их прослеживание и интерпретация позволяют существенно повысить понимание всего сейсмического материала, тектонической истории, условий осадконакопления”.
Кирилов А.С., Закревский К.Е., Практикум по сейсмической интерпретации в PETREL. М.: ИЗДАТЕЛЬСТВО МАИ-ПРИНТ, 2014. — 288 с.
Требуется больше информации?
По данному вопросу существует большой объем справочной информации на русском языке практически в любом из форматов. В том числе и на Youtube. К примеру, можно привести отличный наглядный ролик об автоматическом распознавании сейсмических горизонтов, выложенных в свободный доступ Казанским Центром Дополнительного Образования ИГиНГТ КФУ.
Мне кажется после него задача, заложенная в челендж, должна стать более понятной.
Ок, что нужно сделать?
На основании первых 10% сейсмического куба, уже размеченных профессиональным интерпретатором, нужно разметить оставшиеся срезы в тестовом датасете по границам заданных классов с максимальным значением метрики.
С чем работать?
Исходный датасет представляет собой трехмерный массив сейсмических данных (суммарный временной куб сейсмического атрибута). Как уже говорилось выше, куб можно представить в виде 2D-вертикальных срезов: кросслайнов и инлайнов.
Каждый срез состоит из одномерных векторов – трасс (trace) длиной 2562 миллисекунд с шагом 2 мс. Количество кросслайнов: 1896. Количество инлайнов: 2812.
Общее количество трасс > 5 млн.
Количество классов сегментации (т.е. разделений пород): 8.
Кого ждут на Seismic Challenge?
Организаторы ждут к участию специалистов из области анализа данных. Сроки ограниченные и подойдет челендж для тек, кто «уже умеет». В конкурсном отборе могут участвовать как отдельные лица, так и команды до пяти человек.
Как принять участие?
Участники самостоятельно регистрируются через сайт RN.DIGITAL. на площадке Boosters.pro. По статистике на 4 ноября для участия в соревновании зарегистрировалось 402 команды.
Сроки проведения:
15.10.19 — 15.12.19 — проведение контеста
24.11.19 — окончание возможности объединять команды
15.10.19 — 01.12.19 — первый тур контеста
02.12.19 — 15.12.19 — второй тур контеста для лучших 30 команд из первого тура
21.12.19 — очное подведение итогов и награждение 10 команд из второго тура в городе Москва.
Интересна организация финала: экспертный совет оценивает итоговые работы, но при этом не влияет на выбор победителей. Распределение финалистов определяется по результатам заочной части соревнования на основе лучшей метрике качества сегментации (Dice Metrics). При этом участники могут получить дополнительную «плюшку» за лучшую презентацию своего решения в размере 50 000 рублей.
P.S.
Я не являюсь организатором данного челенджа, поэтому вряд ли смогу детально ответить на вопросы в комментариях. Если у хабражителей есть вопросы/интерес, то я могу пригласить в комментарии представителя организаторов и ребят из boosters.