Pull to refresh

Comments 7

Крутая штука, для крутых геологов. Но если ты не геолог, а какие-то простые данные привязаны к картам, то лучше plotly.
Как вы с помощью plotly покажете 3D куб, скажем, 1000х1000х1000 ячеек? А если еще и для 1000 временных отсчетов изменение этого куба? Да и с двумерными данными сложно. У меня matlotlib ну очень медленно работает уже на двумерном гриде 15000х15000 ячеек (сцена Landsat 8). И да, во вводной статье я писал, что с данными проблемами 20 лет как сталкиваюсь, безотносительно к геологии.
Оу, я имею в виду именно простые данные, например, 50000 тысяч точек на глобусе нарисовать, или пару тысяч линий или еще что-то попроще. Хотя бывали случаи и посложней, но в этих случаях можно было успеть сходить поить кофе, перекусить, перекурить, позвонить маме, разгрести почту и т.д.

А разве никаких других инструментов для ускорения нет? WebGL например, насколько я помню способен использовать GPU. Да и наверняка, какие-нибудь биндинги на питоне так же есть.

Я не спорю, проблема очень насущная и это хорошо, что вы ее освещаете.
В теории, можно кластеризовать всю эту уйму точек и показать наиболее важные для нас кластеры, выделить поверхности и т.п. На практике же необходимо интерактивно посмотреть-покрутить весь кубик (а также сделать сечения, посчитать градиенты, выделить изоповерхности...), чтобы принять решение, как с ним дальше работать и что важно, а что нет. Вот посмотрите последнюю картинку в посте — там уже выделены геологически интересные структуры как поверхности, но для этого нужно было поработать с полным кубом данных. И возможность быстро и просто покрутить такой куб данных чрезвычайно ускоряет и облегчает работу. ParaView позволяет и анализ многомерных данных делать — выделить поверхности и много всего еще, возможно, и об этом доберусь написать. Плюс к тому, в ParaView можно вставлять код на питон для дополнительной обработки данных, у меня много таких сниппетов кода выложено в гитхаб репозитории: github.com/mobigroup/gis-snippets/tree/master/ParaView
Разумеется, это не отменяет использования matplotlib. Кстати, а вы умеете быстро визуализировать, скажем, 100 ГБ двумерных данных на среднем ноутбуке? И с этим тоже приходится сталкиваться, если будет интерес, могу показать еще много всего.
Да, конечно же есть интерес, потому что визуализация больших данных «как есть» — это суперспособность.
В ParaView можно и так сделать:
Можно намного лучше :) Вот, к примеру, mantaflow симуляция прорыва дамбы с визуализацией в ParaView:


Стоит добавить рельеф и можно моделировать наводнения, цунами и много всего еще:
Only those users with full accounts are able to leave comments. Log in, please.