Комментарии 8
Кто знает, может быть TF приобретет популярность и в этой сфере. Кто же знал, например, что видеокарточки так зарешают в машинном обучении :)
вычислять урматы
Урматы — это вид шкрабов?
Интересная идея!
Несколько вопросов:
1) Если ли репозиторий с материалами статьи? Или лучше всего прямо отсюда примеры кода брать
2) Оценивали ли вы, какая часть вычислений идет на GPU? Я правильно понял, что у вас только 100 точек по х (где можно параллельно считать) и 10000 по t, где вычисления сугубо последовательные? Даже в этом случае 2 раза ускорение — это круто.
3) Пробовали ли вы сравнивать производительность TensorFlow с компилацией в Cython?
Добрый день!
1) Ноутбук Jupyter: http://nbviewer.jupyter.org/github/urtrial/pde/blob/master/partial_differential_equation.ipynb
2) Почти, 101 точек по x и 101 по y, то есть 10 201 точек по координатам и 10 000 по времени (конкретно для того примера). Да, смотрел, примерно половина операций в графе идут на GPU, какие именно не помню, но думаю, что самые основные вроде перемножения или сложения тензоров.
3) C Cython'ом не сравнивал, но время работы сравнимо и даже быстрее моей реализации на С + MPI для курсовой (у меня правда нет уверенности в оптимальности того кода).
1) Ноутбук Jupyter: http://nbviewer.jupyter.org/github/urtrial/pde/blob/master/partial_differential_equation.ipynb
2) Почти, 101 точек по x и 101 по y, то есть 10 201 точек по координатам и 10 000 по времени (конкретно для того примера). Да, смотрел, примерно половина операций в графе идут на GPU, какие именно не помню, но думаю, что самые основные вроде перемножения или сложения тензоров.
3) C Cython'ом не сравнивал, но время работы сравнимо и даже быстрее моей реализации на С + MPI для курсовой (у меня правда нет уверенности в оптимальности того кода).
Сделайте классический тест — 101x101 точку, и потом 201x201 точку.
порядок аппроксимации у вашей схемы — второй, поэтому если будет разбежка раньше, чем в 4 знаке после запятой — решатель можно отправлять на доработку.
порядок аппроксимации у вашей схемы — второй, поэтому если будет разбежка раньше, чем в 4 знаке после запятой — решатель можно отправлять на доработку.
Кстати, если кого заинтересует, аналогичный пример, но уже от авторов TensorFlow: https://www.tensorflow.org/tutorials/pdes/
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
Уравнение теплопроводности в tensorflow