Комментарии / Профиль golovasteek / Хабр

Евгений Петров @golovasteek

Программист

Профиль Статьи 2Посты Новости Комментарии 11

Асинхронная загрузка больших датасетов в Tensorflow

golovasteek 29 дек 2017 в 03:27

Верное замечаение.
Вообще правильнее решить задачу было бы с помощью tf.metrix.accuarcy, но в версии 1.4 статистику нельзя сбрасывать между эпохами, что не очень удобно.

Посмотреть

Асинхронная загрузка больших датасетов в Tensorflow

golovasteek 27 дек 2017 в 16:20

На вскидку, TextLineDataset должен подойти.
Или сделать датасет из

file.readlines()

Посмотреть

Асинхронная загрузка больших датасетов в Tensorflow

golovasteek 26 дек 2017 в 11:46

Я про такие не слышал. Но и не искал в общем-то.

Посмотреть

Асинхронная загрузка больших датасетов в Tensorflow

golovasteek 26 дек 2017 в 11:45

Все верно. Но нету удобной функции, позволяющей удобно преобразовать именованные категории в one_hot. А значит функция преобразующая считвающая категорию из файла и представляющая ее в виде числа все равно нужна.

Посмотреть

Распределенное выполнение Python-задач с использованием Apache Mesos. Опыт Яндекса

golovasteek 29 июл 2016 в 11:05

Просто передавать задачи в виде сообщений можно.

До перехода на Mesos примерно так и было. Но нужно самим разрабатывать и реализовывать учет свободных ресурсов, отслеживание статусов задач (которые кроме как запуститься и завершиться могут еще упасть и потеряться). Еще сложнее все становится, когда возникает задача честного распеределения ресурсов между разными очередями, или изоляции запускаемых задач. Mesos что-то из этого реализует, для части предоставляет удобный API.

Посмотреть

Распределенное выполнение Python-задач с использованием Apache Mesos. Опыт Яндекса

golovasteek 28 июл 2016 в 20:33

Из изменений которые мы заметили, это введение обязательных параметров при запуске самого Mesos.
В частности это приводит к непонятому сообщению об ошибке при запуске mesos-local https://issues.apache.org/jira/browse/MESOS-5613
Которое чинится путем задания переменной окружения MESOS_WORK_DIR.

Если запустить удалось, то дальше примеры должны работать.

Посмотреть

Распределенное выполнение Python-задач с использованием Apache Mesos. Опыт Яндекса

golovasteek 28 июл 2016 в 19:13

Если вы не используете Docker, значит используются Mesos-контейнеры:

Можно и так сказать.

А по 4-му вопросу — вы рассматривали аналоги? Почему выбрали именно Mesos?

Я в каком-то виде ниже ответил.
Docker Swarm и Cubernetes это скорее аналоги Marathon, а мы опять же решали другую задачу.

Посмотреть

Распределенное выполнение Python-задач с использованием Apache Mesos. Опыт Яндекса

golovasteek 28 июл 2016 в 19:10

Чем лучше Yarn + Airflow?

Я честно говоря не очень понял что надо сравнить с «Yarn + Airflow».
Можно сравнивать Mesos с Yarn, тут выбор сделан в пользу Mesos, потому что у него есть родной Python интерфейс и модель работы очень хорошо «мапится» на наши задачи.
Какую-то часть нашей системы можно сравнить с Airflow, но когда он стал публичным у нас уже был свой :)

Про планировщик ничего интересного рассказать не могу. Там никакого Rocket-Science пока нет.

Посмотреть

Распределенное выполнение Python-задач с использованием Apache Mesos. Опыт Яндекса

golovasteek 28 июл 2016 в 18:43

Судя по всему мы решаем не совсем ту задачу, что у вас. Поэтому контейнеры мы не используем, все задачи работают в одной среде. И Service Discovery нам пока не нужен, вся конфигурация задана статически.

Посмотреть

Распределенное выполнение Python-задач с использованием Apache Mesos. Опыт Яндекса

golovasteek 28 июл 2016 в 18:26

За ссылку спасибо.
Но в Ubuntu-Trusty из коробки не загружаются Python модули (похоже они устанавливаются в неправильное место).
Но это я понял только сейчас, а раньше думал что Python-модули просто не включены.

Посмотреть

Распределенное выполнение Python-задач с использованием Apache Mesos. Опыт Яндекса

golovasteek 28 июл 2016 в 17:13

Да, поддержку ipv6 пришлось реализовать самим.

Посмотреть