Обновить

Комментарии 17

НЛО прилетело и опубликовало эту надпись здесь
Сбежать? Опять писать мапперы? Да ну. Это шутка, конечно. Нет, совсем не хочется. Хочется разобраться, как правильно работать с данными. И еще хочется, чтобы то, что мы делаем, не было таким таинством для разработчиков. Так что тут большое поле для деятельности и познания.
Какие направления развития? Я думаю, что эта область меня еще займет на долгое время, а там будет видно. Я пока только на спринт планироваться умею. В ближайшие две недели точно останусь в DE :)

НЛО прилетело и опубликовало эту надпись здесь

по идее у DE самые широкие возможности приносить реальную пользу бизнесу (data driven бизнес и так далее), потому что чистые, правильные данные, на которые можно опираться и принимать управленческие решения стоят очень дорого и высоко ценятся.

НЛО прилетело и опубликовало эту надпись здесь
Все так думают, в том числе и ключевые бизнес-заказчики. А потом приходят с тупыми вопросами «а как это правильно интерпретировать?». Не знаю, как у Вас, но компания в которой я работаю (телеком) без красивых самопрезентаций — data driven company, ибо рынок суперконкурентный. И да, у нас DE/ETL-разработчики не на обочине, а в самом центре жизни компании)

UPD: попробуйте сменить работодателя на того у кого данные имеют похожую ценность, думаю только так можно будет понять о чем я и автор говорили.
У вас же .net в профиле, а там автомаппер всё решает, одно удовольствие.

Про мапперы я шутил, конечно. Хотя у нас в монолитном проекте достаточно много мапперов сделано вручную и на то была причина: у автомаппера были проблемы в свое время, он, если я не ошибаюсь, падал в рантайме иногда.

Про цели и заказчика — очень хороший вопрос. Цель: интеграция данных компании в одном месте. Данных, которым можно доверять. В это понятие включается: очистка, полнота, разложение в удобном для последующей аналитики виде.
Заказчиков у нас несколько. С одной стороны у нас есть большая система Dodo IS, в которой большое количество отчетов для наших партнеров. Это один наш заказчик. С другой стороны есть наша Управляющая Компания, есть команда BI, которым тоже нужна аналитика и ad-hoc запросы, это второй заказчик.

Нужно определить понятие Data Engineering и сферу деятельности. Конкретно в нашей компании сейчас это такой зонтичный бренд, включающий в себя проектирование архитектуры хранилища, моделирование данных, пайплайны, совместную работу с командами разработки над сбором состояния их сервиса, а еще просто накопление экспертизы по работе различных (в том числе и OLTP) баз данных в целом.
Конечно, если рассматривать DE как запускаторов ETL/ELT пайплайнов, то это довольно грустно. Но у нас, к счастью, есть много других задач.

А что касается карьеры. Если быть предельно откровенным, то я сейчас в таком ключе про это не думаю, просто занимаюсь тем, что интересно на данный момент и полезно для компании, дальше будет видно :)
Кстати, нельзя сказать, что мы больше не разрабатываем вообще. У нас есть свои внутренние сервисы, которые мы сами написали и поддерживаем.
НЛО прилетело и опубликовало эту надпись здесь
на наш первый митап сообщества
Жаль, что не в Санкт-Петербурге. Было бы интересно.
Мы планируем делать прямую трансляцию. Ссылочку на неё пришлём в день митапа в чат по DE. И потом планируем выложить запись.
Лично мне интереснее вживую задавать вопросы и в кулуарах пообщаться, поэтому редко смотрю трансляции. Но Вам в любом случае спасибо за вариант.
Давай замутим в Питере, какая проблема =)
Эх, жаль не смогу побывать на митапе. Сам недавно сделал такой же переход fullstack -> DE. С автором соглашусь, что действительно начинаешь смотреть на дизайн бекенда с другой стороны, ну и сразу учишься проектировать бд и внутренние структуру микросервисов с оглядкой на то, как это будет использовано в ETL/BI.
Мы планируем сделать прямую трансляцию и выложить потом запись (ссылку на чат выше написала как раз). Ну и надеюсь это будет не последний митап по этой теме. :)
Благодарю, обязательно посмотрю трансляцию.
Книги – это единственное спасение
а можете пожалуйста список порекомендовать?
Скорее могу порекомендовать подписку на O'Reilly :)
Если серьезно, то часто приходится читать что-то под задачу или технологию, с которой работаешь. Например, здесь я открыл для себя Spark, с которым не работал ранее. Сейчас изучаю его в том числе по книге:
  • Spark: The Definitive Guide by Matei Zaharia, Bill Chambers


Из материалов, не привязанных к конкретным технологиям или базам, я бы рекомендовал посмотреть на:
  • Designing Data-Intensive Applications by Martin Kleppmann
  • Building a Scalable Data Warehouse with Data Vault 2.0 by Daniel Linstedt, Michael Olschimke


Вот еще, что успел полистать, мне понравилось и это в шорт-листе на чтение:
  • Database Internals by Alex Petrov
  • Designing Event-Driven Systems by Ben Stopford
  • Event Streams in Action by Alexander Dean, Valentin Crettaz


И пара рекомендаций от коллег:
  • Data Architecture: A Primer for the Data Scientist, 2nd Edition by W.H. Inmon, Daniel Linstedt, Mary Levins
  • DAMA-DMBOK: Data Management Body of Knowledge (2nd Edition) by DAMA International


Еще можно доклады со Strata Data Conference by O'Reilly посмотреть.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Информация

Сайт
dodoengineering.ru
Дата регистрации
Дата основания
Численность
201–500 человек
Местоположение
Россия