Search
Write a publication
Pull to refresh
6
14

дата-инженер

Send message

Из Excel в SQL. Имеет место быть?

Reading time4 min
Views7.2K

Эта статья, скорее для ознакомления и хотелось бы получить советы по данной работе.

Итак, Excel-файл весит 500+ мегабайт, состоит из сотен тысяч строк, десятков листов и формул, которые «протягиваются» по 30+ столбцам — это не работа, а страдание. Именно с таким «монстром» я столкнулся, когда в компании собрались данные из разных отделов в один файл.

Вкратце структура файла — Лист «Массив» (Data_Lake — в левой части 34 столбца с которым работают специалисты и на котором отрабатывают основные формулы и правая часть с 46 столбцами, куда подтягиваются сырые данные, с которыми будет производиться обработка). И множеством листов со справочниками, правками.

Открытие этого Excel‑файла занимает 10 минут, а если обновить хотя бы часть формул — можно идти пить чай. Работать с такими данным и просто невозможно, особенно если тебе нужно анализировать их, строить отчёты или готовить выгрузки. Поэтому решил попробовать все перевести на PostgreSQL.

Для этого всего лишь требовалось переписать формулы с Excel на SQL. Хорошо, что большинство формул это условия ЕСЛИ, ИЛИ.

Вот самая простая формула:

Читать далее

Дополнение к Litchi

Level of difficultyEasy
Reading time3 min
Views745

Почитав эту статью: https://habr.com/ru/articles/684858 (особенно заинтересовали Waypoints) и обзаведясь коптером DJI, пришел к выводу - да, классно, здорово, но не удобно. Если стоит задача облететь и снять видео поля площадью пару десятков гектаров, то ставить ручками точки маршрута не очень удобно. Занимает много времени.
///

Читать далее

Дата-аналитик в Апх. (Или Yolo на фермах)

Reading time4 min
Views3.1K

Однако здравствуйте. После года самообразования, 6 месяцев курсов по Data-Science - я умудрился устроиться Data-aналитиком в крупную АПХ. Месяц на вкатку в мир данных, пару скучных проектов и тут начальство загорелось внедрить нейронные сети на фермы. Об этом и пойдет повествование. Точнее о первых двух.

Читать далее

Information

Rating
1,093-rd
Location
Калининград (Кенигсберг), Калининградская обл., Россия
Date of birth
Registered
Activity

Specialization

Database Architect, Computer Vision Engineer
SQL
Python
PostgreSQL
Deep Learning
Neural networks
ETL
Apache Airflow
DWH
Spark