Как стать автором
Обновить
1
0

Пользователь

Отправить сообщение

Как получать просмотры, если вы не Илон Макс? Проанализировал новые алгоритмы Хабр, VC и Пикабу

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров3.2K

Я проанализировал по 500 статей ? из топов VC, Пикабу и Хабра за последний год и сделал выводы для своих материалов. Все выводы можно применять сейчас — я уже их применяю и мои статьи попадают в Популярное и Горячее, уходят в рассылку VC, паблики ВК VC, Хабра и Пикабу.

Читать далее
Всего голосов 16: ↑8 и ↓8+7
Комментарии4

Открытой системе — открытый курс: автоматизированный Linux курс для корпоративного обучения

Уровень сложностиСредний
Время на прочтение6 мин
Количество просмотров15K

Возможно, вы ловили себя на мысли, что было бы неплохо провести для коллег-новичков в Linux небольшой курс с практическими задачками. Такой курс, чтобы после его прохождения, они могли использовать ОС на уровне продвинутого пользователя, активно пользоваться терминалом, писать bash-скрипты, шарить за wildcard и SSH-туннели и прочую магию Linux. При этом было бы здорово, чтобы оценка за выполнение практической работы выставлялась в LMS автоматически, а вы бы только отслеживали прогресс коллег в электронном журнале и помогали с затыками. Если вы узнали себя в описании - эта статья для вас. Материалы этого курса также могут быть полезными для преподавателей учебных заведений, желающих добавить практики в свои курсы по Linux.

Читать далее
Всего голосов 27: ↑27 и ↓0+27
Комментарии17

«Инженеров данных заменит автоматика» и другие мифы о DE

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров17K

Инженеры данных (англ. data engineer) готовят данные для анализа, машинного обучения и других целей. В деталях это означает множество операций с данными: сбор, хранение, обработка, интеграция, трансформация и представление в нужной для работы приложений и систем форме.

Из краткого определения сложно понять нюансы профессии и тем более захотеть стать инженером данных. Поэтому мы с коллегами собрали мифы о data engineering и выделили наиболее популярные.

Если вы неплохо знакомы с работой дата-инженера, мифы про бесконечный кодинг или однообразие задач могут показаться глупыми и смешными. Но не делайте поспешных выводов: при подготовке статьи мы тоже узнали что-то новое.

Читать далее
Всего голосов 12: ↑8 и ↓4+10
Комментарии1

Как мы заставляли нейронку пялиться на повреждения стального троса. Часть 1

Уровень сложностиСредний
Время на прочтение5 мин
Количество просмотров13K

Вдохновились мы ребятами из PHYGITALISM и их статьей «Как мы заставляли нейронку пялится на ржавчину», а тему подкинул заказчик. Мы – это компания Alter Еgo и специализируемся на стыке технологий машинного зрения, симуляции и добыче данных для задач неразрушимого контроля. Была поставлена задача – детекция стальных тросов (кстати, чаще применяется термин "канаты") гражданских лифтов на предмет его повреждений. Подводные камни не заставили себя долго ждать – оказывается ни вида повреждений, ни их классификации нет (дык откуда взяться такому богатству – с ними то лифт «не выпустят в рейд»). На наши горестные вздохи, что не на чем нейронки обучать, дали документ РД РОСЭК 012-97 «Канаты стальные, контроль и нормы выбраковки» и, судя по лицу главного технолога, мысленно перекрестились. 

В вышеуказанном документе были перечислены повреждения и дано их детальное описание, черно-белое.

Читать далее
Всего голосов 24: ↑18 и ↓6+21
Комментарии64

Мир математики глазами AI

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров6.4K

Всем привет! В этой статья я хочу посмотреть, как AI видит мир математики, а точнее, какие разделы знает, насколько понимает, про что они и какие основные результаты может выделить.

Для этого я буду использовать популярный сейчас ChatGPT, который как-то так предложил мне начать эту статью.

Читать далее
Всего голосов 9: ↑5 и ↓4+5
Комментарии14

Апрельские одноплатники: 5 новых моделей для разработки корпоративных и DIY-проектов

Время на прочтение4 мин
Количество просмотров23K


Как и в случае мини-ПК, производители одноплатных компьютеров постоянно выпускают новые модели, среди которых встречаются весьма любопытные. В этом посте поговорим о пяти системах, которые можно использовать в самых разных целях, от крупных корпоративных проектов, до DIY- систем, создаваемых с мотивом «потому, что могу». Кстати, среди девайсов, попавших в подборку, есть и платы с RISC-V чипами. В общем, много всего интересного. Подробнее, как всегда — под катом.
Читать дальше →
Всего голосов 61: ↑57 и ↓4+72
Комментарии8

Путь от студента до senior-аналитика за 3 года

Время на прочтение12 мин
Количество просмотров5K

Лонгриды и рефлексия людей из твоей сферы — один из способов понять, что ты делаешь правильно и каких ошибок стоит избегать. Если кто-то испытывает те же переживания, то обычно становится легче — ты не одинок со своими мыслями и проблемами. 

Я хочу поговорить о том, в чем отличия между разными ступенями развития аналитиков и что может помочь перейти с одного из них на другой. Мне повезло — путь от джуна до сеньора я прошла в прекрасном Wrike, и я уверена, что среда внутри компании в том числе позволила мне вырасти за такое короткое время.

Читать далее
Всего голосов 12: ↑9 и ↓3+8
Комментарии4

Управление личными делами на базовом уровне

Уровень сложностиСложный
Время на прочтение35 мин
Количество просмотров36K

Эта статья пригодится тем, кто не имеет хоть какой‑то системы по управлению делами, но которому она нужна, так как, например, стало тяжело справляться лишь только за счёт своей памяти или каких‑то мелких чек‑листов на обрывках салфеток. Статья предполагает, что вы будете читать и делать всё в ней написанное. Иначе говоря, статья является практически пошаговой инструкцией, т. е. в ней не будет каких‑то уж совсем незаурядных методов или взглядов.

В статье будет показана базовая реализация системы по управлению делами. В ней будет также кратко объяснено, что делать с привычками, рассказано про планирование работы с источниками. Статья пройдётся по проблеме делегирования дел. Также будет показана важность комментариев к задачам. В конце будет предложен наиболее общий алгоритм работы с системой.

Будет нелишним, если вы прочитаете мою прошлую статью про основные принципы систем, которые помогают достигать поставленных целей.

Мне нужна система по управлению делами
Всего голосов 10: ↑9 и ↓1+10
Комментарии7

Как Data-Engineer за данными следил

Время на прочтение5 мин
Количество просмотров3.9K
Привет, Хабр! Хочу рассказать вам, как мы писали и внедряли сервис для мониторинга качества данных. У нас есть множество источников данных: данные с финансовых рынков, торговая активность наших клиентов, котировки и многое другое. Все это генерирует миллиарды записей в день в наших процессах. Полнота и консистентность торговых данных — критический компонент бизнеса Exness.

Если вам близки проблемы обеспечения качества данных и вам интересно, как мы решили эту задачу у себя, то добро пожаловать под кат.


Читать дальше →
Всего голосов 6: ↑6 и ↓0+6
Комментарии3

Что такое Windows PowerShell и с чем его едят? Часть 4: Работа с объектами, собственные классы

Время на прочтение9 мин
Количество просмотров33K


Текстовый вывод команд в окне интерпретатора PowerShell — всего лишь способ отображения информации в пригодном для человеческого восприятия виде. На самом деле среда ориентирована на работу с объектами: командлеты и функции получают их на входе и возвращают на выходе, а доступные в интерактивном режиме и в сценариях типы переменных базируются на классах .NET. В четвертой статье цикла мы изучим работу с объектами более детально.
Читать дальше →
Всего голосов 22: ↑21 и ↓1+38
Комментарии0

Что такое Windows PowerShell и с чем его едят? Часть 3: передача параметров в скрипты и функции, создание командлетов

Время на прочтение9 мин
Количество просмотров39K


Во второй части цикла рассматривались основы языка программирования PowerShell, а сейчас стоит разобраться с использованием написанного на нем кода для задач администрирования. Самый очевидный способ это сделать — запустить сценарий. Кроме него существует возможность создания собственных командлетов.
Читать дальше →
Всего голосов 25: ↑24 и ↓1+39
Комментарии6

Что такое Windows PowerShell и с чем его едят? Часть 2: введение в язык программирования

Время на прочтение11 мин
Количество просмотров74K
Исторически утилиты командной строки в Unix-системах развиты лучше чем в Windows, однако с появлением нового решения ситуация изменилась.

Читать дальше →
Всего голосов 31: ↑30 и ↓1+46
Комментарии21

Что такое Windows PowerShell и с чем его едят? Часть 1: основные возможности

Время на прочтение8 мин
Количество просмотров379K
Исторически утилиты командной строки в Unix-системах развиты лучше чем в Windows, однако с появлением нового решения ситуация изменилась.

Windows PowerShell позволяет системным администраторам автоматизировать большинство рутинных задач. С ее помощью можно менять настройки, останавливать и запускать сервисы, а также производить обслуживание большинства установленных приложений. Воспринимать синее окошко как еще один интерпретатор команд было бы неправильно. Такой подход не отражает сути предложенных корпорацией Microsoft инноваций. На самом деле возможности Windows PowerShell гораздо шире: в небольшом цикле статей мы попробуем разобраться, чем решение Microsoft отличается от более привычных нам средств.


Читать дальше →
Всего голосов 38: ↑33 и ↓5+44
Комментарии28

Big Data головного мозга

Время на прочтение14 мин
Количество просмотров94K

Наверно, в мире данных нет подобного феномена настолько неоднозначного понимания того, что же такое Hadoop. Ни один подобный продукт не окутан таким большим количеством мифов, легенд, а главное непонимания со стороны пользователей. Не менее загадочным и противоречивым является термин "Big Data", который иногда хочется писать желтым шрифтом(спасибо маркетологам), а произносить с особым пафосом. Об этих двух понятиях — Hadoop и Big Data я бы хотел поделиться с сообществом, а возможно и развести небольшой холивар.
Возможно статья кого-то обидит, кого-то улыбнет, но я надеюсь, что не оставит никого равнодушным.


image
Демонстрация Hadoop пользователям

Читать дальше →
Всего голосов 41: ↑38 и ↓3+35
Комментарии75

В поисках идеального мониторинга

Время на прочтение12 мин
Количество просмотров77K
В этой небольшой статье я хотел бы рассказать о средствах мониторинга, использующихся для анализа работы DWH нашего банка. Статья будет интересна всем, кого не устраивают существующие готовые системы мониторинга и кого посещали мысли собрать таковую «под себя» из отдельных кусочков. Большое внимание в статье уделяется дашборду Grafana, который, по моему мнению, незаслуженно обделён вниманием на Хабре. По большинству компонентов системы мониторинга будет вкратце рассмотрен процесс инсталяции (под RedHat).


Тёплый ламповый дашборд
Читать дальше →
Всего голосов 28: ↑27 и ↓1+26
Комментарии22

Сравнение аналитических in-memory баз данных

Время на прочтение19 мин
Количество просмотров41K
В последние два месяца лета в управлении хранилищ данных (Data Warehouse, DWH) Тинькофф Банка появилась новая тема для кухонных споров.

Всё это время мы проводили масштабное тестирование нескольких in-memory СУБД. Любой разговор с администраторами DWH в это время можно было начать с фразы «Ну как, кто лидирует?», и не прогадать. В ответ люди получали длинную и очень эмоциональную тираду о сложностях тестирования, премудростях общения с доселе неизвестными вендорами и недостатках отдельных испытуемых.

Подробности, результаты и некое подобие выводов из тестирования — под катом.
Читать дальше →
Всего голосов 47: ↑44 и ↓3+41
Комментарии56

Greenplum 5: первые шаги в Open Source

Время на прочтение7 мин
Количество просмотров17K
Вот уже два года как одна из лучших распределённых аналитических СУБД enterprise-уровня вышла в open source. Что изменилось за это время? Что дало открытие исходников проекту? Как дальше будет развиваться Greenplum?

Под катом я расскажу о том, что нового появилось в первом мажорном open source релизе СУБД, как развивается проект в текущих минорных версиях и каких нововведений стоит ждать в будущем.
Читать дальше →
Всего голосов 8: ↑7 и ↓1+6
Комментарии5

Greenplum DB

Время на прочтение17 мин
Количество просмотров182K
Продолжаем цикл статей о технологиях, использующихся в работе хранилища данных (Data Warehouse, DWH) нашего банка. В этой статье я постараюсь кратко и немного поверхностно рассказать о Greenplum — СУБД, основанной на postgreSQL, и являющейся ядром нашего DWH. В статье не будут приводиться логи установки, конфиги и прочее — и без этого заметка получилась достаточно объёмной. Вместо этого я расскажу про общую архитектуру СУБД, способы хранения и заливки данных, бекапы, а также перечислю несколько проблем, с которыми мы столкнулись в ходе эксплуатации.



Немного о наших инсталляциях:

  • проект живёт у нас чуть больше двух лет;
  • 4 контура от 10 до 26 машин;
  • размер БД около 30 Тб;
  • в БД около 10000 таблиц;
  • до 700 queries per second.

За тем, как оно работает, прошу под кат!
Читать дальше →
Всего голосов 15: ↑15 и ↓0+15
Комментарии32

Apache Airflow: делаем ETL проще

Время на прочтение25 мин
Количество просмотров168K

Привет, я Дмитрий Логвиненко — Data Engineer отдела аналитики группы компаний «Везёт».


Я расскажу вам о замечательном инструменте для разработки ETL-процессов — Apache Airflow. Но Airflow настолько универсален и многогранен, что вам стоит присмотреться к нему даже если вы не занимаетесь потоками данных, а имеете потребность периодически запускать какие-либо процессы и следить за их выполнением.


И да, я буду не только рассказывать, но и показывать: в программе много кода, скриншотов и рекомендаций.



Что обычно видишь, когда гуглишь слово Airflow / Wikimedia Commons

Читать дальше →
Всего голосов 11: ↑10 и ↓1+11
Комментарии28

Как настроить мультинодовый кластер Airflow с помощью Celery и RabbitMQ

Время на прочтение4 мин
Количество просмотров13K

Что такое Airflow?


Apache Airflow — это продвинутый workflow менеджер и незаменимый инструмент в арсенале современного дата инженера.


Airflow позволяет создавать рабочие процессы в виде направленных ациклических графов (DAG) задач. Разнообразные служебные программы командной строки выполняют сложные операции на DAG. Пользовательский интерфейс легко визуализирует конвейеры, работающие в производственной среде, отслеживает ход выполнения и при необходимости устраняет неполадки.

Читать дальше →
Всего голосов 8: ↑7 и ↓1+7
Комментарии5

Информация

В рейтинге
Не участвует
Зарегистрирован
Активность