Search
Write a publication
Pull to refresh
1
0
Sergey Kaleev @skaleev

Пользователь

Send message

Предварительная обработка данных с помощью библиотеки Pandas (Задача)

Level of difficultyEasy
Reading time5 min
Views17K

В современном мире большинство бизнес-процессов связаны с обработкой больших объемов данных, получаемых от различных источников. Часто эти данные содержат ошибки, дубликаты и пропуски, что может привести к неверным выводам и решениям. Одним из инструментов, которые позволяют очистить и преобразовать данные, является библиотека pandas для языка программирования Python.

Я собираюсь рассмотреть задачу по очистке данных с помощью pandas. Для этого возьмем данные, содержащие дубликаты строк, неправильные типы данных, пропуски и отрицательные значения. Затем я буду использовать функциональные возможности pandas для очистки и преобразования этих данных в форму, пригодную для дальнейшего анализа.

Предположим, у вас есть набор данных, содержащий информацию о продажах компании за последние несколько лет. Но данные не очень чистые, и вы заметили, что есть некоторые проблемы с форматированием и некоторые строки содержат ошибки.

Задача: Необходимо очистить данные о продажах компании за последние несколько лет с помощью библиотеки Pandas.

Читать далее

Раз и навсегда про тёмную тему или почему вам «на самом деле» нужна тёмная тема

Level of difficultyEasy
Reading time15 min
Views39K

Привет, Хабр! Про необходимость (или наоборот) тёмной темы для приложения или сайта написан уже не один десяток статей и даже научных работ. По какой‑то необъяснимой причине у дизайнеров интерфейсов и маркетологов по сей день возникает вопрос «так ли нужна тёмная тема», а возможность выбрать тёмную тему оформления до сих пор не является чем‑то самим собой разумеющимся. Настал момент досконально разобраться в вопросе, расставить все точки над Ӹ и отхлестать ленивых дизайнеров селёдкой по лицу.

Я прочёл несколько десятков исследований и сделал выводы, чтобы раз и навсегда развеять сомнения на сей счёт. Если вы из тех кто до сих пор считает, что тёмная тема не нужна — добро пожаловать под кат.

Читать далее

[Личный опыт] Насколько все радужно в стране лепреконов: что на самом деле ждет тех, кто решит переехать в Ирландию

Level of difficultyEasy
Reading time8 min
Views16K

Ирландия — это очень красивая и очень маленькая страна, которая мало у кого ассоциируется с IT. А между прочим, из-за невысоких налогов здесь довольно много компаний, которые связаны с технологиями и охотно нанимают сотрудников из-за рубежа.

Меня зовут Андрей, и с ноября прошлого года я живу в Ирландии. Расскажу, как организовывал переезд, что необычного увидел в этой стране, почему съём квартиры здесь — целое приключение, и какую кипу документов придется оформить для жизни.

Читать далее

Книга «Машинное обучение. Портфолио реальных проектов»

Reading time11 min
Views7.2K
image Привет, Хаброжители!

Изучите ключевые концепции машинного обучения‚ работая над реальными проектами! Машинное обучение — то, что поможет вам в анализе поведения клиентов, прогнозировании тенденций движения цен, оценке рисков и многом другом. Чтобы освоить машинное обучение, вам нужны отличные примеры, четкие объяснения и много практики. В книге все это есть!

Автор описывает реалистичные, практичные сценарии машинного обучения, а также предельно понятно раскрывает ключевые концепции. Вы разберете интересные проекты, такие как сервис прогнозирования цен на автомобили с использованием линейной регрессии и сервис прогнозирования оттока клиентов. Вы выйдете за рамки алгоритмов и изучите важные техники, например развертывание приложений в бессерверных системах и запуск моделей с помощью Kubernetes и Kubeflow. Пришло время закатать рукава и прокачать свои навыки в области машинного обучения!
Читать дальше →

Как в панельном доме заменить старый конвектор на новый радиатор, чтобы не пожалеть о полученном результате?

Reading time28 min
Views73K

Идея этой статьи с сантехническим уклоном у меня возникла после просмотра в Ютубе видеоролика о монтаже нового секционного биметаллического радиатора при замене старого отопительного прибора типа «гармошка» в старой однотрубной системе отопления, которую с советских времён применяют в подавляющем количестве панельных домов.

В этом видосике сошлись в смертельной схватке два «блогера‑сантехника», каждый из которых считал, что только он прав.

По результатом этой баталии у меня возникли альтернативные решения, не совпадающие полностью ни с одним из дуэлянтов.

Своё видение решения я описал в комментариях к видеоролику, но ответа не получил. В итоге решил написать эту статью для прояснения сути проблемы широкой массе жителей панельных домов.

Особый интерес к этой теме у меня возник потому, что я сам лично как‑то собрался поменять такую старую облезлую «гармошку» (см.рис.1) на новый белый и красивы биметаллический радиатор (см.рис.2).

Читать далее

Разворачиваем Apache Kafka

Level of difficultyEasy
Reading time5 min
Views10K

В предыдущей статье мы достаточно подробно рассмотрели архитектуру Apache Kafka, из каких компонентов состоит данное решение, что для чего предназначено. И в этой статье мы рассмотрим процесс развертывания данного решения.

Для запуска Kafka можно использовать решения для управления кластером, такие как ZooKeeper или KRaft. В статье мы рассмотрим работу с ZooKeeper. Zookeper это распределенное приложение для управления кластером, состоящим из большого количества узлов.

Читать далее

Собеседование как экзамен

Level of difficultyEasy
Reading time9 min
Views21K

Вам знакомо чувство, когда пришел на собеседование на людей посмотреть, себя показать, а ушел со вспотевшими ладошками и в смешанных чувствах? С мыслями: «Ребята, ну неужели не понимаете, что так нельзя?». Недоумевая, почему собеседование превратилось в экзамен.

Много лет назад я был уверен, что когда «подрасту», точно не стану повторять ошибок моих нанимателей. Но увы. Как только начал сам проводить собеседования — все повторилось.

Я угодил в ту же ловушку, что и они.

Далее

Обзор доступности сети

Level of difficultyEasy
Reading time13 min
Views5.6K

Доступность сети - это способность сетевой инфраструктуры обеспечивать пользователям доступ к ресурсам и сервисам в течение определенного времени. В настоящее время организации, в особенности те, которые полностью зависят от технологий и интернета, придают большое значение доступности сети, так как ее индикаторы напрямую влияют на качество обслуживания пользователей и производительность бизнеса в целом.

Выход из строя сети может привести к временной недоступности ресурсов, потере данных, прерыванию производственных процессов, сокращению доходов и ухудшению репутации компании. Поэтому жизненно важно, чтобы организация имела надежный механизм контроля доступности сети и быстро реагировала на возникновение проблем с сетью.

Читать далее

«Идите и делайте, успеете оправдаться потом!»: история первой программистки с адмиральскими погонами

Level of difficultyEasy
Reading time13 min
Views14K
Промт: Grace Hopper dressed as a pirate

Почти все, имеющие отношение к IT, слышали историческую байку о первом баге в истории. Баг (английское bug, «жук») был вполне буквальным: в 1947 году в реле гарвардского компьютера Mark II застрял мотылёк. Куда меньшее количество наших современников знают, что процесс его извлечения из недр ЭВМ окрестила «дебаггингом» некая Грейс Хоппер — да так метко, что термин «дебаггинг» жив по сей день.

Ну и тем более немногие в курсе, что Грейс Хоппер отметилась в истории компьютерных технологий далеко не только этим курьёзом, но и куда более весомыми вещами. И вообще была впечатляющей особой, каррамба, сумевшей «войти в айти» на самой его заре — до того, как это стало мейнстримом. В конце концов, в честь абы кого не будут называть разом эсминец, суперкомпьютер, трансатлантический подводный кабель связи и колледж в Йельском университете!
Читать дальше →

Царица наук: математика, беспощадная ты мука

Level of difficultyEasy
Reading time7 min
Views38K

Дайджест про то, как и зачем учить математику, 
если ты взрослый

С самых юных лет было очевидно, что я — естественнонаучник: ребёнок, выросший в семье инженеров и с неподдельным интересом обожающий всё живое, зелёное и биологическое. Дальше началось смешное: во дворе была филологическая гимназия, а чего далеко ходить... В свою очередь, гимназии нужны были олимпиадники и вот она, математика и мама с грозными задачниками, ибо в школе нас просто не учили (была вообще импортная адаптивная программа с усеченной геометрией). Для школы и вуза стараний родителей хватило, для олимпиад нет: физика шла на ура, а математика с приличным скрипом. Как я сейчас говорю, «не щёлкало». Сейчас мне 37 лет и я нет‑нет, да возвращаюсь к математике, хотя она мне точно не нужна ни в работе, ни в увлечении.

Читать далее

Почему решить проблему перегрузки сетей не так просто, как кажется

Reading time3 min
Views3.1K

Практически в любой сети возможен сценарий, когда система распределения трафика оказывается неэффективна. По крайней мере, так утверждают инженеры из MIT. Разбираемся, в чем заключается проблема и насколько она реальна.

Читать далее

Как не впустую потратить ресурсы и не пожалеть о внедрении программного обеспечения

Reading time5 min
Views1.9K

Многолетняя работа в проектных продажах по доработке и внедрению программного обеспечения обогатила возможностью собрать и систематизировать ошибки и проблемные точки проектов.

Так как работа в компании накладывает ряд непреодолимых ограничений, что, зачастую, снижает качество работ, перешел во фриланс. Появилось немного больше свободного времени, как минимум на транспортную составляющую, что и позволило поделиться опытом.

Читать далее

Как узнать дату завершения любого проекта. Метод путешественника

Level of difficultyEasy
Reading time8 min
Views10K

Пустой экран, на котором светится пустая таблица. Миллион идей в голове, но не понятно, как же их изложить. С утра руководитель дал задачу: посчитайте, когда мы закончим проект. Как это считать? Ещё и руководство требует как всегда «Срочно». И с какого потолка достать эту дату? Может, лучше рвануть в путешествие?..

Обычно подобными задачами занимается руководитель проекта. Но в нашей небольшой команде его не было. Придётся обходиться своими силами.

Читать далее

Эргономично, дёшево, сердито

Level of difficultyEasy
Reading time11 min
Views16K

Я давно зачитываюсь статьями про эксперименты авторов со своими рабочими местами: про кастомные кресла, клавиатуры, раскладки. Целый год мне очень хотелось улучшить своё рабочее пространство. Но я боялся даже начать думать об этом по существу, потому что все авторы рассказывали, как поиск удобства отнимал у них 4-5-значные суммы в долларах, долгие месяцы настройки и привыкания к новой реальности.

Главным образом, эта статья ‒ про то, как я уменьшил своё рабочее место с 5 м² до 3 м², избавился от мозоли на запястье, боли в спине и шее, трудностей с набором текстов на русском, английском и немецком; и потратил на это 4 дня и ≈150 €! Но также мне хочется выразить мысль, что эргономика ‒ это не идеальный стол, кресло или клавиатура. Это, скорее, организация пространства так, чтобы в нём было комфортно во всех сценариях его использования.

Что он поменял?

Методика портирования пакетов Python в операционную систему «Нейтрино»

Level of difficultyMedium
Reading time11 min
Views2.2K

Многие расширения (модули) Python поставляются в виде платформонезависимого байт-кода и могут быть использованы в системах с любой архитектурой. Однако, в некоторых случаях расширения поставляются в виде Py-исходников лишь частично. Например, часть внутренних функций может быть реализована на Си и для обеспечения работоспособности всего расширения потребуется их предкомпиляция для каждой требуемой архитектуры. В контексте ОС «Нейтрино» перечень последних достаточно широк.

В статье рассмотрим общий подход к портированию Python-расширений в нашу ОС. Для примера возьмем NumPy, чей жизненный путь проходит следующие стадии: нативный Pyhton код →трансляция в Си (Cython) → компиляция → запаковка результатов с wrapper-ами для Python.

Читать далее

Материалы python-митапа: Go для питонистов, syslog и контейнерные рантаймы

Reading time2 min
Views2.6K

Привет, Хабр! Этот пост — отчёт с митапа Moscow Python x YADRO. Мы обсуждали отличия языков Python и Go, подробно разобрали работу с протоколом syslog и почти написали свой Docker. Если вам интересны эти темы — заходите под кат, там вы найдёте видеозаписи докладов, презентации спикеров и небольшой фотоотчёт. 

Читать далее

Два типа разработчиков ПО

Reading time2 min
Views13K

В моей голове несколько недель вертелась мысль, крошечная теория о том, как люди воспринимают разработку ПО.

Согласно моей теории, есть два типа разработчиков ПО:

Когда тип 1 узнаёт о задаче, он думает: «Это легко, люди просто могут делать X».

Когда о той же задаче узнаёт тип 2, он думает: «Это очень сложно, ведь для этого нужно, чтобы люди делали X».

Тип 1 предполагает, что задача проста, если она не техническая, потому что «можно просто попросить людей делать X». Тип 2 считает, что она сложна, потому что она не техническая.
Читать дальше →

Golang-дайджест № 27 (1 – 31 марта 2023)

Level of difficultyEasy
Reading time5 min
Views4K

Свежая подборка новостей и материалов.

Интересное в этом выпуске

Выпущены Go 1.20.3 и 1.19.8, поиск пути на 2D-полигональных картах, golang предложение log/slog structured, leveled logging принято.

Читать далее

Книга «Apache Kafka. Потоковая обработка и анализ данных, 2-е издание»

Reading time13 min
Views8K
image Привет, Хаброжители!

При работе любого корпоративного приложения образуются данные: файлы журналов, показатели, информация об активности пользователей, исходящие сообщения и другие. Правильное управление этими данными не менее важно, чем сами данные. Если вы архитектор, разработчик или инженер-технолог, но вы пока не знакомы с Apache Kafka, то из этой обновленной книги вы узнаете, как работать с потоковой платформой Kafka, позволяющей обрабатывать потоки данных в реальном времени. Дополнительные главы посвящены API AdminClient от Kafka, транзакциям, новым функциям безопасности и изменениям в инструментарии.

Инженеры из Confluent и LinkedIn, ответственные за разработку Kafka, объясняют, как с помощью этой платформы развертывать производственные кластеры Kafka, писать надежные управляемые событиями микросервисы и создавать масштабируемые приложения для потоковой обработки данных. На подробных примерах вы изучите принципы проектирования Kafka, гарантии надежности, ключевые API и детали архитектуры.
Читать дальше →

Information

Rating
Does not participate
Location
Сургут, Тюменская обл. и Ханты-Мансийский АО, Россия
Date of birth
Registered
Activity