Статьи / Закладки / Профиль Significantly / Хабр

@Significantly^{read⁠-⁠only}

Пользователь

ПрофильЗакладки24

badcasedaily1 4 мар 2024 в 07:15

Методы очистки данных в Pandas

Простой

6 мин

62K

Блог компании OTUSPython * Визуализация данных *

Обзор

Привет, Хабр!

Аналитики данных часто сталкиваются с грязными данными, которые могут существенно замедлить процесс анализа. Грязны данные – это пропущенные значения, дубликаты, неконсистентные данные. Пропущенные значения заставляют нас гадать, что же было замыслено нашим коллегой; дубликаты вводят в заблуждение, умножая одно и то же на количество их копий, а неконсистентные данные заставляют нас сомневаться в каждой цифре.

Очищать грязные данные можно c Pandas. Рассмотрим основные методы.

ru_vds 12 янв 2022 в 13:00

30 команд Git, необходимых для освоения интерфейса командной строки Git

9 мин

674K

Блог компании RUVDS.comGit * GitHub * Системное администрирование *

Перевод

Git — самая популярная в мире распределённая система контроля версий. Линус Торвальдс, разработчик ядра ОС Linux, создал этот инструмент ещё в 2005 году, а сегодня Git активно поддерживается как проект с открытым исходным кодом. Огромное количество открытых и коммерческих проектов используют Git для контроля версий.

В данной статье перечисляются самые основные команды, которые следует знать разработчику, чтобы освоить управление репозиториями GitHub на высоком уровне. Ознакомиться с ними будет полезно как новичкам, так и опытным разработчикам.

Читать дальше →

+50

darsus 8 окт 2019 в 15:02

Подготовка данных в Data Science-проекте: рецепты для молодых хозяек

10 мин

25K

Data Mining * Big Data *

В предыдущей статье я рассказывала про структуру Data Science-проекта по материалам методологии IBM: как он устроен, из каких этапов состоит, какие задачи решаются на каждой стадии. Теперь я бы хотела сделать обзор самой трудоемкой стадии, которая может занимать до 90% общего времени проекта: это этапы, связанные с подготовкой данных －сбор, анализ и очистка.

В оригинальном описании методологии Data Science-проект сравнивается с приготовлением блюда, а аналитик － с шеф поваром. Соответственно, этап подготовки данных сравнивается с подготовкой продуктов: после того, как на этапе анализа бизнес-задачи мы определились с рецептом блюда, которое будем готовить, необходимо найти, собрать в одном месте, очистить и нарезать ингредиенты. Соответственно, от того, насколько качественно был выполнен этот этап, будет зависеть вкус блюда (предположим, что с рецептом мы угадали, тем более рецептов в открытом доступе полно). Работа с ингредиентами, то есть подготовка данных － это всегда ювелирное, трудоемкое и ответственное дело: один испорченный или недомытый продукт － и весь труд впустую.

Читать дальше →

FiL_SEO 4 июл 2024 в 09:04

Как настроить SEO при создании сайтов самостоятельно?

8 мин

26K

Блог компании SelectelHTML * Веб-разработка * Интернет-маркетинг * Поисковая оптимизация *

✏️ Технотекст 7

Привет, Хабр! Я — Марина, специалист по продвижению сайтов в Selectel. В тексте расскажу, как правильно настроить SEO-параметры для разных типов веб-ресурсов на этапе их создания. Пригодится вебмастерам, маркетологам и всем, кто работает с сайтами.

Ранее мы выпустили текст о том, как разработать HTML-шаблон страницы с учетом SEO. Моя статья ориентирована больше на оптимизацию разных типов сайтов, а не код.

Читать дальше →

+34

Методы очистки данных в Pandas

30 команд Git, необходимых для освоения интерфейса командной строки Git

Подготовка данных в Data Science-проекте: рецепты для молодых хозяек

Как настроить SEO при создании сайтов самостоятельно?

Информация

Специализация