Дайджест статей по анализу данных №4 (23.06.2014 —06.07.2014)
Добрый день, уважаемые читатели.
Пролетели 2 недели и я представляю Вам новую подборку материалов на тему анализа данных. В этот раз материала получилось довольно не много, но от этого статьи и заметки попавшие в дайджест не становятся менее интересными.
Итак, из сегодняшней подборки вы узнаете как классифицировать текст с помощью наивного Байеса, узнаете как увеличить скорость градиентного спуска. Кроме этого будет очередная статья о том, чем должен пользоваться аналитик и какими навыками обладать и еще много чего интересного
Теория
- Кластерный анализ (на примере сегментации потребителей) часть 1 (RU) (спасибо great_boba за перевод)
-
Классификация текста с помощью байсевского классификатора (EN)
Инструкция по применению наивного байсевского классификатора к тексту -
Как банки могут повысить значимость клиентских данных (EN)
Довольно интересная презентация на указанную тему. -
Анализ среды функционирования (EN)
Небольшая инструкция по методологии сравнительного анализа деятельности сложных технических, экономических и социальных систем. -
Выбор коэффициента скорости обучения в градиентном спуске (EN)
-
Современные аспекты представления текстов при анализе естественного языка: классические и альтернативные подходы (RU)
-
Hard and Soft навыки аналитика данных (EN)
Еще одна заметка о том, какими навыками должен обладать аналитик -
7 уроков анализа данных от McGraw-Hill (EN)
Полезные советы от гуру анализа -
Используем методы отбора компонент для классификации текста (EN)
Практика использования различных инструментов
-
Разработка наивного байесовского классификатора на JAVA (EN)
-
Развертывание скорринговой системы для прогнозирования (EN)
Развертывание системы с помощью OpenCPU и R - Анализ данных Google Analytics c помощью Big Query и R (EN)
Обучающие видео
Разные статьи по теме
- Если вы думаете, что большие данные является числовыми, подумайте еще раз (EN)
-
Трансформация анализа данных в науку о данных (EN)
Рассуждения на тему, что включает в себя понятие Data Science -
Визуализация поможет разобраться в «грязных» данных (EN)
О том, как различные инструменты визуализации помогут разобраться в зашумленных данных. -
Большой вызов для больших данных: изменение климата (EN)
Заметка о том как большие данные применяются при прогнозировании погоды -
Что такое машинное обучение? Это зависит от того, кого вы спрашиваете (EN)
Что люди могут понимать под термином «машинное обучение» - Использование больших данных для оптимизации цифрового маркетинга (EN)
-
Как большие данные могут улучшить ваши отношения с клиентами (EN)
В статье на ряд вопрос по обозначенной теме отвечает CEO SugarCRM - Как работать с Big Data. 10 правил (RU)
- Эффективная оценка медианы (RU)