Статьи / Закладки / Профиль andmkv / Хабр

Андрей Макеев @andmkv

Пользователь

Профиль Публикации Комментарии 1Закладки 5

i_shutov 3 июл 2018 в 11:15

Насколько open-source экосистема R хороша для решения бизнес-задач?

6 мин

4.8K

Python*Data Mining*R*Визуализация данных*

Поводом для публикации послужила запись в блоге Rstudio: «Shiny 1.1.0: Scaling Shiny with async», которая может очень легко пройти мимо, но которая добавляет очень весомый кирпичик в задаче применения R для задач бизнеса. На самом деле, в dev версии shiny асинхронность появилась примерно год назад, но это было как бы несерьезно и «понарошку» — это же dev версия. Перенос в основную ветку и публикация на CRAN является важным подтверждением, что многие принципиальные вопросы продуманы, решены и протестированы, можно спокойно переносить в продуктив и пользоваться.

А что еще есть в R, кроме «бриллианта», что позволяет превратить его в универсальный аналитический инструмент для практических задач?

Является продолжением предыдущих публикаций.

Читать дальше →

+12

JenoOvchi 4 июн 2018 в 11:26

Распределенное хранилище данных в концепции Data Lake: с чего начать

12 мин

9.1K

Блог компании NeoflexBig Data*Хранилища данных*Hadoop*

В мире энтерпрайза наступило пресыщение фронтовыми системами, шинами данных и прочими классическими системами, которые внедряли все кому не лень последние 10-15 лет. Но есть один сегмент, который до недавнего времени был в статусе «все хотят, но никто не знает, что это». И это Big Data. Красиво звучит, продвигается топовыми западными компаниями – как не стать лакомым кусочком?

Но пока большинство только смотрит и приценивается, некоторые компании начали активно внедрять решения на базе этого технологического стека в свой IT ландшафт. Важную роль в этом сыграло появление коммерческих дистрибутивов Apache Hadoop, разработчики которых обеспечивают своим клиентам техническую поддержку. Ощутив необходимость в подобном решении, один из наших клиентов принял решение об организации распределенного хранилища данных в концепции Data Lake на базе Apache Hadoop.

Читать дальше →

lonely_luckily 24 июн 2018 в 18:40

Допинг для аналитики: почему стоит обратить внимание на Apache Zeppelin

6 мин

37K

Блог компании PixonicPython*Разработка игр*Аналитика мобильных приложений*Управление продуктом*

Все рано или поздно приходят к аналитике за данными. В больших многопользовательских играх (да и синглплеере) без этого уже вообще никуда. Сколько пользователей предпочитают новый режим; где слабые места монетизации; куда смотреть геймдизайнерам, чтобы повысить вовлеченность игроков; и еще миллион вещей — подсчитывается вообще всё. И всё это влияет на решения, которые потом принимают разработчики.

А вот внедряют аналитику все по-разному: кто-то покупает сторонние решения (просто, но негибко), кто-то пишет под себя (долго и дорого), а кто-то пока просто считает несколько базовых метрик силами программистов и не заморачивается.

Поэтому я расскажу об инструменте, который будет полезен для всех. Кто только начинает выстраивать аналитику — сможет «на коленке» создать систему с нуля, а компании с уже готовыми решениями — «бустануть» свой подход.

Читать дальше →

+42

KonstantinKG 19 июн 2018 в 23:12

Соревнование Kaggle Home Credit Default Risk — анализ данных и простые предсказательные модели

33 мин

20K

Python*Data Mining*Big Data*Машинное обучение*

Из песочницы

На датафесте 2 в Минске Владимир Игловиков, инженер по машинному зрению в Lyft, совершенно замечательно объяснил, что лучший способ научиться Data Science — это участвовать в соревнованиях, запускать чужие решения, комбинировать их, добиваться результата и показывать свою работу. Собственно в рамках этой парадигмы я и решил посмотреть внимательнее на соревнование по оценке кредитного риска от Home Credit и объяснить (начинающим дата саентистам и прежде всего самому себе), как правильно анализировать подобные датасеты и строить под них модели.

Читать дальше →

+17

Pavel_Ku 5 июн 2018 в 09:47

10 must-have качеств на заметку начинающему менеджеру продукта

5 мин

31K

Блог компании HyggerУправление разработкой*Управление проектами*Управление продуктом*

В некоторых компаниях количество менеджеров и тим лидов кажется неоправданно большим. Почему роль эффективного менеджера сегодня становится все популярнее, и какие качества помогут рядовому сотруднику быстро превратиться в грамотного управленца? Это зависит от сферы деятельности компании, ее роста и специфики рынка, но, в целом, хорошего менеджера можно “распознать” по его личностным и профессиональным характеристикам еще задолго до необходимости “закрыть” вакансию.

Читать дальше →