Как стать автором
Обновить
17
0
Олег @OlegUV

Аналитик

Отправить сообщение

Сгенерированные картинки похожи на простое объединение двумерных кусков. Не хватает важной вещи - умения работать со светом, но это уже, как я пронимаю, совсем другой уровень, пока ещё прочно занятый человеком.

мне в API отказали.

Вот-вот. Или, как было у меня, работаешь с апи, и вдруг тебе что-то перестают отдавать, потому что __важная_причина_от_владельцев_апи__.
API — это очень специфический путь, который может оборваться в любой момент.
Гораздо интереснее было бы почитать про сбор данных через selenium, благо пакет RSelenium запускается из коробки, без бубна.
Автор статьи, наверно, ответит развёрнуто, я скажу кратко — у меня примерно такая же ситуация и всё без проблем «выгружается» пользователям в табличном виде.
Мог бы — поставил бы 10 плюсов. Задача графиков гораздо масштабнее, и «корректно нарисовать» отходит на -надцатое место по важности, тем более на таком шоу.
Тема интересная, но изложение примерно как «Берём бумагу, берём карандаш, смотрим как рисовал Делакруа и рисуем ещё лучше». Хочется большей конретики.
Сам постоянно занимаюсь проверкой данных и представляю, насколько это актуально. Такая, казалось бы, скучная и рутинная процедура не только помогает строить корректные отчёты, но и обнаруживает недостатки в бизнес-процессах и коммуникациях.

Интересно было бы почитать о том, как вы определяете корректность введённых данных (помимо банального диапазона плюс-минус).

Очень впечатлила визуализация общей оценки качества данных. Тетрис — супер-идея! Подводная лодка тоже хороша, но тетрис, да ещё в динамике буквально завораживает.
я писал и на Python и на R. Пожалуй, самый ощутимый, интегральный, плюс R — скорость получения конечного презентабельного результата, от простенького статичного отчёта до аккуратного интерактивного сайта, с таблицами, графиками и прочим. По такой скорости R превосходит Python, наверно, в разы.
Маленькая идея для визуализации — облако слов может выглядеть нагляднее, если добавить цветовую шкалу. Например, монохром, чем больше вес слова (и размер, соответственно) тем цвет темнее.
PS статья очень интересная, спасибо!
Есть опыт работы и с Python и с R. Главное, что даёт R +shiny etc — скорость получения презентабельного продукта с нуля (конечно, под целевые задачи). Скорость в R больше, чем в Python, пожалуй, на порядок.
Тоже прошёл примерно такой путь, но потом вернулся на «обычной шикарности» формат MD. Всё-таки, MD поддерживается массой тулзов, вплоть до утюгов, а с RST всё время какие-то нюансы возникают, в итоге на MD получается ощутимо и быстрее и удобнее писать.
Картинки аккуратненькие. На чем сделаны, это не plotly?
я переходил с Питона на Р, аналогичное первое впечатление, но через несколько месяцев оказалось, что Р удобнее на порядок минимум. Да, там много заморочек, но у них есть своя внутренняя логика, которую со временем понимаешь, плюс какая-то «теплая ламповость», что вызывает симпатию.
Да, очень интересно про методы прогноза, поскольку по личному опыту в реальности все они дают примерно одинаковую (ретроспективную) точность.
Это вопрос, который портит всю малину.
И второй такой же вопрос, в контексте подобной аналитики — как убедиться, что выборка Б, «такая же», как и выборка А (т.е. обе выборки принадлежат одной и той же генеральной).
Гораздо интереснее было бы почитать о конкретных кейсах.
Что таится за этими эти кнопочками на панели Cortana Analytics?
Какие алгоритмы, ну скажем, у product recomendation, где они хороши и когда проваливаются?

А пока у вас только написано, как космические корабли бороздят просторы большого театра.
Рекомендую немного выйти за рамки богатство-бедность, мужчины-женщины и т.п.
Болезненная фиксация на подобных вещах ни к чему, кроме психических расстройства различной степени тяжести, не приведёт.
Поставил минус.
Хочу объяснить почему.
* Автор строго анонимен, что категорически не способствует доверию ни к личности ни к информации.
* Утверждения в статье приведены абсолютно бездоказательно.
* Автор не приложил ни малейших усилий, чтобы узнать, как другие люди решают вопросы, которыми он задаётся.
* В общем и целом, рассуждения на уровне, цитирую автора статьи:
«Мы ведь хотим понятно чего! Денег, женщин, здоровья и всего такого прочего! Разве это плохие вещи?».
То есть, уровень пубертатного периода.

Подобные статьи в одной из главных лент резко снижают общий уровень Хабра.
Да, пожалуй, сарказм настолько жестокий, что не сразу распознаётся )))

И да, с PHP точно перегнули, нормальный язык, добротная рабочая лошадка.
Забавный феномен — очень часто в сознании людей Perl намертво связан с регулярками и выжигающими глаза специфичными выражениями.

Это примерно так, как если бы люди использовали молоток в основном для того, чтобы бить себе по пальцам. И поэтому считали бы молоток плохим инструментом.

Информация

В рейтинге
5 447-й
Откуда
Москва, Москва и Московская обл., Россия
Зарегистрирован
Активность