Pull to refresh
1
0
jEN_c @tekub

Веб-аналитик

Send message

How to receive data from Google Analytics using R in Microsoft SQL Server

Reading time9 min
Views3.2K

In this article I want to show in detail how you can use R in Microsoft SQL Server to get data from Google Analytics (and generally from any API).


The task — we have MS SQL server and we want to receive data in DWH by API


We will use googleAnalyticsR package to connect to Google Analytics (GA).


This package is chosen as an example due to its popularity. You can use another package, for example: RGoogleAnalytic.
Approaches to problem solving will be the same.

Read more →
Total votes 9: ↑8 and ↓1+7
Comments1

Big Data resistance 1 или неуловимый Джо. Интернет анонимность, антидетект, антитрекинг для анти-вас и анти-нас

Reading time28 min
Views20K
Доброго времени прочтения, уважаемые читатели Хабра.

Прочитал за последнее время ряд статей, в том числе на Хабре, по цифровым отпечаткам браузеров и слежке за пользователями в Интернете. Например, статья Анонимная идентификация браузеров и Ловушка в интернете журнал Forbes, раздел «технологии» — «Big Data».

А может я не хочу, чтоб меня учитывали! Только, боюсь, ирония в том, что это тоже отпечаток, да, к тому же, видимо, и основная причина появления отпечатков. ИМХО, способ только один. Применительно к FireFox — если все лисицы хором и каждая в отдельности начнут тявкать, что они обыкновенные стандартные лисицы, а не тор, не хром и не макось.

Но, из академического интереса, для сохранения индивидуальности лисиц и в ответ на очередные происки дикого капитализма, хочу предложить на суд уважаемого Хабрасообщества, следующий хитрый план.
Читать дальше →
Total votes 32: ↑28 and ↓4+24
Comments16

Разгоняем обработку событий до 1,6 миллионов в секунду

Reading time17 min
Views27K
Когда участники HighLoad++ пришли на доклад Александра Крашенинникова, они надеялись услышать про обработку 1 600 000 событий в секунду. Ожидания не оправдались… Потому что во время подготовки к выступлению эта цифра улетела до 1 800 000 — так, на HighLoad++ реальность превосходит ожидания.

3 года назад Александр рассказывал, как в Badoo построили масштабируемую систему near-realtime обработки событий. С тех пор она эволюционировала, в процессе росли объёмы, приходилось решать задачи масштабирования и отказоустойчивости, а в определённый момент потребовались радикальные меры — смена технологического стека.



Из расшифровки вы узнаете, как в Badoo заменили связку Spark + Hadoop на ClickHouse, в 3 раза сэкономили железо и увеличили нагрузку в 6 раз, зачем и какими средствами собирать статистику в проекте, и что с этими данными потом делать.



О спикере: Александр Крашенинников (alexkrash) — Head of Data Engineering в Badoo. Занимается BI-инфраструктурой, масштабированием под нагрузки, руководит командами, которые строят инфраструктуру обработки данных. Обожает всё распределённое: Hadoop, Spark, ClickHouse. Уверен, что классные распределенные системы можно готовить из OpenSource.
Total votes 63: ↑60 and ↓3+57
Comments14

Telegram-bot + Google Analytics

Reading time3 min
Views18K
Приветствую хабравчане. Хочу рассказать о том, как мы прикручивали Google Analytics к телеграмм-боту, с какими столкнулись проблемами, и что в итоге пока не получилось настроить.

По старинке Google Analytics устанавливается на сайт с доменом или в приложение с SDK. Погуглив тему, стало понятно, что примеров нет, поэтому решили сделать сами. В нашем случае не было сайта или мобильного приложения, но было желание отслеживать события в Телеграм боте. И частично это получилось сделать.

Проблема №1


Боты физически находятся по адресу t.me/benice_tools_bot. Это похоже на обычный сайт, но без прямого доступа к корневым файлам, для установки кода счетчика, и настройки событий.
Фронтенд в этом случает является сам Телеграм, к которому у нас нет доступа.

Наш бот работает с API Binance и API Телеграма, и соответственно есть бекэнд, через который стало возможно маневрировать c настройками аналитики.
Читать дальше →
Total votes 12: ↑10 and ↓2+8
Comments3

«Чёрные дыры» веб-аналитики: сколько данных теряется в GA и почему

Reading time6 min
Views5.6K
image

Если вы когда-нибудь сравнивали данные двух аналитических инструментов на одном и том же сайте или сравнивали аналитику с отчётами и продажах, то, вероятно, замечали, что они не всегда совпадают. В этой статье я объясню, почему в статистике платформ веб-аналитики отсутствуют данные, и насколько крупными эти потери могут быть.

В рамках статьи мы сосредоточимся на Google Analytics, как самом популярном аналитическом сервисе, хотя большинство аналитических платформ, внедряемых on-page, имеют те же проблемы. Сервисы, которые полагаются на журналы сервера, избегают некоторых из этих проблем, но они настолько редко используются, что мы не будем касаться их в этой статье.
Читать дальше →
Total votes 13: ↑11 and ↓2+9
Comments0

Тестирование настройки sendBeacon для отправки данных

Reading time2 min
Views2K

При использовании стандартных методов отправки данных в Google Analytics есть вероятность, что система не успеет отправить все события, если процесс был прерван перезагрузкой страницы. В начале этого года вышло несколько публикаций о том, как улучшить целостность собираемых данных в GA.

Читать дальше →
Total votes 14: ↑14 and ↓0+14
Comments0

Технические отличия BI систем (Power BI, Qlik Sense, Tableau)

Reading time13 min
Views86K
Время необходимое на прочтение 11 минут

Мы и Квадрат Гартнера 2019 BI :-)


Целью данной статьи является сравнение трёх ведущих BI платформ, которые находятся в лидерах квадранта Gartner:
— Power BI (Microsoft)
— Tableau
— Qlik

image
Рисунок 1. Gartner BI Magic Quadrant 2019

Меня зовут Андрей, я руководитель отдела аналитики компании Аналитикс Групп. Мы строим наглядные отчёты по маркетингу, продажам, финансам, логистике, другими словами занимаемся бизнес аналитикой и визуализацией данных.

Я со своими коллегами уже несколько лет работаем с различными BI платформами. Имеем весьма неплохой опыт проектов, что позволяет нам сравнивать платформы с точки зрения разработчиков, аналитиков, бизнес-пользователей и внедренцев BI систем.

У нас будет отдельная статья по сравнению цен и визуальному оформлению этих BI систем, поэтому тут постараемся оценить эти системы именно с точки зрения аналитика и разработчика.

Выделим несколько направлений для анализа и оценим по 3 бальной системе:
— Порог вхождения и требования к аналитику;
— Источники данных;
— Очистка данных, ETL (Extract, Transform, Load)
— Визуализации и разработка
— Корпоративная среда — сервер, отчеты
— Поддержка мобильных устройств
— Embedded (встроенная) аналитика в сторонние приложения/сайты

Читать дальше →
Total votes 12: ↑12 and ↓0+12
Comments41

Почему Do-Not-Track может стать обязательным

Reading time5 min
Views5.5K

В США предлагают обязать технологические компании учитывать согласие пользователей на передачу их персональных данных рекламным сетям.



/ фото Tom Roberts — Unsplash

Do-Not-Track (DNT) позволяет пользователю сети дать или отозвать как согласие на передачу третьим лицам данных о его действиях на странице так и на их применение в онлайн-рекламе.

По умолчанию DNT принимает значение null, что свидетельствует об отсутствии предпочтений.
Читать дальше →
Total votes 12: ↑12 and ↓0+12
Comments8

Харэ жрать? Говорим о пищевых привычках современного айтишника

Reading time12 min
Views63K
Читатели Хабра, в основном, люди интеллектуального труда и нередко наша жизнь ограничивается схемой «работа, дом, редкие посиделки с друзьями в кафе или баре». А если ещё есть заботливый работодатель, предоставляющий обеды, печеньки, снеки и напитки без ограничений, то всё, — привет, лишний вес. Конечно, среди нас есть фанаты бега, кроссов, марафонов, спортзалов и Iron Man, но их по-прежнему мало.

На Хабре нередко пишут про физические нагрузки, стоячие столы и прочие приспособления, но мы сегодня поговорим… о еде. Давайте отвлечёмся от работы, подумаем о своём здоровье и о пищевых привычках, а заодно выясним, не сгущаем ли мы краски. Тем, кто ест за компьютером — приятного аппетита!


Беговая дорожка, не поспоришь
Читать дальше →
Total votes 86: ↑74 and ↓12+62
Comments358

Баги в Gmail позволяли спрятать адрес отправителя и переложить письмо в «отправленные»

Reading time2 min
Views3.3K
Сразу две серьезные ошибки, которые могут быть использованы для фишинга, обнаружены в ноябре в интерфейсе Gmail исследователем Тимом Коттеном.

Перекладываем письмо в чужом инбоксе


Первый баг проявился, когда Тим изучал инцидент в своей компании. Одна из его коллег обнаружила в своем аккаунте GMail в папке «Отправленные» несколько писем, которые не посылала. В результате анализа ситуации выяснилось, что письма были отправлены с чужого аккаунта и при получении были автоматически помещены в папку «Отправленные».

image

Оказалось, что в поле «From:» на самом деле содержалось два адреса, принадлежавшие настоящему отправителю и фактическому получателю. Причем адрес получателя из-за отсутствия кавычек воспринимается почтовыми серверами, как сопроводительный текст к второму адресу почты. А интерфейс почтового ящика воспринимает получившуюся запись уже как два разных адреса. По версии Коттена, затем при обработке поля From:, содержащего адрес получателя, Gmail сортирует письмо по пакам как отправленное, несмотря на то, что сообщение является входящим и пришло с другого адреса.
Читать дальше →
Total votes 11: ↑11 and ↓0+11
Comments0

Как изменились велосипеды за последние 25 лет

Reading time7 min
Views16K

Выглядеть они могут примерно так же, но внешность может быть обманчивой



Велосипед примерно одного возраста с автором

Мы обычно представляем себе технологию, как что-то, перемещающее электроны. Однако позвольте мне немного погрузиться в технологию, позволяющую перемещаться нам с вами (да, и нашим электронам тоже, господа зануды). Скромный велосипед существует уже примерно пару столетий, и общая схема того, чем мы пользуемся сегодня, существовала уже к 1900-м годам, поэтому простительно будет считать, что с тех пор мало что поменялось. Лично я уж точно не задумывался об этом.

Мне пришлось поменять свою точку зрения, когда я, пытаясь больше заниматься спортом, решил поменять свой велосипед, купленный в начале 1990-х. Уже в процессе выбора стало очевидно, что поменялось многое – мне пришлось столкнуться с необходимостью принятия решений, о существовании которых я не подозревал. Большая часть лежащих в основе велосипеда технологий поменялась, и эти изменения часто решали важные проблемы. Мой старый велик, Trek 1200, был куплен студентом на доступные деньги в качестве высокоскоростного способа передвижения; если учесть инфляцию, то следующая модель велосипеда отличалась по цене от него не более, чем на $200. Однако у меня было такое ощущение, что я покупаю нечто совсем другое.
Читать дальше →
Total votes 35: ↑22 and ↓13+9
Comments27

«Data Science, как математика и физика, — еще один способ познавать мир вокруг себя»

Reading time17 min
Views8.6K
Хабр, привет! Мы продолжаем серию интервью с выпускниками Newprolab, в которой они рассказывают о своей истории перехода в область работы с большими данными. Истории разные и будут интересны тем, кто задумывается о смене карьерной траектории или о том, как новые знания могут помочь решать в том числе текущие задачи. Знакомьтесь — Олег Хомюк, Head of R&D в Lamoda.

Олег рассказал про свой карьерный путь, ценности, почему выбрал Lamoda, а не компанию в Долине, про текущие проекты, свою команду, про самый успешный и самый неудачный проекты, про отношение к data science и многое другое.

image
Читать дальше →
Total votes 17: ↑14 and ↓3+11
Comments4

Ученый из Китая заявил о рождении генетически модифицированных детей

Reading time2 min
Views30K


Сегодня появилась интересная новость — китайский ученый Цзянькуй Хэ заявил о появлении на свет первых в мире детей с модифицированным геномом. Ученый утверждает, что изменил геном эмбрионов таким образом, чтобы сделать организм будущих людей устойчивым к ВИЧ. Заявление ученый сделал в эксклюзивном интервью новостному агентству Associated Press.

К сожалению, пока что нет подтверждения этой информации, более того, ученый не выпустил ни одной публикации с объяснением и изложением своего эксперимента. В том, что геном человека может быть отредактирован, никто не сомневается, ведь опыты такого рода проводились ранее, проводятся они и сейчас.
Читать дальше →
Total votes 37: ↑34 and ↓3+31
Comments403

Data Science проект от исследования до внедрения на примере Говорящей шляпы

Reading time25 min
Views30K


Месяц назад Лента запустила конкурс, в рамках которого та самая Говорящая Шляпа из Гарри Поттера определяет предоставивших доступ к социальной сети участников на один из четырех факультетов. Конкурс сделан неплохо, звучащие по-разному имена определяются на разные факультеты, причем схожие английские и русские имена и фамилии распределяются схожим образом. Не знаю, зависит ли распределение только от имен и фамилий, и учитывается ли как-то количество друзей или другие факторы, но этот конкурс подсказал идею этой статьи: попробовать с нуля обучить классификатор, который позволит распределять пользователей на различные факультеты.

Читать дальше →
Total votes 67: ↑66 and ↓1+65
Comments2

Как превратить «столетний» usb-хаб в «умный» управляемый и сэкономить при этом 300$

Reading time13 min
Views76K

Как-то давно понадобился мне хаб, желательно с большим количеством портов и c достаточно удобной формой, пригодной для встраивания вместо флоппи-дисковода в отсек 3,5''. Беглый просмотр барахолки подкинул модель D-link DUB-H7, да еще и в комбинации «2 по цене 1». Внешний осмотр ничего особенного не дал, хаб как хаб, сделан добротно, капитальный «принтерный» USB AM-BM на оборотной стороне и 3 А блок питания. Как всегда первым делом разобрал, порадовался малому количеству пустых мест вместо элементов вкупе с качественной пайкой и успокоился. Правда на всякий случай зашел в интернет посмотреть, а что это за хаб и есть ли интересные проекты с его участием. Проектов не оказалось, отзывы пользователей 50/50, в общем, никакой динамики. Хаб на протяжении 5-7 лет довольно сносно работал и выполнял свою задачу, потом плавно переместился в коробку для электронного хлама и вполне возможно сгинул бы в итоге вместе с безызвестными переходниками, адаптерами и т. п. Но произошло у меня в жизни событие, которое заставило-таки меня покопаться в мешках со старым барахлом, найти этот, как оказалось уникальный D-link, и стряхнув пыль извлечь его на божий свет. Если интересно послушать зачем — добро пожаловать под cut.


миг-миг-миг
Читать дальше →
Total votes 57: ↑55 and ↓2+53
Comments34

Мозжечок и базальные ядра вместо хрустального шара: как мозг предсказывает будущее

Reading time10 min
Views13K


Сегодня мы с вами немного отойдем от рассмотрения исследований на базе нашей любимой физики/химии и переключим свое внимание на исследования человеческого организма. Точнее сказать на исследование мозга. Этот орган настолько сложен, что все предыдущие исследования давали один ответ и 10 новых вопросов, так сказать. Конкретнее говоря, сегодня мы рассмотрим исследование, намеренное ответить на вопрос — как мозг предсказывает будущее? И нет, мы не будем говорить о картах таро, кофейной гуще, астрологии и прочих ненаучных вещах. Мы будем говорить о том, как мозг человека, используя имеющиеся знания, выстраивание логических цепочек и анализ ситуации, способен предвидеть недалекое будущее. Исследователи уделили этому аспекту внимание не из праздного любопытства, а ради того, чтобы лучше понять процессы в мозге человека во время развития некоторых болезней, в том числе и болезни Паркинсона. Что именно узнали ученые, как они проводили эксперименты и что это может означать для медицины в будущем? Доклад поможет нам найти ответы на эти вопросы. Поехали.
Читать дальше →
Total votes 15: ↑14 and ↓1+13
Comments4

Пекин введёт социальный рейтинг для жителей города в 2020 году

Reading time3 min
Views45K

Система социального рейтинга в сериале «Чёрное зеркало»: сезон 3, эпизод 1

Власти Китая ранее заявляли о планах ввести социальный рейтинг для всех 1,3 миллиарда граждан страны в 2020 году. Очевидно, этим планам не суждено воплотиться в жизнь, и реализация программы в глобальном масштабе займёт гораздо больше времени. Тем не менее, киберпанковская система социального ранжирования граждан с компьютерным вычислением ценности каждого гражданина для общества в зависимости от его социального поведения становится всё ближе.

Недавно стало известно, что столица страны Пекин собирается внедрить программу пожизненных баллов до конца 2020 года. Каждому из 21,7 млн жителей мегаполиса будет присвоен социальный рейтинг. Официальный план 中共北京市委 北京市人民政府关于印发《北京市进一步优化营商环境行动计划(2018年—2020年)》的通知 опубликован 18 июля 2018 года на веб-сайте муниципального правительства Пекина.
Читать дальше →
Total votes 56: ↑51 and ↓5+46
Comments397

Обзор основных методов Deep Domain Adaptation (Часть 1)

Reading time13 min
Views17K

Развитие глубоких нейронных сетей для распознавания изображений вдыхает новую жизнь в уже известные области исследования в машинном обучении. Одной из таких областей является доменная адаптация (domain adaptation). Суть этой адаптации заключается в обучении модели на данных из домена-источника (source domain) так, чтобы она показывала сравнимое качество на целевом домене (target domain). Например, source domain может представлять собой синтетические данные, которые можно «дёшево» сгенерировать, а target domain — фотографии пользователей. Тогда задача domain adaptation заключается в тренировке модели на синтетических данных, которая будет хорошо работать с «реальными» объектами.


В группе машинного зрения Vision@Mail.Ru мы работаем над различными прикладными задачами, и среди них часто встречаются такие, для которых мало тренировочных данных. В этих случаях сильно может помочь генерация синтетических данных и адаптация обученной на них модели. Хорошим прикладным примером такого подхода является задача детектирования и распознавания товаров на полках в магазине. Получение фотографий таких полок и их разметка довольно трудозатратны, зато их можно достаточно просто сгенерировать. Поэтому мы решил глубже погрузиться в тему доменной адаптации.


Читать дальше →
Total votes 33: ↑33 and ↓0+33
Comments0

Красное море: почему падают акции Apple и других технологических компаний

Reading time3 min
Views29K


Еще недавно Apple была источником положительных новостей – компания стала первым американской организацией, достигшей оценки в $1 трлн. К началу октября акции компании подорожали почти на 40% с начала 2018 года.

Однако затем ситуация изменилась. Акции обвалились на 17%, что принесло серьезные убытки многим акционерам. Согласно подсчетам ресурса Barron's, общие потери в этот период примерно равны $190 млрд.

В сентябре Apple выпустила новые iPhone XS за $999 и iPhone XS Max за $1099, а также более дешевую модель iPhone XR за $749. Многие аналитики предсказывали успех новой линейке устройств, но не все оказалось так гладко.
Читать дальше →
Total votes 30: ↑20 and ↓10+10
Comments113

«Взлетит или нет»: на рынке стриминговых видеосервисов появится новый игрок

Reading time3 min
Views7.6K
Стриминговых видеосервисов сегодня много. Помимо Netflix, есть Amazon Prime, HBO, Starz и множество других. Влиться в этот рынок решили и в Disney. Компания готовит к запуску в 2019 году платформу Disney+. Подписчикам сервиса предложат сериалы во вселенной «Звездных войн», Marvel и другой оригинальный контент. Рассказываем и обсуждаем, чего ждать.

Читать дальше →
Total votes 16: ↑13 and ↓3+10
Comments14
1
23 ...

Information

Rating
Does not participate
Location
Харьков, Харьковская обл., Украина
Date of birth
Registered
Activity