Как стать автором
Обновить
4
0

Пользователь

Отправить сообщение

Из чего готовят Google Analytics Cookies

Время на прочтение3 мин
Количество просмотров23K
печеньки
Добрый день.
Недавно одни из наших заказчиков выразили желание получать дополнительную информацию о посетителях своего сайта, конкретнее — о людях, заполнивших контактную форму. Это крупная европейская компания и им хотелось бы «фильтровать» своих потенциальных клиентов. Поясню на примере — допустим, решают они организовать выставку своего оборудования в Венгрии и им нужно решить, кто из венгров, оставлявших им свои контакты, скорее всего стоящий клиент, а кто «мимо проходил».
Основными показателями «надежности» клиента для нас стали: число посещений сайта, время проведенное на сайте, количество просмотренных страниц. Всю эту информацию мы получили из Google Analytics Cookies.

Что же из себя представляют печеньки от Google?

Читать дальше →
Всего голосов 131: ↑126 и ↓5+121
Комментарии17

Measurement Protocol — просто о несложном

Время на прочтение5 мин
Количество просмотров48K
На днях Universal Analytics вышел из статуса беты и теперь становится основной версией Google Analytics. Это событие позволяет использовать его без ряда ограничений, существовавших ранее. Новая версия несет также ряд новых возможностей для отслеживания посетителей сайта и дает возможность сопоставить действия пользователя на сайте и последующее совершение целевых действие в оффлайне.
Читать дальше →
Всего голосов 7: ↑6 и ↓1+5
Комментарии11

Веб-аналитика с помощью Google Tag Manager

Время на прочтение6 мин
Количество просмотров130K


Относительно недавно, мы проводили редизайн и оптимизацию нашего сайта и наткнулись на ряд проблем связанных со скриптами и кодами отслеживания от Google. А именно:

  • проблема избытка кода Google в коде страниц (отслеживание событий, Google A/B tests, Google Analytics)
  • неудобство управления и слежения за скриптами.
  • постоянная необходимость редактирования шаблонов страниц, для внесения изменений и дополнительных параметров в скрипты.
  • зависимость от релизов на поддоменах (индивидуальный случай). Например, над личным кабинетом работает не один человек, а команда разработки с использованием контроля версии (VSC) и для внесения малейших изменений приходилось ждать очередного релиза.

В данной статье мы рассмотрим решение данных проблем на примере Google Analytics, посредством Диспетчера тегов от Google (Google Tag Manager) и рассмотрим новую модель организации работы со скриптами, для анализа работы сайта с практическими примерами и кучей картинок.
осторожно, много картинок
Всего голосов 1: ↑0 и ↓1-1
Комментарии1

Гипс на 3D-принтере и другие идеи команд от Tolstoy Camp, а также — нужен ли он вам?

Время на прочтение7 мин
Количество просмотров24K
Несколько недель эксперты Яндекса и других компаний помогали участникам нашей мастерской создавать, разрабатывать и запускать свои проекты.

Сегодня, в день, когда мы объявляем о наборе в следующий Кемп, мы решили поговорить с некоторыми ребятами из крутых проектов, которые были в этот раз, о том, зачем они приходили, что получилось, и кому это приносит пользу.



Будут истории от трёх команд:
  • Здравпринта — сервиса по созданию индивидуальных фиксаторов, которые печатаются на 3D-принтере и призваны заменить гипс на определенных стадиях выздоровления.
  • Globerland — сервиса, который позволяет находить переводчиков и посредников в других странах.
  • Gipis — приложения, помогающего бегунам планировать тренировки и готовиться к марафонам. Еще до кемпа у него было 150 000 пользователей.

Здравпринт


Федор (лидер проекта): Есть мнение, что идея ничего не стоит. У меня была гипотеза, что это не так – это раз, а два – у меня есть твердая уверенность, что разработанная идея стоит много. До Яндекса была только идея. Пришел в Яндекс, нашел ребят, помогли разработать. Сейчас это уже идея, которая стоит.

В чем она заключается? Заменить на определенных стадиях лечения гипс на индивидуальный фиксатор — анатомичный, индивидуальный, сделанный по скану человека. Мы выяснили, что в России в год 350 тысяч человек рискуют получить осложнения при переломах из-за того, что раньше времени сами себе снимают гипс. Делают это потому, что возникают проблемы с гигиеной, — под гипсом ничего нельзя помыть, кожа страдает и чешется. Не помогают уже ни линейки, ни вязальные спицы. И люди снимают себе гипс. Минимальное осложнение от этого — перелом срастается в 1,5-2 раза дольше, дольше чувствуются боль, дискомфорт. Очевидное решение — дать им какой-то другой способ фиксации.
Что изображено на КДПВ и нужно ли приходить на Кемп, если вы придумали ещё круче
Всего голосов 59: ↑53 и ↓6+47
Комментарии20

Поклонник Tron создал для себя виртуальную реальность при помощи 3 Kinect-ов и Oculus Rift

Время на прочтение1 мин
Количество просмотров60K


Посмотрев Tron еще в 1985 году, ОЛивер Крейлос (Oliver Kreylos) сразу стал поклонником виртуальной реальности. Но только сейчас, в 2014 году, ему удалось воплотить (хотя и частично) свою мечту в реальности, создав собственную виртуальную реальность и введя себя в созданный мир.

Само собой, для этого понадобилось аппаратное и программное обеспечение, включая сразу три Kinect от Microsoft и Oculus Rift. Три Кинекта используются для сканирования пространства, и трансляции сведенного потока в виртуальный мир.

Читать дальше →
Всего голосов 61: ↑59 и ↓2+57
Комментарии62

waSlideMenu.js. Многоуровневое прокручивающееся меню

Время на прочтение3 мин
Количество просмотров16K
jQuery-плагин, который превращает вложенное (древовидное) меню в систему прокручивающихся меню.

Репозиторий: github.com/webasyst/waslidemenu
Попробовать: jsfiddle.net/7LnSY/
Пример: demo-ru.webasyst.com
Подробнее о плагине
Всего голосов 39: ↑28 и ↓11+17
Комментарии14

Jiayu G4 — некогда китайский флагман

Время на прочтение7 мин
Количество просмотров62K
Каждую неделю на Хабре появляются обзоры смартфонов и неважно noname-китаец это или представитель А-бренда. Но, что такое обзор? — В большинстве случаев автор на протяжении месяца, а то и меньше тестирует смартфон в различных жизненных условиях и выдает материал. Но далеко не все пытаются угнаться за новинками, иногда человеку важен обкатанный, проверенный сообществом аппарат. Ведь неизвестно как телефон будет работать спустя полгода и какие подводные камни всплывут в процессе последующей эксплуатации? Сегодня я постараюсь на личном примере рассказать об использовании китайского аппарата. Подопытным стал описаный мной более чем полгода назад, бюджетный флагман относительно недавних времен — Jiayu G4.

Читать дальше →
Всего голосов 31: ↑25 и ↓6+19
Комментарии46

Автоматическое определение рубрики текста

Время на прочтение5 мин
Количество просмотров24K

Введение


В предыдущих статьях, посвященных организации данных в виде рубрикатора (Использование графа, как основы для создания рубрикатора и Проблемы, подстерегающие любого создателя рубрикаторов) были описаны общие идеи по организации рубрикатора. В этой статье я опишу один из возможных алгоритмов автоматического определения тематики текста на основе заранее подготовленного графа-рубрикатора. При этом я сознательно избегаю сложных формул, чтобы донести идею, лежащую в основе алгоритма, максимально просто.

Подготовка данных рубрикатора


Для начала определимся с тем, в каком виде мы будем готовить данные для рубрикатора.
  • 1. Рубрикатор – это граф, а не дерево
  • 2. Текст, тематика которого определяется, может быть отнесен к нескольким рубрикам одновременно
  • 3. Для каждого соотнесения с рубрикой указывается коэффициент точности определения рубрики
  • 4. Тематика текста определяется для каждого текста отдельно, и не зависит от того как были определены рубрики других текстов ранее

Последний пункт нуждается в небольшом пояснении. Независимость определения тематики текста очень хороша, когда не требуется последующая сортировка результатов. Когда тексты просто отнесены к рубрики или нет. Но при наличии в рубрике нескольких текстов, наверняка возникнет необходимость отсортировать их по критерию наилучшего попадания в рубрику. В данной статье этот вопрос опущен для ясности.

Алгоритм определения тематики текста, кратко


Описываем рубрикатор. Извлекаем из исследуемого текста ключевые слова, описанные в рубрикаторе. В результате извлечения получаем кусочки разорванного и чаще всего несвязного графа. Используем волновой (или любой другой, по желанию) алгоритм для «дотягивания» извлеченных кусочков графа до вершины «всё». Анализируем и выводим результаты.
Читать дальше →
Всего голосов 35: ↑32 и ↓3+29
Комментарии4

Jiayu G4 — долгожданный китайский флагман

Время на прочтение10 мин
Количество просмотров195K
Так уж сложилось, что я второй раз к ряду становлюсь владельцем смартфона от компании Jiayu. Мой предыдущий Jiayu G2 (слева), которым я успел попользоваться около 9 месяцев, уже успел подустареть, но аппарат действительно получился на славу, при своих компактных размерах имел производительный процессор, 1 ГБ оперативной памяти и батарею в 2000 мАч. Но время не стоит на месте, выходят новые процессоры, новые версии ОС, а с учетом того, что китайцы не особо заботятся о дальнейшей поддержке своих устройств — я решил обновиться в плане железа. Ко всему моему сожалению, схожий по соотношению функционал/размеры/цена смартфон найти не удалось. Поэтому пришлось подымать планку до критичных 4.7 дюймов. И выбор, как вы уже поняли из заголовка, пал на тот самый «долгожданный китайский флагман» — Jiayu G4 (справа). О нем и поговорим в данном обзоре.
image
Читать дальше →
Всего голосов 39: ↑28 и ↓11+17
Комментарии54

Московская школа робототехники действительно существует. И она находится в Ясенево

Время на прочтение7 мин
Количество просмотров36K
В пятницу, по приглашению подруги, впервые побывал в школе роботов и съездил в Зеленоград, чтобы побывать на том самом заводе Ангстрем и попаcть в лабораторию кибернетики neurolabs.ru Как результат — составил свое мнение о местных делах и хочу поделиться им с тобой, Хабр.



Новый мир всегда собирается фанатиком на коленке. Джобс и Возняк очень верили в персональные компьютеры и начали собирать их у себя в гараже в 197б году – сегодня Эппл крупнейшая компания в мире. Да, прошло, считай 40 лет, но дух «гаражного энтузиазма» не выветрился.

А теперь представьте, что такие же фанаты своего дела сидят «в гараже» в современной Москве, и с горящими глазами, собирают «персональных роботов». Сейчас это просто инженеры с паяльниками, но что будет через двадцать лет?



Читать дальше →
Всего голосов 42: ↑37 и ↓5+32
Комментарии21

Байес

Время на прочтение3 мин
Количество просмотров98K
В левой руке Морфеуса лежит 7 синих и 3 красных таблетки, а в правой 5 синих и 8 красных. Вы закрываете глаза и берете таблетку — она оказывается красной, однако вы не знаете из какой руки ее взяли. Какова вероятность, что вы взяли ее из правой руки?


image

17 апреля 1761 — день смерти Томаса Байеса.
Под катом результаты того, что есть в рунете, помимо стандартных вещей типа Теорема Байеса, Байесовская сеть, Наивный байесовский классификатор , Байесовская фильтрация спама
Читать дальше →
Всего голосов 102: ↑94 и ↓8+86
Комментарии38

Что происходит в мозгах у нейронной сети и как им помочь

Время на прочтение26 мин
Количество просмотров42K
В последнее время на Хабре появилось множество статей о нейронных сетях. Из них очень интересными показались статьи о Перцептроне Розенблатта: Перцептрон Розенблатта — что забыто и придумано историей? и Какова роль первого «случайного» слоя в перцептроне Розенблатта. В них, как и во многих других очень много написано о том, что сети справляются с решением задач, и обобщают до некоторой степени свои знания. Но хотелось бы как-то визуализировать эти обобщения и процесс решения. Увидеть на практике, чему там научился перцептрон, и почувствовать, насколько успешно ему это удалось. Возможно, испытать горькую иронию относительно достижения человечества в области ИИ.
Языком у нас будет С#, только потому что я недавно решил его выучить. Я разобрал два наиболее простых примера: однослойный перцептрон Розенблатта, обучаемый коррекцией ошибки, и многослойный перцептрон Румельхарта, обучаемый методом обратного распространения ошибки. Для тех, кому, как и мне, стало интересно, чему они там на самом деле обучились, и насколько они на самом деле способны обобщать – добро пожаловать под кат.

ОСТОРОЖНО! Много картинок. Куски кода.
Читать дальше →
Всего голосов 70: ↑66 и ↓4+62
Комментарии23

Как получить данные о 5 млн компаний через LinkedIn REST API или почему в OAuth лучше разрешать использовать Request Token только один раз

Время на прочтение2 мин
Количество просмотров14K

Введение


С помощью LinkedIn Company Lookup API можно получить информацию о компании зарегистрированной на LinkedIn. Искать можно по ключевым словам, а можно и с помощью ID. Например, GET запрос
http://api.linkedin.com/v1/companies::(1337)
вернет информацию о самой компании LinkedIn. Весьма удобно, что через запятую можно указать сразу несколько ID, однако при этом стоит учитывать что слишком много ID указать в одном запросе также не получится из-за ограничения на размер самого запроса.
Читать дальше →
Всего голосов 36: ↑33 и ↓3+30
Комментарии3

Часть первая, а вторую часть всё равно никто не читает

Время на прочтение5 мин
Количество просмотров33K

О чем собственно речь


Как-то раз одним поздним декабрьским вечером завершился сбор материала для хабра-статьи, посвященной SAT. Материала оказалось слишком много и передо мной встал выбор: разделить статью на две части или собрать весь материал вместе в одной статье. Выбор был сделан в пользу разделения на части (первая и вторая). К моему удивлению, вторая часть получила значительно меньше внимания, чем первая — фактически её прочитали в два раза меньше человек.

Время шло, и я стал замечать, что это происходило не только с моими статьями, но и со многими другими статьями в нескольких частях. Тогда у меня возник вопрос, а верно ли в общем, что вторая часть получает меньше внимания (просмотров, плюсов, и записей избранного)?

(сделано на основе хабра-статьи Как лгать с помощью статистики)

Структура статьи
  1. О чем собственно речь
  2. Данные
  3. Сравниваем части
  4. Серии статей
  5. Заключение
  6. Дальнейшее чтение

Читать дальше →
Всего голосов 69: ↑62 и ↓7+55
Комментарии31

Авторизация с помощью клиентских SSL сертификатов в IOS и Android

Время на прочтение8 мин
Количество просмотров38K
Протокол безопасной передачи данных SSL (Secure Sockets Layer) помимо обеспечения безопасной передачи данных так же позволяет реализовать авторизацию клиентов при помощи клиентских SSL сертификатов. Данная статья является практическим руководством по реализации данного вида авторизации в мобильных приложениях на IOS и Android.

Процесс организации работы сервера обеспечивающего такой вид авторизации в статье не рассматривается, однако в конце приведены ссылки по данной тематике.

Процесс авторизации выглядит следующим образом. При переходе клиента в закрытую область сервер запрашивает у клиента сертификат, если проверка прошла успешно то клиент получает доступ к закрытому контенту в ином случае клиент может получить ошибку “No required SSL certificate was sent”.
Читать дальше →
Всего голосов 15: ↑15 и ↓0+15
Комментарии8

7 мелочей, поднимающих продажи у нас в интернет-магазине

Время на прочтение4 мин
Количество просмотров96K
Давайте поговорим о социальном доказательстве – самой мощной силе, способствующей продажам. И тем, как это использовать на сайте и в других местах. Сейчас объясню.

Метод 1. Фотографии пользователей с товаром


Кошка «из коробки» не умеет слезать с дерева. Подъём в хардкоде рефлексов, а спуска там нет. Он не жизненно необходим. И она не умеет спускаться — разумеется, пока не увидит, как другая кошка делает это. Стоит один раз понять принцип на примере, и она сможет повторить это сама. Зеркалирование поведения – одна из самых глубоких моделей обучения, поэтому просто грех ей не воспользоваться.

Совет – например, покажите ваш товар в естественной обстановке с теми людьми, которые им пользуются. Вот как это делаем мы:



За 5 лет работы у нас образовался достаточно большой архив фотографий настолок с играми. Мы их и использовали. Вы можете сделать практически то же самое. Да! Есть нюанс. Если ваши покупатели – дети, то никогда не ставьте фотографии с более младшими «пользователями»: гораздо лучше — постарше. Всё просто. Ребёнок хочет быть похожим на старших и совершенно не хочет – на «малышей».
Читать дальше →
Всего голосов 152: ↑146 и ↓6+140
Комментарии88

Как устроено ранжирование

Время на прочтение9 мин
Количество просмотров26K
Со временем Sphinx оброс большой кучей режимов поиска и ранжирования. Регулярно возникают вопросы про разное (от «как вытащить документ на 1е место» до «как рисовать от 1 до 5 звездочек в зависимости от степени совпадения»), которые на самом деле суть вопросы про внутреннее устройство тех режимов. В этом посте расскажу все, что вспомню: как устроены режимы поиска и режимы ранжирования, какие есть факторы ранжирования, как в точности рассчитываются факторы, как финальный вес, все такое. И, конечно, про звездочки!
Читать дальше →
Всего голосов 52: ↑48 и ↓4+44
Комментарии43

Elastic Search в enterprise-проектах

Время на прочтение5 мин
Количество просмотров56K
В рамках этой статьи я поделюсь опытом использования Elastic Search во внутренних продуктах 2ГИС, в частности, в собственной системе для организации Call-центра. А также расскажу, какие проблемы мы смогли решить, используя этот поисковый движок.


Читать дальше →
Всего голосов 51: ↑50 и ↓1+49
Комментарии23

ElasticSearch 1.0 — новые возможности аналитики

Время на прочтение9 мин
Количество просмотров32K
Многие слышали о высокоуровневом поисковом сервере ElasticSearch, но не все знают, что многие используют его не совсем по прямому назначению. Речь идет о реалтайм-аналитике различных структурированных и не очень данных.

Эта статья также назрела ввиду того, что многие крупные интернет-проекты рунета в 2014 году получили письма счастья от Google Analytics с предложением заплатить $150 000 за возможность использовать их продукт. Я лично считаю, что ничего плохого в том, чтобы оплатить труд программистов и администраторов нет. Но при этом это довольно серьезные инвестиции, и, может, вложения в собственную инфраструктуру и специалистов, даст большую гибкость в дальнейшем.

Аналитика в ElasticSearch основана на полнотекстовом поиске и фасетах. Фасеты в поиске — это некая агрегация по определенному признаку. Вы часто сталкивались с фасетами-фильтрами в интернет-магазинах: в левой или правой колонке есть уточняющие галочки. Ниже пример тестового фасетного поиска у нас на главной странице http://indexisto.com/.



Буквально неделю назад вышла стабильная версия поискового сервера ElasticSearch 1.0, в которой разработчики настолько серьезно поработали над фасетами, что даже назвали их Aggregation.

Так как тема еще не освещалась на Хабре, я хочу рассказать, что из себя представляют аггрегации в ElasticSearch, какие возможности открываются и есть ли жизнь без Hadoop.
Читать дальше →
Всего голосов 81: ↑75 и ↓6+69
Комментарии19

Информация

В рейтинге
Не участвует
Зарегистрирован
Активность

Специализация

Systems Analyst, Web Analyst
SQL
Python
Docker
Linux
Git
JavaScript
PowerBi
Web analyst
Data Analysis
DWH