Articles / Bookmarks / Profile of Priest / Habr

Халецкий Андрей @Priest

ИТ Предприниматель

ProfileArticles7PostsNewsComments587

alizar Sep 7 2007 at 09:35

«Яндекс» вычислил самых активных пользователей электронных денег

4 min

2.6K

Lumber room

Компания «Яндекс» опубликовала большое исследование рынка электронных платежей в российском интернете (PDF). Работа составлена на основе платёжной системы «Яндекс.Деньги», но некоторые индикаторы (например, соотношение платежей за товары и услуги, структура платежей, поведенческий профиль самых активных пользователей и т.д.) можно считать общими для всех платёжных систем. В отчёте рассматривается статистика с лета 2006 года по лето 2007 года.

Несколько интересных фактов. Самые дорогие товары, за которые расплачиваются электронными деньгами — техника и цветы, особенно в сентябре (средняя стоимость букета в сентябре 2006 года достигла 7000 рублей). Но вообще за товары почти никто не платит, а через интернет обычно оплачивают только сотовую связь, хостинг и другие услуги. Самая активная категория плательщиков — квартиросъёмщики.

Читать дальше →

+20

vasilyyaremchuk Apr 2 2007 at 11:46

Основное отличие офисной от удаленной работы.

1 min

868

Lumber room

До сих пор не могу понять, почему большинство людей предпочитает повременную работу.
Думаю это скорее всего наследие совка.

Мне кажется офисная работа подразумевает поденщину (оклад слабо зависит от выполненой работы), в то время как фриланс — это классически сдельная работа.

А теперь посмотрим на векторы интересов работника и работодателя в обоих случаях.

В первом случае работнику не интересно делать больше и повышать производительность, ведь ему платят за время, наоборот ему выгодно делать поменьше, чтобы не напрягаться, в то время как работодатель старается выжать из работника по максимуму за рабочий день.

В случае сдельной работы работнику и работодателю выгодно, чтобы работа была сделана за минимальное время, в этом случае их интересы совпадают.

Apostol Sep 25 2007 at 06:20

PNG с альфа-каналом + opacity в IE7

1 min

4.3K

Browsers

Нужно было добавить на сайт плавно появляющиеся изображения в формате PNG с альфа-каналом. IE5.5-IE6 поборол баг-фиксом с применением AlphaImageLoader. Ожидал, что с IE7 не будет в этом плане проблем. Ошибался…

В IE7, при накладывании прозрачности на полупрозначный PNG, 8-битный альфа-канал начинает вести себя словно 1-битный. Полностью прозрачные пиксели прозрачными и остаются, а те, которые были хоть немного непрозрачными, накладываются на чёрный фон.

Кроме того, в IE7 так и не ввели CSS3 свойство opacity.

Тест прилагается

UPD: На выше упомянутом сайте для достижения требуемого эффекта пришлось использовать старый трюк, применяемый к полупрозрачным PNG в IE<7. Вот вам и поддержка альфа-канала.

+29

infotanka Oct 22 2014 at 08:39

Онлайн-курс «Визуализация данных. Основы»

2 min

27K

Лаборатория данных corporate blogData visualization*

Есть такие дела, про которые понятно, что они важные и нужные, но руки до которых доходят в последнюю очередь — то есть зачастую никогда. Думаю, у онлайн-версии курса по визуализации данных были все шансы стать таким вот вечно отложенным делом. Если бы не хабр…

В феврале в ответ на комментарий пользователя TyMaH я пообещала, что «до конца этого года мы так или иначе сделаем онлайн». Обещание — есть обещание. Встречайте наш первый (мини) онлайн-курс «Визуализация данных. Основы».

Курс посвящён дизайнерским принципам работы со сложными данными и знакомит слушателей с бибилиотекой D3.js — самым мощным и гибким инструментом создания интерактивных визуализаций. Курс состоит из 6 лекций и 6 практических заданий, каждое из которых позволяет применить и закрепить теоретический материал.

Читать дальше →

+32

AlexGechis Oct 16 2014 at 11:36

Как выбрать алгоритм для адресного фильтра

8 min

19K

HFLabs corporate blogAlgorithms*Programming*

Довольно часто на Хабре появляются статьи с новыми алгоритмами автоматического разбора адресов, записанных одной строкой. Кроме этого, услуги по обработке адресов предоставляют различные it-компании. В статье мы расскажем как использовать свою адресную базу для выбора алгоритма автоматического разбора адресов, и на что стоит обратить внимание при тестировании и разработке алгоритмов адресных фильтров.

Эта статья для всех, кто хранит данные клиентов и хочет решить одну из следующих задач:

убедиться, что адрес существует, чтобы не отправить посылку или письмо в никуда;
разбить адрес на компоненты, чтобы понять, где идут лучше продажи;
дополнить адрес недостающей информацией, чтобы оптимизировать план работы курьеров;
стандартизовать адреса, чтобы найти дублирующие записи одного и того же клиента;
актуализировать и привести адреса к формату справочника, чтобы пройти проверки регуляторов.

Задача автоматического разбора почтовых адресов кажется довольно простой на первый взгляд — бери да сопоставляй адресному справочнику (например, ФИАСу) слова из входной строки. Но все, кто за неё берутся, утопают в большом количестве особенностей адресов…

Читать дальше →

+21

jinxu Oct 15 2014 at 14:35

Как выявить потери в продажах

3 min

16K

datawiz.io corporate blogAlgorithms*Big Data*Mathematics*

Пример анализа данных на основе продуктового магазина от Datawiz.io.

Эта статья о том, как выявить потери в продажах. Потери в продажах — это дни, когда товар не продавался, или было продано аномально низкое количество единиц товара.

Зачастую потери в продажах случаются из-за недостаточного количества заказанного товара. Также часто товар, имеющийся на складе, не выставляется на полки. Ежедневный анализ данных помогает своевременно обнаружить такой «провал» в продажах. Далее, устраняем проблему — контролируем работу отдела закупок, оптимизируем поставки, контролируем работу торгового персонала.

Читать дальше →

b0noII Sep 27 2014 at 09:07

Новая языково-независимая NLP библиотека

7 min

27K

Data Mining*Java*Natural Language Processing*

Введение

Каждый, кто пришел в этот мир, проходил через путь познания языка. При этом человек обучается языку отнюдь не по правилам или грамматике. Даже, более того, каждый человек, будучи еще ребенком, сначала учит такое странное явление как язык, а уже позднее, с возрастом, начинает учить его правила (в садике и школе). Это объясняет забавный факт, каждый, кто изучает иностранный язык в зрелом возрасте, когда он уже менее склонен к изучению новых языков, знает о предмете своего изучения больше, чем большинство носителей этого языка.

Это простое наблюдение дает возможность предполагать, что для понимания языка вовсе не нужно иметь знания о нем. Достаточно лишь эмпирии (опыта), который можно почерпнуть от окружающих. Но именно об этом забывают практически все современные НЛП библиотеки, пытаясь построить все-обемлящую языковую модель.

Для более четкого понимания представьте себя слепым и глухим. И, даже родись в таком состоянии, вы бы могли взаимодействовать с миром и освоить язык. Само собой, что ваше представление о мире было бы иным, нежели у всех вокруг. Но вы могли бы все таким же образом взаимодействовать с миром. Некому бы было объяснить Вам что происходит и что такое язык ив се же, как то, тактильно анализирую шрифт Брайля Вы бы понемного сдвинулись с мертвой точки.

А это значит, что для понимания сообщения на каком-либо языке нам не нужно ничего, кроме самого сообщения. При условии, что это сообщение достаточно большое. Именно эта идея и положена в основу библиотеки под названием AIF. За деталями прошу пожаловать под кат.

Читать дальше →

+18

Alex10 Sep 23 2014 at 14:03

Реанимация серверов Ubuntu на Hetzner или немного полезных команд

3 min

39K

Configuring Linux*Server Administration*

Tutorial

Этот небольшой пост-шпаргалка предназначен для тех у кого внезапно в ходе неудачного эксперимента или обновления перестал пинговаться сервер, отвалился ssh и прочее. Проще говоря он о восстановлении сервера после обновлений, взломов и тому подобного. По моим ощущениям последнее бывает гораздо реже.

Так что кому интересна эта тема прошу под кат.

+37

moat Sep 14 2014 at 15:54

Обзор наиболее интересных материалов по анализу данных и машинному обучению №13 (8 — 14 сентября 2014)

5 min

14K

Data Mining*Big Data*

Представляю вашему вниманию очередной выпуск обзора наиболее интересных материалов, посвященных теме анализа данных и машинного обучения. В данном выпуске достаточно много интересных примеров с использованием языков программирования R и Python. Также есть несколько интересных статей, посвященных соревнованиям по машинному обучению. Достаточно много материалов, которые будут интересны новичкам в теме анализа данных и машинного обучения. Традиционно, некоторое количество материалов посвящено теме Data Engineering.

Читать дальше →

+25

ntz Mar 4 2011 at 17:53

Фонетические алгоритмы

9 min

46K

Algorithms*

From sandbox

Фонетические алгоритмы сопоставляют двум словам со схожим произношением одинаковые коды, что позволяет осуществлять сравнение и индексацию множества таких слов на основе их фонетического сходства.

Часто довольно трудно найти в базе нетипичную фамилию, например:

— Леха, поищи в нашей базе Адольфа Швардсенеггера,
— Шворцинегира? Нет такого!

В этом случае использование фонетических алгоритмов (особенно в сочетании с алгоритмами нечеткого сопоставления) может значительно упростить задачу.

Такие алгоритмы очень удобно использовать при поиске в базах по спискам людей, в программах проверки орфографии. Зачастую они используются совместно с алгоритмами нечеткого поиска (которые, несомненно, заслуживают отдельной статьи), предоставляя пользователям удобный поиск по именам и фамилиям в различных базах данных, списках сотрудников и так далее.

В этой статье я рассмотрю наиболее известные алгоритмы, такие как Soundex, Daitch-Mokotoff Soundex, NYSIIS, Metaphone, Double Metaphone, русский Metaphone, Caverphone.

Читать дальше →

+152

dsosnin Aug 19 2014 at 12:04

Автоматическое определение пола по имени

3 min

24K

Pechkin.com corporate blogWebsite development*PHP*

Продолжая рассказывать о технологиях, которые используются в нашем сервисе email-маркетинга Pechkin-mail.ru, мы просто обязаны упомянуть об автоматическом определении пола подписчика по имени. Еще в 2007 году, разрабатывая сервис sms-рассылок, мы очень хотели реализовать возможность автоматического подставления окончаний в прилагательные “Уважаемый”, “Дорогой” и так далее. Обычно такая подстановка осуществляется на основании дополнительного поля в адресной базе клиента. Однако, как нам кажется, это полный отстой.
На это есть 3 причины:

заставлять подписчика задавать свой пол глупо (чем больше полей в форме, тем ниже вероятность ее заполнения)
определять вручную — долго, а значит дорого
от ошибок человек не застрахован ровно так же, как и машина.

Но мы не лингвисты, поэтому реализовать такой модуль было бы слишком сложно для нас, да и функция “не первой необходимости”. Но недавно, работая над склонениями текстов бесконечных актов, договоров и прочих юридических документов, мы вспомнили об используемом нами уже 2 года сервисе Морфер. Это прекрасный лингвистический сервис, специализирующийся на русском языке и позволяющий склонять по падежам слова, целые предложения, числительные, а также получать текст из цифр. В общем, потрясающая разработка всего одного человека — Сергея Слепова.

Подробнее о реализации функции определения пола на нашем сервисе

navikom Aug 18 2014 at 13:26

Memcached в PHP Kohana и его тестировние

2 min

5.7K

Kohana*Programming*PHP*

From sandbox

Уже много описано про memcache, однако я помучался прежде чем нашел оптимальный вариант для одного проекта на PHP, достаточно ресурсоемкого с большим объемом расчетов в Kohana.

Memcache пришлось отфутболить сразу же, так как когда ключей набегает пару сотен, нереально отследить, когда и какой ключ нужно убить. Смотрел в сторону MemcacheTag, где применено использование тэгов для объединения нескольких ключей, однако он оказался слишком сырым и весьма неудобным для работы. В конце концов был найден самый, на мой взгляд, оптимальный вариант работы с memcached.

Описание принципа работы данной технологии лучше всего посмотреть здесь или в первоисточнике.

Я же напишу как подключать и использовать в фреймворке Kohana, каким образом отследить ключи кэшей и собственно протестировать как работает кэширование в проекте.

Итак, начнем:

Читать дальше →

-9

celebritas Jul 24 2014 at 06:48

Как значительно повысить конверсию сайта с помощью крошечных фраз: Микрокопия. Часть 1

4 min

36K

Increasing Conversion Rate*

Tutorial

Recovery Mode

Месяц назад мы поделились статьей «Все что вы знаете об оптимизации конверсии – неправда». Сегодня продолжаем тему конверсии.

Прежде чем переходить к статье, предлагаем Вам подумать над следующим вопросом. Какие средства лучше всего использовать для повышения конверсии сайта — что первое приходит вам на ум?
В статье о создании эффективного призыва к действию говорится о том, что клиенты Visual Website Optimizer чаще всего для повышения конверсии тестируют:
• кнопки призыва к действию – CTA (30%);
• заголовки (20%);
• оформление (10%);
• текст (8%).
Но что если эта одержимость заголовками и CTA-кнопками уже неактуальна?

Читать дальше →

+13

AlexGechis Jul 23 2014 at 10:45

ФИАС или КЛАДР: выбираем справочник адресов

9 min

188K

HFLabs corporate blogSystem Analysis and Design*Website development*

1 июля 2014 года произошло одно из самых значимых событий в истории государства Российского: с этого момента у нас в стране наконец появилась эталонная база адресов по всем, даже самым малым населённым пунктам! Имя этой базе — ФИАС. Собственно, сам по себе справочник ФИАС появился гораздо раньше, но именно 1 июля вступил в силу ФЗ 443, согласно которому все государственные и муниципальные структуры теперь должны опираться на него как на единственно верную базу адресов. Мы решили исследовать, стоит ли переходить на ФИАС, и с какими подводными камнями столкнутся те, кто решит это делать.

Прочитав статью, вы узнаете:

Чем отличается ФИАС от КЛАДР
Можно ли уже использовать ФИАС вместо КЛАДР
Стоит ли беспокоиться о переходе на ФИАС тем, кто уже работает с КЛАДР
Решит ли ФИАС текущие проблемы с адресами
Что ждёт тех, кто только начинает использовать адресные справочники
Какие есть самые заметные и важные проблемы при работе с ФИАС и КЛАДР

Читать дальше →

+61

eagleson Jul 23 2014 at 14:22

[кейс] Как вернуть долг от бывших работодателей или про хитрые переговорные стратегии

5 min

76K

Стратоплан corporate blog

Года 4 назад довелось побывать на конференции по рекрутингу. Я там делал небольшой доклад про найм инженеров, но несравнимо большее удовольствие получил, слушая доклады опытных хедхантеров.

Это реально детектив! Агата Кристи, Ян Флеминг и Джон Гришем! Люди разрабатывают схемы с внедрением своих людей в чужие компании, продумывают стратегии на три хода вперед… И это работает.

Похожие впечатления захватили меня сегодня, когда наш коллега Дмитрий Коткин прислал кейс из своей практики, как одна его знакомая получала причитающуюся ей зарплату от бывших работодателей.

Кейс “Переговоры стоимостью в 3 зарплаты”

Читать дальше →

+90

zz_wolf Jul 11 2014 at 14:33

Распознавание красоты лиц

5 min

46K

Image processing*

«Свет мой, зеркальце! скажи
Да всю правду доложи:
Я ль на свете всех милее,
Всех румяней и белее?»

А.С. Пушкин

Волшебные вещи из сказок мало-помалу реализуются в настоящей реальности за счет использования новых технологий и научных открытий. Уже реализованы и активно применяются такие девайсы как ковер-самолет (авиация), сапоги-скороходы (автомобили), яблочко на блюдечке (нетбук с интернетом), клубочек который показывает дорогу (GPS-навигатор) и другие нужные вещи. Мы попытались реализовать упомянутую в «сказке о мертвой царевне и о семи богатырях» систему оценки красоты лица человека с помощью методов искусственного интеллекта и машинного зрения, так как считаем, что автором эпиграфа на самом деле подразумевался планшет с фронтальной камерой и специальным установленным софтом.

Подробности

+29

rocknrollnerd Jun 16 2014 at 09:31

Про котиков, собак, машинное обучение и deep learning

15 min

84K

Image processing*

From sandbox

«В 1997 году Deep Blue обыграл в шахматы Каспарова.
В 2011 Watson обставил чемпионов Jeopardy.
Сможет ли ваш алгоритм в 2013 году отличить Бобика от Пушистика?»

Эта картинка и предисловие — из челленджа на Kaggle, который проходил осенью прошлого года. Забегая вперед, на последний вопрос вполне можно ответить «да» — десятка лидеров справилась с заданием на 98.8%, что на удивление впечатляет.

И все-таки — откуда вообще берется такая постановка вопроса? Почему задачи на классификацию, которые легко решает четырехлетний ребенок, долгое время были (и до сих пор остаются) не по зубам программам? Почему распознавать предметы окружающего мира сложнее, чем играть в шахматы? Что такое deep learning и почему в публикациях о нем с пугающим постоянством фигурируют котики? Давайте поговорим об этом.

По заветам издателей Стивена Хокинга - без формул

+95

Constructive Jun 6 2014 at 17:33

Прибыльный интернет магазин. Часть I: обзор метрик и способов увеличения прибыли

3 min

27K

Website development*Development for e-commerce*

Каждый владелец интернет магазина рано или поздно задумывается о мероприятиях, направленных на увеличение прибыли. Как правило, эти мероприятия сводятся к случайным изменениям в дизайне сайта и тестировании нового рекламного канала. В них нет системы.

Дело в том, что у большинства руководителей нет видения, что и как влияет прибыльность магазина и с помощью каких метрик, можно отследить текущее положение дел. В результате вместо реальной работы по созданию прибыльного интернет магазина, руководитель решает частные вопросы, вроде «влить денег в контекст или поработать над юзабилити».

Читать дальше →

-1

Gen1us2k Jun 4 2014 at 19:27

SIP через WebRTC на продакшне. Как мы к этому шли и какие проблемы решали

5 min

52K

Website development*Development of communication systems*

Доброго времени суток всем!

Я уже писал о своем опыте работы с WebRTC тут, но учитывая то, что в последнее время всё больше статей на эту тему появляется на хабре и то, что я давно хотел написать о том, как мы добились стабильной работы SIP телефонии через WebRTC на продакшне, я решил написать через что мы прошли.

А прошли мы через многое: боль, панику, истерики, кучу матов и пожелания добра мейнтейнерам.
Сейчас же это всё в прошлом. Мы избавились от всех костылей, которые мы делали, и сделали так, чтобы операторы звонили и всё работало стабильно.
В статье, я как можно подробнее описал все проблемы, с которыми мы сталкивались, используя как можно меньше кода и конфигов.

Кому интересно, прошу под кат.

Читать дальше →

+31

ZlodeiBaal May 27 2014 at 15:36

Автоматическое выделение меток

5 min

23K

Image processing*

Tutorial

В машинном зрении и робототехнике есть забавный класс задачек: обнаружение заранее известных меток. Сюда можно отнести всё: QR-коды, Augmented Reality ( AR, дополненная реальность), задачи позиционирования объектов (motion capture, определение местоположения), детектирование объектов по меткам, классификация объектов в робототехнике (например при автоматической сортировке), помощь автоматическим системам в позиционировании (роботизированные захваты), трекинг объектов, и.т.д.

В статье описаны основные методы захвата меток, их возможности, границы применимости.

Читать дальше →

+50

1 2 3 4

6 7 ...

14 15