Articles / Bookmarks / Profile of andreypaa / Habr

Андрей @andreypaa

User

ProfileArticlesPostsNewsComments86

IrinaTitova Nov 8 2013 at 13:44

Как интернет-магазину «понравиться» поисковой системе

8 min

11K

iSEO corporate blog

Для интернет-магазина органический трафик с поисковых систем является одним из наиболее выгодных способов привлечения клиентов. Также хорошие результаты показывает контекстная реклама, однако конкуренция, растущая день ото дня, и постоянное увеличение числа рекламодателей приводит к непрекращающемуся повышению цены клика. Конечно, по сравнению с контекстом, SEO – менее надежный, управляемый и плохо прогнозируемый канал, однако в руках профессионала он способен давать большую отдачу на каждый вложенный рубль, чем любая реклама.

Как повысить эффективность своего SEO-продвижения? Давайте рассмотрим 12 довольно простых решений, которые значительно облегчат взаимопонимание между вашим интернет-магазином и поисковыми системами.

Читать дальше →

RubaXa Nov 6 2013 at 07:03

FileAPI 2.0: Загрузка файлов на сервер год спустя

11 min

70K

VK corporate blogWebsite development*JavaScript*

Привет Хабр! Примерно год назад я представил вашему вниманию первую версию open-source библиотеки FileAPI, предназначенную для работы с файлами на клиенте и последующей загрузки на сервер.

За это время был пройден долгий путь. Библиотека заработала 670+ звезд и 90+ форков. С помощью github-сообщества удалось исправить множество «детских» проблем и внести ряд улучшений. Было закрыто более 100 тасков, и благодаря Илье Лебедеву сделана загрузка файлов по частям. Сегодня я с гордостью хочу представить вам FileAPI 2.0.

Читать дальше →

+148

ZlodeiBaal Nov 2 2013 at 21:30

Использование каскада Хаара для сравнения изображений

4 min

74K

Algorithms*Image processing*

Признаки Хаара, про которые я расскажу, известны большинству людей, которые так или иначе связаны с системами распознавания и машинного обучения, но, судя по всему, мало кто использует их для решения задач вне стандартной области применения. Статья посвящена применению каскадов Хаара для сравнения близких изображений, в задачах сопровождение объекта между соседними кадрами видео, поиска соответствия на нескольких фотографиях, поиска образа на изображении и прочих подобных задач.

+67

xandr0s Nov 1 2013 at 08:27

Бэкап большого количества мелких файлов

3 min

40K

Configuring Linux*System administration*Data recovery*

Рано или поздно настройкой резервного копирования рабочих файлов озадачивается любой уважающий себя современный IT специалист. После ряда опечаток/ошибок программистов нашлось время для этого и у меня.
Специфика веб-приложения такова, что рабочий каталог занимает более 50ГБ на жестких дисках, включая в себя около 900 тысяч мелких файлов (картинки, превьюшки, ...). Поэтому в лоб решить задачу с помощью tar и аналогов не вышло. Да и хотелось бы иметь некоторую вариативность хранимых данных, а в случае с полным бэкапом реализация требовала больших затрат на хранение по сути одинаковых данных с небольшими изменениями. Плюс неплохо было бы дублировать копии на удаленном сервере бэкапов для снижения риска потери критической информации в результате краха железа. После скрупулезного анализа поисковых выдач и отбрасывания заведомо неподходящих мне методов, остановился на паре вариантов, навязываемых чаще всего в комментариях к самописным shell-велосипедам энтузиастов.

Читать дальше →

+30

Cher Oct 31 2013 at 13:26

Как это сделано: парсинг статей

4 min

82K

VK corporate blogSearch engines*

Для меня всегда было некоей магией то, как Getpocket, Readability и Вконтакте парсят ссылки на страницы и предлагают готовые статьи к просмотру без рекламы, сайдбаров и меню. При этом они практически никогда не ошибаются. А недавно подобная задача назрела и в нашем проекте, и я решил копнуть поглубже. Сразу скажу, что это «белый» парсинг, вебмастеры сами добровольно пользуются нашим сервисом.

Читать дальше →

+101

uaoleg Oct 29 2013 at 21:48

Ускоряем Nginx за 5 минут

5 min

298K

High performance*

Попытайтесь повторить это сами

Как правило, настроенный должным образом сервер Nginx на Linux, может обрабатывать 500,000 — 600,000 запросов в секунду. Но этот показатель можно весьма ощутимо увеличить. Хотел бы обратить внимание на тот факт, что настройки описанные ниже, применялись в тестовой среде и, возможно, для ваших боевых серверов они не подойдут.

Минутка банальности.

yum -y install nginx

На всякий пожарный, создадим бэкап исходного конфига.

cp /etc/nginx/nginx.conf /etc/nginx/nginx.conf.orig
vim /etc/nginx/nginx.conf

А теперь можно и похимичить!

Бдыжь-бдыжь

+73

128

Shmuma Oct 5 2013 at 18:11

Numenta NuPIC: первые шаги

5 min

16K

Python*

Tutorial

Введение

Numenta NuPIC — открытая реализация алгоритмов, моделирующих процессы запоминания информации человеком, происходящие в неокортексе. Исходные коды NuPIC на github

В двух словах, назначение NuPIC можно описать как «фиговина, выявляющая, запоминающая и прогнозирующая пространственные и временные закономерности в данных». Именно этим большую часть времени занимается человеческий мозг — запоминает, обобщает и прогнозирует. Очень хорошее описание этих процессов можно найти в книге Джеффа Хокинса «On Intelligence» (есть русский перевод книги под названием «Об интеллекте»).

На сайте Numenta есть подробный документ, детально описывающий алгоритмы и принципы работы, а также несколько видео.

Читать дальше →

+31

ali_aliev Oct 4 2013 at 12:21

Некоторые возможности Python о которых вы возможно не знали

8 min

117K

Python*

From sandbox

Предисловие

Я очень полюбил Python после того, как прочитал книгу Марка Лутца «Изучаем Python». Язык очень красив, на нем приятно писать и выражать собственные идеи. Большое количество интерпретаторов и компиляторов, расширений, модулей и фреймворков говорит о том, что сообщество очень активно и язык развивается. В процессе изучения языка у меня появилось много вопросов, которые я тщательно гуглил и старался понять каждую непонятую мной конструкцию. Об этом мы и поговорим с вами в этой статье, статья ориентирована на начинающего Python разработчика.

Подробности

+58

XvonabuR Oct 3 2013 at 12:36

Адаптивный дизайн: теперь дело уже не в размере экрана

13 min

109K

UIDG corporate blogWeb design*

Translation

В марте 2012 года Гай Подъярны (Guy Podjarny) провел тест, в ходе которого сравнивалась продуктивность работы сотен новых адаптивных сайтов на устройствах с четырьмя различными разрешениями экранов. Получившиеся результаты были весьма разочаровывающими.

После двух лет подъема адаптивного дизайна, когда любой дизайнер и разработчик, которых только можно представить, запрыгнули в этот поезд, тест производительности на различных разрешениях потряс сами основы адаптивной теории.

Читать дальше →

+65

DexterKZ Oct 1 2013 at 09:04

Синхронизация рабочего пространства веб-разработчика

4 min

32K

Website development*

Tutorial

From sandbox

Доброго времени суток, Хабр!

Недавно я озадачился синхронизацией рабочего пространства среди всех используемых мной компьютеров. Я понял, что таскать все файлы и базы данных сайта с одного компьютера на другой, не вариант. Решив автоматизировать этот процесс, я обратил внимание на Dropbox \ Google Drive \ Yandex.Disk \ любой другой облачный диск ( выбрать свой вариант ).

Читать дальше →

khizmax Oct 1 2013 at 06:11

Lock-free структуры данных. 1 — Начало

12 min

153K

C++*Programming*

Я надеюсь, что эта статья станет началом цикла заметок о lock-free структурах данных. Я хочу поделиться с хабрасообществом своим опытом, наблюдениям и размышлениями о том, что такое lock-free структуры данных, как их реализовывать, подходят ли концепции контейнеров стандартной библиотеки STL к lock-free контейнерам, и когда стоит (и стоит ли вообще) применять lock-free структуры данных.

Читать дальше →

+157

blackmaster Sep 30 2013 at 19:23

PostgreSQL 9.3 Что нового?

9 min

44K

Website development*PostgreSQL*

Здравствуйте, хабрачеловеки! Не так уж давно вышел релиз PostgreSQL 9.3 и я хотел бы ознакомить Вас с наиболее важными новшествами, касающимися клиентской части, которые, возможно, пригодятся Вам. В этой статье рассмотрено следующее:

материализированные представления
обновляемые представления
триггеры к событиям
рекурсивные представления
латеральное присоединение
изменяемые внешние таблицы
функции и операторы для работы с типом JSON

Подробней

+116

ROOKEEru Sep 25 2013 at 11:24

Как измерить релевантность контента

10 min

11K

Rookee.ru corporate blogSearch engines*

Оценка контента одна из главных составляющих формулы релевантности. Знание текстовых признаков и вклад каждого из них в оценку сайта позволит приблизиться к более профессиональной работе с ресурсом. В данной статье будет рассмотрена модель, позволяющая восстановить формулу ранжирования по каждому конкретному запросу, указана значимость определение тематики сайта при продвижении по определенному запросу, а также проработан вопрос, связанного с определением неестественного текста.

Восстановление формулы ранжирования

Если переводить данную задачу в область математики, то входные данные можно представить набором векторов, где каждый вектор – множество характеристик каждого сайта, а координаты в векторе – параметр, по которым оценивается сайт. В описанном векторном пространстве обязательно должна быть задана функция, определяющая отношение порядка двух объектов между собой. Эта функция позволяет ранжировать объекты между собой по принципу «больше — меньше», однако при этом сказать, насколько именно одно больше или меньше другого – нельзя. Такого вида задачи относятся к задачам оценки порядковой регрессии.
Наши сотрудники разработали алгоритм на основе модели линейной регрессии с регулируемой селективностью, который позволил с определенной долей погрешности восстановить ранги сайтов и спрогнозировать изменение выдачи при соответствующих корректировках параметров сайта. Первым шагом алгоритма является обучение модели. В данном случае обучающая выборка представляет собой результаты ранжирования сайтов в рамках одного поискового запроса. Упорядоченность сайтов в рамках поискового запроса фактически означает, что в признаковом пространстве существует некоторое направление, на которое объекты обучающей выборки должны проектироваться в нужном порядке. Это направление и является искомым в задаче восстановления формулы ранжирования. Однако судя по рис.1, таких направлений может быть много.

Рис. 1. Выбор направляющего вектора

Для решения данного вопроса был рассмотрен подход, лежащий в основе метода опорных точек, а именно – выбор такого направления, которое будет обеспечивать максимальное удаление объектов друг от друга.
Следующая задача, которая была решена — выбор стратегии обучения. Рассматривалось два варианта – сокращенная стратегия обучения, при которой учитывается порядок двух соответствующих элементов, и полная стратегия, которая учитывает весь порядок объектов. В результате экспериментов была выбрана сокращенная стратегия, которая заключается в решении следующего уравнения:(1)

, где

— решение стандартной задачи квадратичного программирования при линейных ограничениях:

, где

— симметричная матрица

— вектор коэффициента

— разница векторов характеристик

Данный подход на различных выборках (100 признаков и 500 признаков на 20 различных множествах поисковых запросов) показал хорошие результаты (см. табл. 1).

+12

Unlimion Sep 25 2013 at 12:03

Примитивный игровой дизайн. Пошаговая разработка карточной игры

9 min

48K

Game development*

From sandbox

Мотивированный прочтением тематической литературы и нескольких статей на хабре о гейм-дизайне в целом и о том, как наконец-то встать с четверенек и попробовать сделать первые шаги, я решил, что все, что от меня требуется — это сесть и начать работать.
Пусть это будет не ААА проект, подкрепленный миллионными вложениями, а нечто более тривиальное и простое.
Карточная игра. Затягивающая, интересная, не слишком сложная. А там уже посмотрим.

Под катом — вводная, начало процесса и много размышлений на тему.

Заглянуть

+30

jeston Sep 25 2013 at 08:17

Ещё 10 ТБ хранилища от китайцев — теперь раздаёт Alibaba (upd)

1 min

25K

Cloud computing*

Сегодня китайская группа компаний Alibaba Group объявила о том, что приобрела за неназванную сумму сервис Kanbox (клон Dropbox) и отныне предоставляет владельцам аккаунтов по 10 Тб облачного хранилища бесплатно.

Kanbox — солидный сервис, как утверждают создатели, которым в Китае пользуются около 15 млн человек. Имеются как десктопные клиенты, так и мобильные (Windows, Mac, iPhone, Android), позволяющие пользователям загружать файлы на сервис и синхронизировать устройства между собой.

Для получения 10 Тб требуется иметь учётную запись на Kanbox и установить мобильное приложение Laiwang (есть и для Android и для iOS) — китайский мессенджер для мобильной социальной сети. Учётную запись в Laiwang надо будет связать с Kanbox, после чего и будет выделено место.

UPD: да, механизм работает (правда, прецедент из Китая), инструкция ожидается в скором времени.

Подтверждение

Источник

SirReal Sep 24 2013 at 23:38

Вышли сразу два новых PyCharm версии 3.0

4 min

44K

JetBrains corporate blogPython*Django*

Рады сообщить всем хабровчанам, что PyCharm 3.0 — наша IDE для разработки на языке Python — выпущена в двух редакциях: бесплатной Community Edition с открытым исходным кодом и полнофункциональной Professional Edition.

В двух словах: бесплатная редакция PyCharm основана на открытом коде, зато платная содержит полную функциональность.

Релиз, конечно, этим не ограничивается: в него вошло много новых полезных фич, которые работают в обоих редакциях. Но обо всем по порядку.

Читать дальше →

+116

kesn Sep 24 2013 at 09:45

Django работает не так, как вы думаете

4 min

36K

Django*

From sandbox

Когда я читаю список плюшек, которые мне предоставляет какой-либо фреймворк, я представляю, что примерно под ними подразумевается. Когда я читаю документацию по плюшкам — я убеждаюсь, что всё в целом действительно так, как я и думал. Когда я пишу код, я постигаю дао. Потому что всё на самом деле совсем не так.

Многие ошибки, которые я допускал, были из-за того, что я был уверен, что это работает так, как я думаю. Я верил в это и не допускал возможности, что может быть иначе. Конечно, капитан Очевидность скажет, что не нужно верить — нужно читать документацию. И мы читаем, читаем, запоминаем, запоминаем. Возможно ли удержать все мелочи в памяти? И правильно ли перекладывать их на разработчика, а не на фреймворк?

Ну а чтобы не быть голословным — перейдём к примерам. Нас ждут:

Неудаляемые модели, которые мы удалим
Валидируемые поля, которые не валидируются
Два админа, которые портят данные

Примеры

+43

PyroRed Sep 23 2013 at 13:17

Чистим HTML-код при вставке текста из MS Word в HTML5 WYSIWYG редактор (contenteditable)

5 min

24K

JavaScript*jQuery*

Здравствуйте!

При написании своего WYSIWYG редактора возникла проблема копирования текста из Ворда. Собственно проблем три:

Ворд вставляет много мусорного html кода, который необходимо чистить
Для представления списков Ворд почему-то использует параграфы вместо тегов UL и LI
Собственно как определить, что вставленный текст является вставленным из Ворда.

В общем, для решения этих проблем, был написан jquery-плагин, полный исходный код которого доступен в конце статьи. Пример использования:

$(‘#editor’). msword_html_filter();

Плагин вешается на событие keyup и проверяет, является ли исходный код внутри редактора вставленным из Ворда, если да, то запускается функция очистки. В результирующем html прибивается все что только можно – неразрывные пробелы, атрибуты style и align, теги span, все Mso-классы, пустые параграфы.

Детали реализации под катом.

UPD Демо на CodePen

Читать дальше →

+49

FZambia Sep 23 2013 at 07:32

Centrifuge набирает обороты

7 min

21K

VK corporate blogOpen source*Python*

Привет!

Пару месяцев назад я опубликовал на Хабре статью, посвященную описанию open-source проекта Centrifuge. Напомню, что это сервер рассылки сообщений подключенным клиентам (в основном из веб-браузера) в реальном времени. Написан на Python.

С тех пор я продолжал работать над проектом в свободное время и сейчас готов поделиться накопившимися мыслями и изменениями.

Читать дальше →

+60

dimitrius86 Sep 20 2013 at 01:58

Защищаем систему. Или как настроить и использовать port knocking

2 min

35K

System administration*

From sandbox

Салам-папалам всем!

Тут озадачился как же можно сделать свой сервер более безопаснее. Использование напрямую iptables с блокировкой по IP не решало проблемы, т.к. я могу к серверу подсоединяться не только с рабочего ПК, но и издому, или с другого города, или в автобусе (когда в пробках стою).
Решил использовать port knocking.
Кто ни разу не пользовался этим, милости прошу под кат.

Читать дальше →

+16

1 2 ...

33 34

36 37 ...

56 57