Pull to refresh
1
0
Игорь Петров @zooom

User

Send message

Рекомендательные системы: перепросмотр

Reading time6 min
Views2.5K
Примечание: ниже перевод статьи «Rethinking Recommendation Engines» от Alex Iskold (знаменитого своими исследованиями в области экономики внимания и теоретических основ механизма социальных сетей), в которой автор рассматривает текущие рекомендательные системы и пытается предсказать, что ждет их в будущем (фактически, предлагает радикальный способ по их улучшению).

NeflixБолее двух лет назад Netflix анонсировал соревнование по движку рекомендаций: любой, кто изобретает алгоритм, позволяющий улучшить качество их рекомендательной системы не менее, чем на 10%, выигрывал один миллион долларов. Многие исследовательские группы с энтузиазмом взялись за дело, воодушевленные количеством доступной для анализа информации. В самом начале был достигнут некоторый прогресс, но затем он затормозился, и сейчас исследователи остановились в районе улучшения примерно на 8,5%.

В этом посте мы разберем, почему улучшения рекомендательного движка является не алгоритмической проблемой, а, скорее, вопросом представления. Переосмысление рекомендаций как фильтров и их применение без ориентации на высокий конечный результат, по-видимому, скорее приведет к успеху, чем более быстрое «перемалывание» (crunching) данных.
Читать дальше →
Total votes 30: ↑27 and ↓3+24
Comments25

Доступ к рабочему столу получить очень легко

Reading time1 min
Views7.1K
Иногда возникает такая ситуация: ты объясняешь кому-то, как что-нибудь делать на компьютере. Например, человек не умеет настраивать какую-нибудь программу и звонит тебе, чтобы ты помог. Или вдруг у друга, который мало понимает в компьютерах, вылезло какое-то окошко, и он просит тебя помочь. Если у вас были подобные ситуации, то вы представляете, насколько сложно объяснять по телефону (или даже по аське Gtalk) последовательность действий. И вы не помните, что и как должно быть, и начинаете поэтому воспроизводить действия у себя на компьютере, да и собеседник иногда толком ничего не может объяснить.

Конечно же, решение данной проблемы уже давным-давно нашли. Это просто удалённое управление компьютером. Данные программы даже встроены в новейшие операционные системы. Хотя можно поставить и решения на основе VNC: например, популярную бесплатную программу UltraVNC.

Подключится к компьютеру с помощью данных решений легко, особенно, если они находятся в одной локальной сети. Но… будем считать этот случай идеальным. А вот в реальности (что происходит, например, постоянно у меня) люди обычно сидят за NAT, файрволом и т.п. Поэтому хоть и можно получить IP-адрес, но ведь нужно ещё и порты настроить. Думаю, что только объяснение всего этого займёт в разы больше времени, чем решение самой проблемы. Не надо забывать, что не все знают, что такое IP и порты.

И даже для этих случаев придумали отличное решение: TeamViewer. О нём-то я немного и расскажу.

Читать далее →
Total votes 56: ↑53 and ↓3+50
Comments88

Зарядка для глаз

Reading time1 min
Views24K
Хотел я написать взывающий к разуму ИТ-шника пост о вреде долгосидения перед компьютером и важности зарядки для глаз, но не буду. Просто вот так:

Не будешь делать зарядку — потеряешь зрение через несколько лет!


Ниже написано то, что надо делать. Зарядка отнимает 5-7 минут ежедневной жизни, но зато существенно понижает вероятность нужды в очках.
Читать дальше →
Total votes 91: ↑80 and ↓11+69
Comments120

Хороши ли Яндекс.Фотки?

Reading time1 min
Views5.7K
Меня зовут Иван Матвеев и я руководитель сервиса Яндекс.Фотки. Уверен, что многие из вас о нём знают или даже используют (если кто не знает — это то, что кратко можно описать как «бесплатный безлимитный фотохостинг с функциями общения»).

Нашему сервису недавно исполнился год, за который у нас накопилось 42 терабайта фоток. Всё это время наши разработчики работали над Фотками не покладая рук, в частности, за последнее время мы запустили ненакручиваемую голосовалку (по мотивам постинга Димы Смирнова) и слайд-шоу.

Мне бы хотелось спросить у всех, кто пользуется или пробовал пользоваться Яндекс.Фотками: что вам нравится/не нравится на сервисе, что удобно/не удобно, чего не хватает, с какими багами или проблемами вы сталкивались?

А мы, в свою очередь, постараемся баги исправить, а недостающие возможности аккуратно записать в молескин список будущих дел :)
Total votes 112: ↑100 and ↓12+88
Comments406

Mail.ru на первом месте, «Одноклассники» обогнали «Рамблер»

Reading time1 min
Views1.2K
На конференции «Интернет и бизнес 2008» компания TNS Gallup Media опубликовала статистику по всероссийской аудитории интернет-сайтов (презентация Руслана Тагиева в формате PPT). На сегодняшний день это самые объективные и свежие данные по охвату аудитории шестью крупнейшими интернет-ресурсами России.


В таблице указан охват аудитории за март 2008 года в млн человек.


Россия

Москва

дневной недельный месячный дневной недельный месячный
Mail.ru 5,85 10,43 13,5 2,064 3,386 4,166
Яндекс 5,56 10,52 13,55 2,117 3,621 4,355
Одноклассники.ру 3,74 7,16 9,52 1,68 2,93 3,6
Rambler 2,77 5,85 8,73 1,05 2,08 3,08
Livejournal 0,7 2,39 5,02 0,45 1,27 2,5
Liveinternet 0,53 1,73 4 0,29 0,81 1,76



Читать дальше →
Total votes 39: ↑32 and ↓7+25
Comments106

Памятка для SEO оптимизаторов

Reading time1 min
Views1.9K
Вот решил поделиться некоторым материалом, который сам составил в ходе экспресс-изучения SEO оптимизации и раскрутки сайтов. Просто попался видео-курс Юсуфа Губайдуллина, который продает его на promoguide.ru и решил воспользоваться случаем. Честно говоря, курс не понравился — нудно как-то рассказывается. Оценил содержание на 4 с минусом, а изложение — на 2 с плюсом. Само SEO весьма скучная вещь, но нужная, поэтому составил небольшую памятку для себя — чтобы не держать это в голове и легко вспомнить когда понадобится. Здесь два файла: первый — просто картинка, второй — в формате freemind, для тех, кто желает что-то для себя добавить.

SEO-карта
Читать дальше →
Total votes 97: ↑88 and ↓9+79
Comments81

Endeavour отправляется на орбиту!

Reading time1 min
Views580
Эндевеар отправляется на орбиту

Как мы знаем, недавно, Американский шатл Эндевер отправился на орбиту. Технокрасота — доступная немногим, теперь доступна и нам с веком высоких технологий. Не ругайте, что не по теме, но это
должен видеть каждый хабрачеловек.

Видео

Источник
Total votes 52: ↑48 and ↓4+44
Comments58

Частоты, способные взорвать атомную бомбу, зомбировать людей и помочь нам познать тайну души

Reading time6 min
Views3.9K
В радиолюбительстве есть особое направление – мониторинг ведомственных радиостанций: правительственного радио, раций спецслужб, военных передатчиков. Особым шиком считается перехват сеансов связи между базой и атомными субмаринами в диапазоне сверхдлинных волн – СДВ. В англоязычной литературе СДВ получили прекрасное название ELF (Extreme Low Frequency – «предельно низкая частота»). Так что ELF’ы – под этой аббревиатурой мы будем подразумевать СДВ-передатчики – встречаются не только в сказках.
Читать дальше →
Total votes 32: ↑22 and ↓10+12
Comments6

Некоторые секреты мозга

Reading time3 min
Views4.6K
Статья основана на переводе статьи Nine Brain Quirks You Didn’t Realize You Had, которая в свою очередь основана на научных исследованиях. Взято от©юда

Я думаю, что вы уже имеете некоторые представления о принципе работы нашего мозга. Психология зачастую подтверждает наши догадки о том, как работает мозг, но вместе с тем преподносит много сюрпризов. Под хабракатом список секретов мозга, о которых вы, возможно, и не догадывались:

Читать дальше →
Total votes 69: ↑64 and ↓5+59
Comments51

Методы оценки качества прогноза

Reading time3 min
Views35K
Часто при составлении любого прогноза — забывают про способы оценки его результатов. Потому как часто бывает, прогноз есть, а сравнение его с фактом отсутствует. Еще больше ошибок случается, когда существуют две (или больше) модели и не всегда очевидно — какая из них лучше, точнее. Как правило одной цифрой (R2) сложно обойтись. Как если бы вам сказали — этот парень ходит в синей футболке. И вам сразу все стало про него ясно )

В статьях о методах прогнозирования при оценке полученной модели я постоянно использовал такие аббревиатуры или обозначения.
  • R2
  • MSE
  • MAPE
  • MAD
  • Bias

Попробую объяснить, что я имел в виду.
Читать дальше →
Total votes 7: ↑6 and ↓1+5
Comments16

10 юзабилити-преступлений, которых вы не должны совершать

Reading time2 min
Views4.5K
На стадии дизайна и разработки мы должны учитывать прописные истины и основные концепции для улучшения юзабилити сайта. В этой статье описываются классические, но непростительные ошибки в области веб-дизайна и способы их решения.

Преступление #1: В формах метки не связаны с полями ввода


crime1
Использование атрибута «for» позволит пользователям кликать по метке, для выбора соответствующего поля формы. Это особенно важно для чекбоксов и радиокнопок — увеличить область клика.
Читать дальше →
Total votes 325: ↑289 and ↓36+253
Comments160

Компактный 2-терабайтный склад

Reading time1 min
Views1.3K
Компания Iomega анонсировала выход на рынок своего нового продукта Iomega StorCenter ix2 — сетевого хранилища данных, предназначенного для использования как в офисе, так и дома.


Хранилище StorCenter ix2 — это два SATA-II жестких диска плюс мини-ПК на базе ПО EMC LifeLine (спец-пакет ПО из ОС Linux и сервисных приложений), с 400-мегагерцевым процессором и 128 МБ оперативной памяти. В комплекте — порт Gigabit Ethernet, два USB и EnergyStar-«одобренный» адаптер питания.


Iomega предлагает две модели StorCenter ix2. Объемом 1 ТБ и 2 ТБ. Стоит эта радость $300 (за терабайтную модель) и $480 за 2-терабайтное хранилище.

via Gizmodo
Total votes 51: ↑45 and ↓6+39
Comments70

Гуглякартим по умному

Reading time9 min
Views10K
В последнее время модно стало использовать гуглякарту.
Гугля карту суда, гугля карту туда.
И главное не забыть отобразить свои объектики на карте.
Но, почему-то, подавлявшее число сервисов используют неправильную реализацию процесса передачи маркеров с сервера на клиент.
Точнее они не правильно формируют запросы.
А если выразиться еще более точнее — они это делают
не-по-умному
Total votes 79: ↑63 and ↓16+47
Comments29

Важность факторов, влияющих на ранжирование сайта в Яндексе

Reading time1 min
Views2.3K
Мною был организован опрос среди опытных SEOшников на тему сабжа. Надеюсь — оцените.

Факторы с важностью по 10-и бальной шкале в картинках (чем больше — тем важнее):



Остальные графики спрятал под кат.

Читать дальше →
Total votes 157: ↑137 and ↓20+117
Comments99

Склеивание фотографий в Photosynth теперь открыто для всех

Reading time2 min
Views6.7K
Microsoft открыла для всех пользователей доступ к своему уникальному инструменту создания трёхмерных панорам Photosynth. Теперь каждый желающий может нащёлкать сотню фотографий например, собственной комнаты, загрузить их в Photosynth — и любоваться готовой трёхмерной моделью. Интересно, что для ресурсоёмкого вычислительного процесса Microsoft не использует собственные сервера. Они сделали небольшой модуль, который загружается на ПК пользователя и уже здесь анализирует фотографии (ищет одинаковые объекты), и только потом передаёт их на сервер для окончательного склеивания.

Вот эту 3D-модель (на иллюстрации внизу) журналист слепил из 300+ фотографий своей квартиры. Весь процесс полностью автоматизирован. Если что-то непонятно, то есть обучающее видео.



Такой способ визуализации идеально подходит также для туристических снимков. Каждый из них не полностью передаёт красоту местности, но если склеить из них панораму, то картина становится гораздо более впечатляющей. Кроме того, теперь можно избавиться от огромных фотоальбомов с тысячами фотографий.
Читать дальше →
Total votes 100: ↑95 and ↓5+90
Comments84

Альтернатива облаку тегов

Reading time2 min
Views1.4K
Как пример дерево тегов или пирамида? В случае если несколько тегов связано иерархически, то такое представление будет полезней нежели облако тегов по которому можно судить только о популярности чего-либо, но никак не о иерархической позиции. В тоже время дерево тегов можно сформировать из многомерного массива циклами или используя рекурсию. По-поводу графического представления все в наших руках. Современные средства позволяют сделать визуальную часть дерева почти любой. Подобная система будет полезна в случае когда облако тегов служит именно элементом навигации, а не «прикольной фичей».
Читать дальше →
Total votes 16: ↑10 and ↓6+4
Comments19

Города России в именительном и предложном падеже

Reading time1 min
Views3K
Необходимо было писать названия городов России в предолжном падеже типа в Москве, в Ростове-на-Дону и т.д. После полуавтоматической обработки списка городов товарищем sofrus появилась таблица, которая содержит два поля с названием города в именительном и предложном падежах. И мы совершенно бескорыстно предлагаем эту таблицу (около 2400 городов) в двух вариантах:
  1. CSV
  2. MySQL


P.S. Почему хабр так уродует ordered list, для меня загадка.

ОЧЕНЬ ВАЖНЫЙ P.S.
Я не хочу присваивать себе чужие заслуги, поэтому я специально проверил, так как не исключал этого. Карма начала расти у меня, а не у sofrus, если вы считаете нужным поднять за пост карму, то поднимайте ему. Просто у него с компанией NDA подписан и в должностной инструкции нет пометки о том, что он может оценить важность информации. Поэтому я и запостил. Но в появлении этих таблиц нет моей заслуги.
Total votes 1: ↑1 and ↓0+1
Comments49

Определение пола по истории навигации

Reading time1 min
Views2.7K
Используя тот факт, что браузеры обычно по-разному отображают и обрабатывают посещённые и не посещённые ссылки, умные люди давно придумали, как можно автоматически отследить историю веб-навигации посетителя.

Сперва мы выводим на страницу ссылки на популярные ресурсы (в скрытом фрейме, например). Далее, два варианта:

1) Написать скрипт, который пробегает по ссылкам и определяет их цвет через getComputedStyle, как описывает Jeremiah Grossman. На этот счёт даже есть готовый скрипт.

У этого способа есть небольшой недостаток: требуется включённый JavaScript.

2) Тот же J. Grossman предложил усовершенствованный вариант с использованием CSS. Определяем свой стиль, в котором у посещённых ссылок будет фоном стоять картинка: у каждой — своя. В этом случае браузер выполнит всю работу за нас. Потом достаточно посмотреть в логах, какие картинки были загружены.

Почему это может быть полезно (вредно): если человек посещал некоторый URL, то, с большой вероятностью, у него есть аккаунт на соответствующем ресурсе. Это может пригодиться, например, если вы используете в целевом ресурсе какую-то дырку.

Теперь, почему я про это вспомнил, и почему такой заголовок поста. Один остроумный товарищ при помощи первой технологии решил определять пол посетителя. Его теория в том, что определённые сайты посещаются по половому признаку, так что можно вычислить вероятность того, что вы такого-то пола. Я вот, например, на 68% мужчина.
Total votes 19: ↑19 and ↓0+19
Comments40

Information

Rating
Does not participate
Location
Москва и Московская обл., Россия
Date of birth
Registered
Activity