Search
Write a publication
Pull to refresh
0
0
Андрей @andreypaa

User

Send message

Машинное обучение — 1. Корреляция и регрессия. Пример: конверсия посетителей сайта

Reading time3 min
Views38K
Как и обещал, начинаю цикл статей по «машинному обучению». Эта будет посвящена таким понятиям из статистики, как корреляция случайных величин и линейная регрессия. Рассмотрим, как реальные данные, так и модельные (симуляцию Монте-Карло).

Часть 1. Реальные данные


Чтобы было интереснее, рассказ построен на примерах, причем в качестве данных (и в этой, и в следующих, статьях) я буду стараться брать статистику прямо отсюда, с Хабра. А именно, неделю назад я написал свою первую статью на Хабре (про Mathcad Express, в котором и будем все считать). И вот теперь статистику по ее просмотрам за 10 дней и предлагаю в качестве исходных данных. На графике это ряд Views, синяя линия. Второй ряд данных (Regs, с коэффициентом 100) показывает число читателей, выполнивших после прочтения определенное действие (регистрацию и скачивание дистрибутива Mathcad Prime).


Читать дальше →

Собираем перчатку для определения положения руки сами

Reading time7 min
Views35K
В этой статье я расскажу о том, как мы собирали перчатку для определения положения руки на конкурс. Сложности в ее изготовлении конечно есть, но собрать ее под силу даже школьнику. Такую перчатку можно использовать как для управления электроникой, так и в качестве манипулятора для различных игр.


Читать дальше →

Практическое программирование искуственного интеллекта

Reading time2 min
Views28K
Подъем, овощи!

Все, кто еще не, срочно идем и регистрируемся на курс CS188.1x — «Artificial Intelligence». Курс стартовал 6.2.2015 и уже доступны материалы второй недели (первая проходится за три часа — она вводная). Оправдание принимается только одно — «не понимаю по-английски». В этом случае идешь и начинаешь учить английский!
Читать дальше →

Как Elasticsearch может помочь в поиске подозрительной активности на сайте

Reading time6 min
Views12K
Предлагаю читателям «Хабрахабра» перевод статьи «Spotting bad actors: what your logs can tell you about protecting your business» из официального блога Elasticsearch. Статья рассказывает о том, как можно использовать возможности Elasticsearch для анализа логов веб-сервера с целью обнаружения подозрительной активности на сайте.

Давайте подумаем, что и когда мы делаем в случае попыток взломать наш сайт? Во-первых, чаще всего мы пытаемся устранить угрозу уже тогда, когда злоумышленники нашли уязвимость на сайте и воспользовались ей. Во-вторых, зачастую единственный оперативный инструмент борьбы со злоумышленниками – это блокировка IP-адресов, но это мало эффективный инструмент, если мы не владеем развернутой информацией обо всех адресах, с которых ведется атака на сайт.

Но на сколько бы изменилась ситуация, если бы мы могли заблаговременно получать развернутую информацию обо всех IP-адресах и подсетях, которые проявляют подозрительную активность и блокировать именно их? Звучит здорово, не правда ли?

Мы можем легко сделать это вместе с Elasticsearch.
Читать дальше →

WSGI/Rack для PHP

Reading time2 min
Views13K
Исторически сложилось, что скрипты на PHP запускаются при каждом HTTP-запросе. Запускаясь, скрипт проводит какую-то инициализацию (например, устанавливает соединение с СУБД), после чего анализирует запрос и формирует ответ. Однако, всем прекрасно известно, что в мире Python и Ruby принят другой подход: веб-приложения на этих языках загружаются в память единовременно вместе с веб-сервером (или сервером приложений). Взаимодействие сервера приложений со скриптом осуществляется при помощи стандартных интерфейсов WSGI и Rack. Такой подход, безусловно, не лишён недостатков, главный из которых, пожалуй, связан с резким ростом накладных расходов при размещении большого числа сайтов на одном сервере, однако, обладает и важным преимуществом: инициализация производится лишь однократно, затем скрипт лишь отвечает на входящие HTTP-запросы.
Читать дальше →

Избавляемся от JavaScript в социальных кнопках (Facebook, VK, Twitter и др.)

Reading time5 min
Views79K
Как мы избавились от JavaScript-библиотек социальных сетей, ускорили скорость загрузки страниц и использовали RESTful API для “шаринга” и “лайков”.


Читать дальше →

Исследование механизма блокировки сайтов «Ростелекомом» и способы ее обхода

Reading time6 min
Views109K
В этом посте я приведу небольшое исследование механизма блокировки сайтов Ростелекомом, а также покажу способы ее обхода без применения различных туннелей до сторонних хостов (прокси, vpn и пр.). Вероятно это применимо и к некоторым другим провайдерам.
Читать дальше →

Как я построил стартап, путешествуя по 20 странам

Reading time5 min
Views16K
  • Год назад, я покинул Сан-Франциско, продал и отдал все, что имел, и «переехал в большой рюкзак».
  • Я проехал 45 городов в 20 странах, три Диснейлэнда и один остров с кроликами.
  • Я также успевал работать по 50 часов в неделю, развивая и запуская стартап
  • Стоило это мне дешевле, чем цена аренды квартиры в Сан-Франциско.


Путешествие — это не отпуск

Читать дальше →

Делить на ноль — это норма. Часть 2

Reading time18 min
Views77K
Часть 1. Вобще-то уже все поделили до нас!
Часть 2. Истина где-то рядом

В прошлой части мы расширяли алгебру и смогли делить на ноль арифметически. В качестве бонуса, способ оказался не единственным. Однако, все эти алгебры не дали ответа на вопрос: “Что там внутри или почему нам это не показывают?”

Пока древние вязали узелки, такой вопрос возникнуть не мог. Сейчас, куда не глянь, “бла-бла, для а≠0”. Значит ответ затаился где-то между узелками и настоящим. В математике все строго и последовательно, а значит и ответ не мог потеряться.

Читать дальше →

Реверс-инжиниринг протокола парктроника. Танец маленьких бит

Reading time12 min
Views62K
Привет, хабр!

В попытках свести все жизненные рабочие показатели своего автомобиля на один экран головного устройства дошла очередь и до подключения парктроника. Многие возразят — ведь даже у дешевых парктроников есть свой экранчик, зачем выводить данные куда-то ещё? Да просто лишний экранчик в салоне ставить не хочется, и покопаться в железе повод есть…

В статье постараюсь описать приёмы и инструменты для реверс-инжиниринга недокументированного протокола обмена двух железок между собой.
Читать дальше →

Кластеризация: расскажи мне, что ты покупаешь, и я скажу кто ты

Reading time6 min
Views29K


Задача Datawiz.io: провести кластеризацию клиентов программы лояльности в ритейле.

Кластеризация — это метод поиска закономерностей, предназначенный для разбиения совокупности объектов на однородные группы (кластеры) или поиска существующих структур в данных.

Целью кластеризации является получение новых знаний. Это как “найти клад в собственном подвале”.

Для чего это нужно компаниям? Чтобы лучше узнать своих клиентов. Чтобы найти индивидуальный подход к каждому клиенту, а не работать со всеми одинаково.
Читать дальше →

Делаем игру 2048 на AngularJS

Reading time32 min
Views50K
Наверное, вам, как и многим коллегам, пришлась по вкусу игра «2048», в которой необходимо достичь плитки с числом 2048, собирая вместе плитки с одинаковыми числами.

В этой статье мы вместе построим клон этой игры при помощи фреймворка AngularJS. По ссылке можно посмотреть демонстрацию конечного результата.
Читать дальше →

Был получен доступ к тысячам персональных данных пользователей «Билайн проводной интернет»

Reading time6 min
Views120K
Уж простите за пафосный заголовок, но раз пошла такая пьянка, то продолжим. Мне лично такие посты нравились всегда.

Итак, речь пойдёт про уязвимость известного в Мск (да и не только) провайдере Beeline. Многие помнят его под именем Corbina. Без сомнения, это один из передовых интернет провайдеров, с большой и хорошей историей. В своё время он был спасением, благодаря качественному и быстрому инету, интранет сетям и т.п. В настоящий момент сотрудники провайдера в курсе уязвимостей и самые критичные уже закрыты. Однако, уверен, многие откроют для себя много нового и интересного. Тем более, что техника применима практически к любому провайдеру.

image

Читать дальше →

Как реализовать почти мгновенное переключение сайта между площадками, когда одна упала

Reading time11 min
Views41K
image

Бывает, сайты падают из-за отказа площадки хостера, каналов и так далее. Я 7 лет работаю в хостинге, и часто вижу такие проблемы.

Пару лет назад я понял, что услуга резервной площадки (без доработки их сайта или сервиса) очень важна клиентам. Теоретически тут всё просто:
1. Иметь копию всех данных в другом дата-центре.
2. При сбое переключать работу на резервный ДЦ.

На практике система пережила 2 полные технические реорганизации (сохранение основных идей со сменой значительной части инструментария), 3 переезда на новое оборудование, 1 переезд между поставщиками услуг (переезд из немецкого дата-центра в два российских). На исследование поведения разных систем в реальных условиях под клиентской нагрузкой ушло 2 года.
Читать дальше →

Предупреждён — значит, вооружён. Часть 2

Reading time9 min
Views77K


Чем больше народа, тем меньше кислорода




Воздух является тонкой материей, в которой диоксид углерода занимает по количеству лишь четвертое место, но имеет важнейшее значение для всего живого. По концентрации углекислого газа, которая определяется сравнительно легко, можно косвенно судить о содержании других веществ и использовать ее для анализа качества воздуха.

Концентрацию углекислого газа измеряют в пропромиллях — частей на миллион ppm (ppmv), миллиграммах на кубический метр или процентах.

Чтобы “поплавать” в значениях концентрации углекислого газа, можно почитать любую статью по обеспечению воздухообмена, пример “Сколько воздуха нужно человеку для комфорта?”

При повышенном содержании углекислого газа человек ощущает проблемы с дыханием (духота, удушье, кислородная недостаточность, нехватка воздуха), учащенный пульс, чувство усталости, разбитость, головную боль, головокружение, сонливость, невозможность сосредоточиться, потерю внимания, снижение работоспособности, раздражительность, обморок (хотя его он уже не ощущает) и т. д. — к счастью, не все симптомы сразу, и не каждым человеком.

Поговорка про количество народа/кислорода актуальна при нахождении людей в закрытом помещении — они поглощают кислород, а выделяют углекислый газ и другие вещества. Поэтому необходимо осуществлять контроль над содержанием углекислого газа в каждом помещении, где находятся люди.
Смотрите далее: вентиляция, старые окна, вред собраний, сравнение половинок

Встраиваем бэкдор в Bitcoin (ECDSA) или еще раз о клептографии

Reading time3 min
Views43K
Привет, %username%!
Пользуешься неофициальными bitcoin клиентами? Есть повод присмотреться к ним повнимательней.
После реализации бэкдора для RSA мне стало интересно, как обстоят дела с остальными криптографическими примитивами. Оказывается, целая наука под названием клептография занимается передачей информации в так называемых «подсознательных» каналах. Таких, о которых никому не известно кроме отправителя и получателя. Вроде стеганографии, только внутри криптоалгоритмов.
Читать дальше →

О новости про «замедление» фотона

Reading time4 min
Views18K
Пару дней назад научно-популярные СМИ облетела новость, будто бы учёные обнаружили, что фотоны в вакууме могут распространяться со скоростью ниже скорости света. Для этого достаточно пропустить их через особую маску. Это сообщение вызвало у меня определённый скепсис, который я отразил кавычками в названии этого поста, и желание разобраться, что же там произошло на самом деле.

image
Картинка из пресс-релиза Университета Глазго
Читать дальше →

Тестирование Ni-MH аккумуляторов типоразмера AA(HR6)

Reading time13 min
Views106K
Нас окружает огромное количество всевозможных устройств и гаджетов, призванных облегчить и разнообразить нашу жизнь, начиная от детских электронных игрушек и заканчивая многообразными фотоаппаратами, фотовспышками, фонарями, рациями и т.д. Электропитание многих из них обеспечивается от Ni-MH элементов питания типоразмера АА. В продаже имеется великое разнообразие данных источников питания. Мое внимание привлекли аккумуляторы, как наиболее экономные и экологичные источники питания. В данном обзоре собраны результаты тестирования десяти различных комплектов аккумуляторов.



Читать дальше →

Дайджест интересных материалов из мира Drupal #3

Reading time3 min
Views8K
Всем привет!

Мы отобрали для вас самое интересное и полезное из мира Drupal за первые недели 2015 года.

Druplicon

По-русски



  1. Во-первых, в тестовом режиме запустилась новая площадка сообщества DrupalifeCommunity. Слово автору:
    Сразу скажу о судьбе проекта. Им я не претендую заменить Drupal.ru, это совершенно отдельное и самостоятельное начинание. Скажем так, альтернативное сообщество, как каким-то пытался стать DrupalSN.

    На новой площадке уже замечено несколько друпал-гуру, а это хороший знак :)
  2. Чуть ли не первая серьёзная статья на русском, в которой одновременно встречаются слова Drupal и Postgres: «Тестирование производительности Drupal: MySQL vs PostgreSQL часть 1». Очень ждём следующих частей!
  3. Продолжая тему баз данных, Роман Агабеков подробно пишет про репликацию master-slave MySQL.
  4. Как же без Panels: в этот раз «Добавляем поддержку Token'ов в настройки Panel Pane».
  5. Рубрика «Антиквариат»: код либрусека пятилетней выдержки.

Читать дальше →

Krita: координаты Грина или как сделать из дракона кенгуру

Reading time4 min
Views30K
На днях была выпущена уже вторая бета-версия Криты 2.9. Этой статьей я хотел бы начать рассказ о том новом функционале, который ждет пользователей в предстоящем релизе.

Одной из самых интересных функций этого релиза является преобразование клеткой. Оно позволяет изменять форму объектов без внесения искажений в изображение. О нем и пойдет сегодня речь…



Читать дальше →

Information

Rating
Does not participate
Location
Мордовия, Россия
Date of birth
Registered
Activity