Статьи / Закладки / Профиль OlegUV / Хабр

Олег @OlegUV

Аналитик

Профиль Публикации 2Комментарии 117Закладки 282

ITI_Capital 9 июл 2015 в 12:07

Топ-10 data mining-алгоритмов простым языком

24 мин

128K

Блог компании ITI CapitalData Mining*Алгоритмы*

Перевод

Примечание переводчика: Мы довольно часто пишем об алгоритмической торговле (вот, например, список литературы по этой теме и соответствующие аналитические материалы) и API для создания торговых роботов, сегодня же речь пойдет непосредственно об алгоритмах, которые можно использовать для анализа различных данных (в том числе на финансовом рынке). Материал является адаптированным переводом статьи американского раработчика и аналитика Рэя Ли.

Сегодня я постараюсь объяснить простыми словами принципы работы 10 самых эффективных data mining-алгоритмов, которые описаны в этом докладе.

Когда вы узнаете, что они собой представляют, как работают, что делают и где применяются, я надеюсь, что вы используете эту статью в качестве отправной точки для дальнейшего изучения принципов data mining.

Читать дальше →

+43

Xitsa 21 мая 2015 в 16:19

Рекуррентное соотношение Мюллера: проблемы с округлением чисел с плавающей точкой

4 мин

37K

Программирование*

Перевод

Некоторое время назад я натолкнулся на упражнение, которое выглядит не так уж и сложно:

Пусть последовательность x_n определена так:

посчитайте x₃₀.

Это не так уж и трудно закодировать, возможно реализовав x_i как рекурсивную функцию. С обычными числами с плавающей запятой двойной точности, по мере увеличения i, результат красиво сходится к 100. Супер!

К сожалению, 100 даже близко не является правильным ответом. На самом деле последовательность сходится к 5.

Читать дальше →

+58

116

Kallist 21 мая 2015 в 15:03

Численные характеристики онлайн-игр

12 мин

63K

Блог компании VKData Mining*Разработка игр*Разработка мобильных приложений*Веб-разработка*

8 лет назад маленькая команда разработчиков, почти что бывшие студенты, решили сделать свою первую большую, как им тогда казалось, игру. Они выполняли все функции вперемешку. И гейм-дизайн, и программирование, и арт. Кто что умел. Получившаяся игра называлась «Возмездие». Это была браузерка. Она показала неплохие результаты: доходы с игры выросли от нескольких десятков до сотен тысяч рублей за первые месяцы. Для группы в несколько человек это уже какие-то деньги. В таком режиме игра просуществовала порядка года. А потом аудитория стала уменьшаться, доход начал падать. Разработчики подумали: «Наверное, мало контента». Игра была контентнозависимой, т.е. постоянно жила на обновлениях. Они поднажали, стали производить больше локаций, предметов, уровней, ремесленнических рецептов — всё, что делали раньше. Но пользователи все равно продолжали уходить. И было непонятно, почему это происходит. В итоге проект, просуществовав три года, закрылся — рано или поздно такой конец ждет все онлайн-игры.

^{Арт персонажа браузерной игры Возмездие}

Тогда мы не осознавали, насколько важна аналитика и понимание тех процессов, которые идут внутри игры. Поступая интуитивно, мы делали всё, чтобы игра умерла быстрее, хотя исправить ситуацию и подарить проекту ещё один год было не так сложно. Сейчас мы уже понимаем это. О важности аналитики в онлайн-проектах я и хотел бы здесь рассказать.

Читать дальше →

+20

alexandergoncharenko 6 мая 2015 в 14:52

Дискретное преобразование Фурье фрактального броуновского движения

2 мин

14K

Математика*Алгоритмы*

Фрактальное броуновское движение (ФБД) относится к классу рассматриваемых функций, заданные на конечном интервале и равные нулю вне его, которые включают кусочно непрерывные функции, удовлетворяющие условию роста:

,
где функция

, удовлетворяет условию:

Преобразование Фурье
Для ФБД будем интерпретировать процесс

как временной процесс. Существует частотная область, в которой функция — сумма составляющих, имеющих определенную частоту. Функция

может быть разложена как

.
Составляющая

с частотой

имеет вид:

, где

.

Функция

называется преобразованием Фурье.

Читать дальше →

0tt0max 5 мая 2015 в 20:38

Принцип анализа вариабельности сердечного ритма в MATLAB

6 мин

25K

Matlab*Алгоритмы*Программирование*

Из песочницы

Приветствую, Хабр! В этой публикации хочу представить свой опыт реализации алгоритма анализа ВСР человека в MATLAB. Теме анализа ВСР уделено достаточно внимания на Хабре. (поиск по слову ЭКГ) однако, как мне показалось, некоторые моменты раскрыты слабо или вовсе не рассматриваются. В данной статье не уделяется много внимание объяснению явления ВСР и теории методов ее анализа. Подразумевается, что читатель подготовлен, а основной упор сделан на использование для целей анализа функций и процедур MATLAB.

Читать дальше →

+15

polybook 12 апр 2015 в 23:48

Задача о двух старушках, которые отправились в путь на рассвете

2 мин

72K

Блог компании Нерепетитор.руЗанимательные задачкиМатематика*

Условие задачи из знаменитой книги В.И.Арнольда «Задачи для детей от 5 до 15 лет»:
Из A в B и из B в A на рассвете (одновременно) вышли навстречу друг другу (по одной дороге) две старушки.Они встретились в полдень, но не остановились, а каждая продолжала идти с той же скоростью, и первая пришла (в B) в 4 часа дня, а вторая (в A) в 9 часов вечера. В котором часу был в этот день рассвет?

Предлагаю вам послушать (МР3) обсуждение этой задачи на радио «Говорит Москва» (С.Доренко, А.Оношко), и попробовать решить ее, прежде, чем лезть под кат, чтобы сравнить…

три варианта решения

Dmitry21 12 апр 2015 в 16:43

Лекции Техносферы. 1 семестр. Алгоритмы интеллектуальной обработки больших объемов данных

3 мин

48K

Блог компании VKМашинное обучение*Алгоритмы*Data Mining*Big Data*

Туториал

Продолжаем публиковать материалы наших образовательных проектов. В этот раз предлагаем ознакомиться с лекциями Техносферы по курсу «Алгоритмы интеллектуальной обработки больших объемов данных». Цель курса — изучение студентами как классических, так и современных подходов к решению задач Data Mining, основанных на алгоритмах машинного обучения. Преподаватели курса: Николай Анохин (@anokhinn), Владимир Гулин (@vgulin) и Павел Нестеров (@mephistopheies).

Объемы данных, ежедневно генерируемые сервисами крупной интернет-компании, поистине огромны. Цель динамично развивающейся в последние годы дисциплины Data Mining состоит в разработке подходов, позволяющих эффективно обрабатывать такие данные для извлечения полезной для бизнеса информации. Эта информация может быть использована при создании рекомендательных и поисковых систем, оптимизации рекламных сервисов или при принятии ключевых бизнес-решений.

Читать дальше →

+45

unciia 2 апр 2015 в 17:25

Генетический алгоритм — наглядная реализация

7 мин

100K

Matlab*Математика*Программирование*

Из песочницы

Года четыре назад, в универе услышал о таком методе оптимизации, как генетический алгоритм. О нем везде сообщалось ровно два факта: он клёвый и он не работает. Вернее, работает, но медленно, ненадежно, и нигде его не стоит использовать. Зато он красиво может продемонстрировать механизмы эволюции. В этой статье я покажу красивый способ вживую посмотреть на процессы эволюции на примере работы этого простого метода. Нужно лишь немного математики, программирования и все это приправить воображением.

Кратко об алгоритме

Итак, что же такое генетический алгоритм? Это, прежде всего, метод многомерной оптимизации, т.е. метод поиска минимума многомерной функции. Потенциально этот метод можно использовать для глобальной оптимизации, но с этим возникают сложности, опишу их позднее.

Сама суть метода заключается в том, что мы модулируем эволюционный процесс: у нас есть какая-то популяция (набор векторов), которая размножается, на которую воздействуют мутации и производится естественный отбор на основании минимизации целевой функции. Рассмотрим подробнее эти процессы.

Читать дальше →

+28

kxx 2 сен 2014 в 03:05

Несколько слов о «линейной» регрессии

5 мин

54K

Big Data*Data Mining*R*Математика*Машинное обучение*

Иногда так бывает: задачу можно решить чуть ли не арифметически, а на ум прежде всего приходят всякие интегралы Лебега и функции Бесселя. Вот начинаешь обучать нейронную сеть, потом добавляешь еще парочку скрытых слоев, экспериментируешь с количеством нейронов, функциями активации, потом вспоминаешь о SVM и Random Forest и начинаешь все сначала. И все же, несмотря на прямо таки изобилие занимательных статистических методов обучения, линейная регрессия остается одним из популярных инструментов. И для этого есть свои предпосылки, не последнее месте среди которых занимает интуитивность в интерпретации модели.

Читать дальше →

+36

eagleson 1 мар 2015 в 21:52

Немного о важном: 7 способов «пропитки» целью или как ставить цели, чтобы их достигать

8 мин

34K

Блог компании Стратоплан

В преддверии онлайн конференции PRO+НАВЫКИ мы попросили докладчиков конференции написать полезных статей по темам докладов. На прошлой неделе вышли:

А сегодня пришло время поговорить о целеполагании. Мы попросили нашего хорошего знакомого Филиппа Гузенюка, известнейшего бизнес-тренера и автора проекта «Счастье в деятельности» написать статью. И вот что из этого вышло:

7 способов «пропитки» целью: как ставить цели, чтобы их достигать (Филипп Гузенюк, партнер Института коучинга (СПб))

Что такое «пропитка целью»? Это процесс перевода цели из состояния «ну да, есть цель» или «классная идея!!» или «вот бы мне!!» в состояние «я знаю, это будет».

В результате пропитки целью она «становится частью меня», «падает из головы в тело», начинает ощущаться как «моя», мир начинает «вести меня к цели», приходят «нужные возможности» и возникает железная уверенность «не знаю как, но знаю ТОЧНО — это будет».

Психолог сказал бы, что цель переходит с сознательного уровня на подсознательный и превращается в фильтр нашего восприятия.

Каждый человек похож на кита. Как кит пропускает планктон через свои усы, так мы пропускаем мир через фильтры своих потребностей, ценностей, убеждений, целей и выбираем из него нужную информацию.

Пропитавшись целью, мы начинаем подсознательно, естественно и без всяких усилий «фильтровать» окружающий мир на наличие возможностей ее достижения. И нам кажется, что они приходят как бы сами собой.

Любые случайности превращаются в знаки, которые подсказывают что-то ценное о том, как достичь цели. «Нужные люди», которых мы бы спокойно не заметили до этого, начинают «появляться» и помогать нам и т.д…

Вы понимаете, о чем я.

Как автор сам к этому пришел и что там за 7 способов-то...

+13

yorko 23 фев 2015 в 03:15

Необычные модели Playboy, или про обнаружение выбросов в данных c помощью Scikit-learn

7 мин

128K

Машинное обучение*Алгоритмы*Python*Data Mining*

Мотивированный статьей пользователя BubaVV про предсказание веса модели Playboy по ее формам и росту, автор решил углубиться ~~if you know what I mean~~ в эту будоражащую кровь тему исследования и в тех же данных найти выбросы, то есть ~~особо сисястые~~ модели, выделяющиеся на фоне других своими формами, ростом или весом. А на фоне этой разминки чувства юмора заодно немного рассказать начинающим исследователям данных про обнаружение выбросов (outlier detection) и аномалий (anomaly detection) в данных с помощью реализации одноклассовой машины опорных векторов (One-class Support Vector Machine) в библиотеке Scikit-learn, написанной на языке Python.

Читать дальше →

+70

BubaVV 15 мар 2013 в 20:01

Корреляции для начинающих

6 мин

217K

Алгоритмы*Математика*

Туториал

Апдейт для тех, кто сочтет статью полезной и занесет в избранное. Есть приличный шанс, что пост уйдет в минуса, и я буду вынужден унести его в черновики. Сохраняйте копию!

Краткий и несложный материал для неспециалистов, рассказывающий в наглядной форме о различных методах поиска регрессионных зависимостей. Это все и близко не академично, зато надеюсь что понятно. Прокатит как мини-методичка по обработке данных для студентов естественнонаучных специальностей, которые математику знают плохо~~, впрочем как и автор~~. Расчеты в Матлабе, подготовка данных в Экселе — так уж повелось в нашей местности

Введение

Зачем это вообще надо? В науке и около нее очень часто возникает задача предсказания какого-то неизвестного параметра объекта исходя из известных параметров этого объекта (предикторов) и большого набора похожих объектов, так называемой учебной выборки. Пример. Вот мы выбираем на базаре яблоко. Его можно описать такими предикторами: красность, вес, количество червяков. Но как потребителей нас интересует вкус, измеренный в попугаях по пятибалльной шкале. Из жизненного опыта нам известно, что вкус с приличной точностью равен 5*красность+2*вес-7*количество червяков. Вот про поиск такого рода зависимостей мы и побеседуем. Чтобы обучение пошло легче, попробуем предсказать вес девушки исходя из ее 90/60/90 и роста.

Читать дальше →

+104

shimapa23 15 фев 2015 в 17:07

300 потрясающих бесплатных сервисов

11 мин

1.6M

Веб-дизайн*Интерфейсы*Типографика*

Перевод

Автор оригинальной статьи Ali Mese добавил ещё 100 новых бесплатных сервисов. Все 400 потрясающих сервисов доступны здесь. И еще подборку +500 инструментов от 10 марта 2017 г. смотрите здесь.

A. Бесплатные Веб-Сайты + Логотипы + Хостинг + Выставление Счета

HTML5 UP: Адаптивные шаблоны HTML5 и CSS3.
Bootswatch: Бесплатные темы для Bootstrap.
Templated: Коллекция 845 бесплатных шаблонов CSS и HTML5.
Wordpress.org | Wordpress.com: Бесплатное создание веб-сайта.
Strikingly.com Domain: Конструктор веб-сайтов.
Logaster: Онлайн генератор логотипов и элементов фирменного стиля (new).
Withoomph: Мгновенное создание логотипов (англ.).
Hipster Logo Generator: Генератор хипстерских логотипов.
Squarespace Free Logo: Можно скачать бесплатную версию в маленьком разрешении.
Invoice to me: Бесплатный генератор счета.
Free Invoice Generator: Альтернативный бесплатный генератор счета.
Slimvoice: Невероятно простой счет.

Читать дальше →

+309

107

sindzicat 5 янв 2015 в 11:00

SageMathCloud — мечта для любителей Python, математики и Linux

7 мин

38K

Open source*Python*Математика*

SageMathCloud (сокращённо SMC) — это онлайновый сервис, в котором можно написать математический или любой другой расчёт в Sage или IPython Notebook. Расчёт можно комбинировать с HTML, CSS, JavaScript, CoffeeScript, Go, Fortran, Julia, Gap, Axiom, R, Ruby, Perl, Maxima, Maple, Markdown, Wiki (и это неполный список!). При редактировании поддерживается мультикурсорность, можно включить биндинги Vim или Sublime Text. Пользователю также доступна консоль Ubuntu и доступ к проекту по ssh. Можно создавать документы LaTeX и встраивать в них код на Python, который не будет отображаться в итоговом pdf. Широкие возможности позволяют написать не просто расчёт с 2D и 3D графикой, а целое интерактивное приложение или собственный веб-сервер на Flask. Можно расшарить расчёт пользователям на редактирование, и Вы будете видеть, что они меняют и даже где стоит их курсор! При этом великолепии SageMathCloud имеет открытый исходный код, который выложен на Github.

Читать дальше →

+49

1 2 ...

12 13