Articles / Bookmarks / Profile of irriss / Habr

How to become an author

Руслан Еникеев @irriss

User

ProfileArticles2PostsNewsComments112

mephistopheies Aug 9 2016 at 12:59

Стилизация изображений с помощью нейронных сетей: никакой мистики, просто матан

14 min

92K

VK corporate blogImage processing*Machine learning*Mathematics*Algorithms*

Приветствую тебя, Хабр! Наверняка вы заметили, что тема стилизации фотографий под различные художественные стили активно обсуждается в этих ваших интернетах. Читая все эти популярные статьи, вы можете подумать, что под капотом этих приложений творится магия, и нейронная сеть действительно фантазирует и перерисовывает изображение с нуля. Так уж получилось, что наша команда столкнулась с подобной задачей: в рамках внутрикорпоративного хакатона мы сделали стилизацию видео, т.к. приложение для фоточек уже было. В этом посте мы с вами разберемся, как это сеть "перерисовывает" изображения, и разберем статьи, благодаря которым это стало возможно. Рекомендую ознакомиться с прошлым постом перед прочтением этого материала и вообще с основами сверточных нейронных сетей. Вас ждет немного формул, немного кода (примеры я буду приводить на Theano и Lasagne), а также много картинок. Этот пост построен в хронологическом порядке появления статей и, соответственно, самих идей. Иногда я буду его разбавлять нашим недавним опытом. Вот вам мальчик из ада для привлечения внимания.

Читать дальше →

+137

mephistopheies Mar 20 2015 at 07:19

Нейропластичность в искусственных нейронных сетях

17 min

53K

VK corporate blogMachine learning*Algorithms*Data Mining*Big Data*

Привет, Хабр, давно не виделись. В этом посте мне хотелось бы рассказать о таком относительно новом понятии в машинном обучении, как transfer learning. Так как я не нашел какого-либо устоявшегося перевода этого термина, то и в названии поста фигурирует хоть и другой, но близкий по смыслу термин, который как бы является биологической предпосылкой к формализации теории передачи знаний от одной модели к другой. Итак, план такой: для начала рассмотрим биологические предпосылки; после коснемся отличия transfer learning от очень похожей идеи предобучения глубокой нейронной сети; а в конце обсудим реальную задачу семантического хеширования изображений. Для этого мы не будем скромничать и возьмем глубокую (19 слоев) сверточную нейросеть победителей конкурса imagenet 2014 года в разделе «локализация и классификация» (Visual Geometry Group, University of Oxford), сделаем ей небольшую трепанацию, извлечем часть слоев и используем их в своих целях. Поехали.

Читать дальше →

+54

Zalina Aug 7 2016 at 17:17

Самое главное о нейронных сетях. Лекция в Яндексе

30 min

190K

Яндекс corporate blogAlgorithms*Machine learning*Image processing*Programming*

Кажется, не проходит и дня, чтобы на Хабре не появлялись посты о нейронных сетях. Они сделали машинное обучение доступным не только большим компаниям, но и любому человеку, который умеет программировать. Несмотря на то, что всем кажется, будто о нейросетях уже всем все известно, мы решили поделиться обзорной лекцией, прочитанной в рамках Малого ШАДа, рассчитанного на старшеклассников с сильной математической подготовкой.

Материал, рассказанный нашим коллегой Константином Лахманом, обобщает историю развития нейросетей, их основные особенности и принципиальные отличия от других моделей, применяемых в машинном обучении. Также речь пойдёт о конкретных примерах применения нейросетевых технологий и их ближайших перспективах. Лекция будет полезна тем, кому хочется систематизировать у себя в голове все самые важные современные знания о нейронных сетях.

Константин klakhman Лахман закончил МИФИ, работал исследователем в отделе нейронаук НИЦ «Курчатовский институт». В Яндексе занимается нейросетевыми технологиями, используемыми в компьютерном зрении.

Под катом — подробная расшифровка со слайдами.

Читать дальше →

+130

SLY_G Aug 3 2016 at 17:58

Глобальное потепление для начинающих

12 min

36K

Popular sciencePhysicsEcology

Translation

Если бы вы не слышали о глобальном потеплении, как бы вы смогли установить, происходит ли оно?

Вопрос о том, происходит ли изменение климата, не стоит. Спорить можно только о том, какую роль в нём играют люди.
— Дэвид Аттенборо

Давненько я не писал ничего про глобальное потепление, изменение климата и вообще о земных проблемах окружающей среды. Я ведь физик – точнее, астрофизик – и хотя я хорошо разбираюсь в физике Земли и в науке, это не моя экспертная область.

Но мне поступило много просьб взглянуть на вышедший (в 2014 году) отчёт IPCC по поводу глобального потепления и меня спрашивали, как можно самостоятельно попытаться установить, нагревается ли Земля.

И если это действительно так, то как понять, играет ли человечество в этом процессе значительную роль?

Читать дальше →

+36

m9_psy Aug 3 2016 at 09:17

Математика для искусственных нейронных сетей для новичков, часть 1 — линейная регрессия

8 min

157K

Python*Machine learning*

Оглавление

Часть 1 — линейная регрессия
Часть 2 — градиентный спуск
Часть 3 — градиентный спуск продолжение

Введение

Этим постом я начну цикл «Нейронные сети для новичков». Он посвящен искусственным нейронным сетям (внезапно). Целью цикла является объяснение данной математической модели. Часто после прочтения подобных статей у меня оставалось чувство недосказанности, недопонимания — НС по-прежнему оставались «черным ящиком» — в общих чертах известно, как они устроены, известно, что делают, известны входные и выходные данные. Но тем не менее полное, всестороннее понимание отсутствует. А современные библиотеки с очень приятными и удобными абстракциями только усиливают ощущение «черного ящика». Не могу сказать, что это однозначно плохо, но и разобраться в используемых инструментах тоже никогда не поздно. Поэтому моей первичной целью является подробное объяснение устройства нейронных сетей так, чтобы абсолютно ни у кого не осталось вопросов об их устройстве; так, чтобы НС не казались волшебством. Так как это не математический трактат, я ограничусь описанием нескольких методов простым языком (но не исключая формул, конечно же), предоставляя поясняющие иллюстрации и примеры.

Цикл рассчитан на базовый ВУЗовский математический уровень читающего. Код будет написан на Python3.5 с numpy 1.11. Список остальных вспомогательных библиотек будет в конце каждого поста. Абсолютно все будет написано с нуля. В качестве подопытного выбрана база MNIST — это черно-белые, центрированные изображения рукописных цифр размером 28*28 пикселей. По-умолчанию, 60000 изображений отмечены для обучения, а 10000 для тестирования. В примерах я не буду изменять распределения по-умолчанию.

Читать дальше →

+40

semfromshire Aug 2 2016 at 14:15

Машинное обучение для прогнозирования тенниса: часть 1

12 min

73K

Machine learning*Algorithms*Mathematics*

Математическое моделирование тенниса набирает популярность на наших глазах. Каждый год появляются новые аналитические модели и сервисы, соревнующиеся друг с другом в точности прогнозирования исходов теннисных матчей. Это вызвано желанием заработать на стремительно растущем онлайн рынке спортивных ставок: нередки случаи, когда сумма ставок на отдельный матч в профессиональном теннисе достигает миллионов долларов.

В этом обзоре я рассмотрю основные математические методы прогнозирования тенниса: иерархические марковские модели, алгоритмы машинного обучения, а также разберу кейсы IBM, Microsoft и одного российского сервиса, использующих машинное обучение для прогнозирования результатов теннисных матчей.

Читать дальше →

+16

LukinB Jul 28 2016 at 11:55

Обучение машины — забавная штука: современное распознавание лиц с глубинным обучением

12 min

98K

Machine learning*Image processing*

Translation

Вы заметили, что Фейсбук обрёл сверхъестественную способность распознавать ваших друзей на ваших фотографиях? В старые времена Фейсбук отмечал ваших друзей на фотографиях лишь после того, как вы щёлкали соответствующее изображение и вводили через клавиатуру имя вашего друга. Сейчас после вашей загрузки фотографии Фейсбук отмечает любого для вас, что похоже на волшебство:

Читать дальше →

+121

SLY_G May 13 2015 at 23:25

Введение в функциональное программирование на Python

10 min

154K

Python*Programming*Functional Programming*

Translation

Рассуждая о функциональном программировании, люди часто начинают выдавать кучу «функциональных» характеристик. Неизменяемые данные, функции первого класса и оптимизация хвостовой рекурсии. Это свойства языка, помогающие писать функциональные программы. Они упоминают мапирование, каррирование и использование функций высшего порядка. Это приёмы программирования, использующиеся для написания функционального кода. Они упоминают распараллеливание, ленивые вычисления и детерменизм. Это преимущества функциональных программ.

Забейте. Функциональный код отличается одним свойством: отсутствием побочных эффектов. Он не полагается на данные вне текущей функции, и не меняет данные, находящиеся вне функции. Все остальные «свойства» можно вывести из этого.

Нефункциональная функция:

a = 0
def increment1():
    global a
    a += 1

Функциональная функция:

def increment2(a):
    return a + 1

Вместо проходов по списку используйте map и reduce

Читать дальше →

+27

ITI_Capital Jul 26 2016 at 06:57

Как на самом деле устроена торговля на бирже: Простой алгоритм (часть 1)

7 min

81K

ITI Capital corporate blogAlgorithms*

Translation

/ фото yuan2003 CC

Высокочастотные трейдеры – особая каста биржевых игроков. Мало, кто из них, снисходит до описания смысла своей профессии простым человеческим языком. Мы нашли блог Криса Стуккио, бывшего кванта, который решил написать краткую апологию HFT.

Речь идет не об оправдании профессии в социальном контексте, говорит Крис. Речь о неких интеллектуальных основаниях сферы человеческой деятельности, которую часто неверно понимают. В своем посте автор пытается рассказать о базисе, на котором построена биржевая торговля и высокочастотный трейдинг, и на примерах объясняет, почему трейдеры так озабочены сокращением задержек при осуществлении транзакций.

Примечание: для торговли на бирже необходим брокерский счет, открыть его в режиме онлайн можно по этой ссылке.

Читать дальше →

+23

Alexey_mosc Jun 28 2016 at 22:37

Методические заметки об отборе информативных признаков (feature selection)

39 min

23K

Align Technology, R&D corporate blogData Mining*R*

Tutorial

Всем привет!

Меня зовут Алексей Бурнаков. Я Data Scientist в компании Align Technology. В этом материале я расскажу вам о подходах к feature selection, которые мы практикуем в ходе экспериментов по анализу данных.

В нашей компании статистики и инженеры machine learning анализируют большие объемы клинической информации, связанные с лечением пациентов. В двух словах смысл этой статьи можно свести к извлечению ценных крупиц знания, содержащихся в небольшой доле доступных нам зашумленных и избыточных гигабайтов данных.

Данная статья предназначена для статистиков, инженеров машинного обучения и специалистов, которые интересуются вопросами обнаружения зависимостей в наборах данных. Также материал, изложенный в статье, может быть интересен широкому кругу читателей, неравнодушных к data mining. В материале не будут затронуты вопросы feature engineering и, в частности, применения таких методов как анализ главных компонент.

Источник.

Читать дальше →

+18

yusman Jun 22 2016 at 06:07

Big Data головного мозга

14 min

94K

Big Data*Hadoop*

Наверно, в мире данных нет подобного феномена настолько неоднозначного понимания того, что же такое Hadoop. Ни один подобный продукт не окутан таким большим количеством мифов, легенд, а главное непонимания со стороны пользователей. Не менее загадочным и противоречивым является термин "Big Data", который иногда хочется писать желтым шрифтом(спасибо маркетологам), а произносить с особым пафосом. Об этих двух понятиях — Hadoop и Big Data я бы хотел поделиться с сообществом, а возможно и развести небольшой холивар.
Возможно статья кого-то обидит, кого-то улыбнет, но я надеюсь, что не оставит никого равнодушным.

Демонстрация Hadoop пользователям

Читать дальше →

+35

Lexxo Jun 27 2016 at 13:06

Как работает метод главных компонент (PCA) на простом примере

10 min

301K

Python*Algorithms*Machine learning*

В этой статье я бы хотел рассказать о том, как именно работает метод анализа главных компонент (PCA – principal component analysis) с точки зрения интуиции, стоящей за ее математическим аппаратом. Максимально просто, но подробно.

Читать дальше →

+17

obus Jun 16 2016 at 15:25

Метрики качества ранжирования

7 min

129K

E-Contenta corporate blogAlgorithms*Mathematics*Machine learning*Search engines*

Tutorial

В процессе подготовки задачи для вступительного испытания на летнюю школу GoTo, мы обнаружили, что на русском языке практически отсутствует качественное описание основных метрик ранжирования (задача касалась частного случая задачи ранжирования — построения рекомендательного алгоритма). Мы в E-Contenta активно используем различные метрики ранжирования, поэтому решили исправить это недоразуменее, написав эту статью.

Метрики качества ранжирования

Читать дальше →

+14

tmteam Jun 10 2016 at 09:12

Искусственные нейронные сети простыми словами

7 min

213K

Artificial IntelligenceBrainPopular science

Когда, за бутылкой пива, я заводил разговор о нейронных сетях — люди обычно начинали боязливо на меня смотреть, грустнели, иногда у них начинал дёргаться глаз, а в крайних случаях они залезали под стол. Но, на самом деле, эти сети просты и интуитивны. Да-да, именно так! И, позвольте, я вам это докажу!

Допустим, я знаю о девушке две вещи — симпатична она мне или нет, а также, есть ли о чём мне с ней поговорить. Если есть, то будем считать это единицей, если нет, то — нулём. Аналогичный принцип возьмем и для внешности. Вопрос: “В какую девушку я влюблюсь и почему?”

Можно подумать просто и бескомпромиссно: “Если симпатична и есть о чём поговорить, то влюблюсь. Если ни то и ни другое, то — увольте.”

Но что если дама мне симпатична, но с ней не о чем разговаривать? Или наоборот?

+58

nikitos18 Jun 7 2016 at 08:57

Как программист машину покупал

9 min

122K

Machine learning*R*Data Mining*

Недавно я озадачился поиском б.у. автомобиля, взамен только что проданного, и, как это обычно бывает, на эту роль претендовали несколько конкурентов.

Как известно, для покупки авто на территории РФ существует несколько крупных авторитетных сайтов (auto.ru, drom.ru, avito.ru), поиску на которых я и отдал предпочтение. Моим требованиям отвечали сотни, а для некоторых моделей и тысячи, автомобилей, с перечисленных выше сайтов. Помимо того, что искать на нескольких ресурсах неудобно, так еще, прежде чем ехать смотреть авто “вживую”, я хотел бы отобрать выгодные (цена которых относительно рынка занижена) предложения по априорной информации которую предоставляет каждый из ресурсов. Я, конечно, очень хотел решить несколько переопределенных систем алгебраических уравнений (возможно и нелинейных) высокой размерности вручную, но пересилил себя, и решил этот процесс автоматизировать.

Читать дальше →

+69

A3a Jun 9 2016 at 07:05

Теория графов в Игре Престолов

19 min

66K

Programming*Entertaining tasksAlgorithms*C++*

Недавно, на Geektimes я опубликовал статью, где привёл немного поверхностной статистики из серии книг «Песнь льда и пламени». Но я не стал углубляться в самую интересную часть, в граф социальных связей, ибо тема заслуживает отдельного внимания. В этой статье я продемонстрирую как теория графов может помочь при анализе подобных данных и приведу реализации алгоритмов, которыми я пользовался.

Всем кому интересно, добро пожаловать под кат.

Читать дальше →

+49

ITI_Capital May 30 2016 at 08:29

Технологии фондового рынка: 10 заблуждений о нейронных сетях

17 min

55K

ITI Capital corporate blogProgramming*Machine learning*Big Data*

Translation

Нейронные сети – один из самых популярных классов алгоритмов для машинного обучения. В финансовом анализе они чаще всего применяются для прогнозирования, создания собственных индикаторов, алгоритмического трейдинга и моделирования рисков. Несмотря на все это, репутация у нейронных сетей подпорчена, поскольку результаты их применения можно назвать нестабильными.

Количественный аналитик хедж-фонда NMRQL Стюарт Рид в статье на сайте TuringFinance попытался объяснить, что это означает, и доказать, что все проблемы кроются в неадекватном понимании того, как такие системы работают. Мы представляем вашему вниманию адаптированный перевод его статьи.

Читать дальше →

+11

semen_grinshtein May 25 2016 at 11:05

Как поездка в отпуск изменила жизнь основателя Salesforce Марка Бениоффа

8 min

12K

CRM systems*Business Models*Development Management*

Марк Бениофф — знаменитый калифорнийский предприниматель, успешный бизнесмен, миллиардер, основатель одного из крупнейших облачных провайдеров и разработчиков CRM-систем Salesforce.com. С августа 2012 года — член совета директоров Cisco.

Как выяснилось, создание специальных систем по управлению взаимоотношениями с клиентами (CRM) — дело прибыльное. Себе господин Бениофф «назначил» $31,3 миллиона, его подчиненные в среднем получают $151 512. Иными словами, на $1 зарплаты программиста приходятся $207 вознаграждения генеральному директору.

Бениофф владеет 5% акций Salesforce при оценке компании в $56,06 миллиарда. Его состояние оценивается в $4,2 миллиарда.

22 мая 2015 года стало известно о переговорах Microsoft и Salesforce о ее покупке, но стороны не договорились о цене. Microsoft предлагала за крупнейшего после Oracle производителя облачного софта порядка $55 миллиардов. Марк Бениофф поднял цену до $70 миллиардов.

Интерес к Salesforce также проявляют Oracle, IBM и SAP.

Однако, по всей видимости, он рассчитывает на то, что покупатели не предложат больше. Бениофф все-таки не намерен продавать компанию: позже он заявил, что хочет сам принимать судьбоносные решения в компании, а именно сейчас Salesforce переживает самый интересный период за всю историю своего существования.

Читать дальше →

+7

divan0 May 23 2016 at 22:39

FizzBuzz на TensorFlow

4 min

53K

TensorFlow*Machine learning*Programming*

Translation

интервьюер: Приветствую, хотите кофе или что-нибудь еще? Нужен перерыв?

я: Нет, кажется я уже выпил достаточно кофе!

интервьюер: Отлично, отлично. Как вы относитесь к написанию кода на доске?

я: Я только так код и пишу!

интервьюер: ...

я: Это была шутка.

интервьюер: OK, итак, вам знакома задача "fizz buzz"?

я: ...

интервьюер: Это было да или нет?

я: Это что-то вроде "Не могу поверить, что вы меня об этом спрашиваете."

интервьюер: OK, значит, нужно напечатать числа от 1 до 100, только если число делится нацело на 3, напечатать слово "fizz", если на 5 — "buzz", а если делится на 15, то — "fizzbuzz".

я: Я знаю эту задачу.

интервьюер: Отлично, кандидаты, которые не могут пройти эту задачу, у нас не сильно уживаются.

я: ...

интервьюер: Вот маркер и губка.

я: [задумался на пару минут]

интервьюер: Вам нужна помощь, чтобы начать?

я: Нет, нет, все в порядке. Итак, начнем с пары стандартных импортов:

import numpy as np
import tensorflow as tf

интервьюер: Эм, вы же правильно поняли проблему в fizzbuzz, верно?

я: Так точно. Давайте обсудим модели. Я думаю тут подойдет простой многослойный перцептрон с одним скрытым слоем.

Читать дальше →

+114

feriat May 6 2016 at 08:52

Meduza.io: а как же лайки?

5 min

48K

Data Mining*Python*Data visualization*

Как-то раз, читая новости на Медузе, я обратил внимание на то, что у разных новостей разное соотношение лайков из Facebook и ВКонтакте. Какие-то новости мегапопулярны на fb, а другими люди делятся только во ВКонтакте. Захотелось присмотреться к этим данным, попытаться найти в них интересные закономерности. Заинтересовавшихся приглашаю под кат!

Читать дальше →

+57

1 2 ...

9