Articles / Bookmarks / Profile of Don

RK @Don_Eric

Пользователь

Profile Publications 1Comments 300Bookmarks 110

Habr_Studio Feb 22 2017 at 17:23

Нейронные сети: практическое применение

15 min

275K

Algorithms*Machine learning*Image processing*

Наталия Ефремова погружает публику в специфику практического использования нейросетей. Это — расшифровка доклада Highload++.

Добрый день, меня зовут Наталия Ефремова, и я research scientist в компании NtechLab. Сегодня я буду рассказывать про виды нейронных сетей и их применение.

Сначала скажу пару слов о нашей компании. Компания новая, может быть многие из вас еще не знают, чем мы занимаемся. В прошлом году мы выиграли состязание MegaFace. Это международное состязание по распознаванию лиц. В этом же году была открыта наша компания, то есть мы на рынке уже около года, даже чуть больше. Соответственно, мы одна из лидирующих компаний в распознавании лиц и обработке биометрических изображений.

Первая часть моего доклада будет направлена тем, кто незнаком с нейронными сетями. Я занимаюсь непосредственно deep learning. В этой области я работаю более 10 лет. Хотя она появилась чуть меньше, чем десятилетие назад, раньше были некие зачатки нейронных сетей, которые были похожи на систему deep learning.

+54

Alf162 Feb 20 2017 at 10:19

Обзор материалов по машинному обучению (13 — 20 февраля 2017 года)

3 min

9.1K

Mathematics*Machine learning*

Представляю вашему вниманию подборку материалов по машинному обучению и анализу данных за прошедшую неделю, которые показались мне интересными.

События предстоящей недели

1.

Deep Learning: Now and Future of Robotics. Skolkovo-Skoltech-NVIDIA workshop. 21 февраля.
2.

Data Science кейс-клуб. 21 февраля.
3.

Data science завтрак. 22 февраля.
4.

Тренировка по машинному обучению. 25 февраля.

Учебные курсы, конференции

1.

Онлайн-курс «Введение в обработку естественного языка» с середины марта на stepik. Страница прошлого года.
2.

Перезапуск курса «Neural Networks for Machine Learning» G.Hinton.
3.

Видео с конференции TensorFlow Developer Summit.
4.

Видео с конференции DataFest. Часть 1. Часть 2. Часть 3. Часть 4.
5.

Семинар Practical Machine Learning от Яндекса (видео). Тема: чат-боты. Запись ноябрьская, но попалась недавно.

Читать дальше →

+19

Nastya_Gladkova Feb 14 2017 at 12:38

Офферы и вертикали в арбитраже трафика

5 min

44K

Mobio corporate blogGrowth Hacking*Mobile App Analytics*Internet marketing*Mobile applications monetization*

Tutorial

Это четвертый урок бесплатного курса по мобильному арбитражу, в рамках которого вы получите общий набор знаний про мобильный арбитраж, фундаментальные понятия и набор инструментов, которые необходимы любому арбитражнику, интернет-маркетологу или трафик-менеджеру.

Предыдущие уроки:

В этом уроке поговорим более подробно про офферы: каких типов они бывают, и что такое вертикаль офферов. Рассмотрим специфичные офферы для мобильного арбитража.

Презентация | Текстовая расшифровка

Товар — первый элемент формулы заработка в интернете. Оффер — предложение рекламодателя продвигать товар с определенным условием оплаты.

Товары могут быть разными, поэтому офферы распределяют на группы в зависимости от рекламируемого товара. Для этого введем понятие вертикали офферов.

+10

Nastya_Gladkova Feb 7 2017 at 13:46

Участники арбитражного рынка

4 min

14K

Mobio corporate blogMobile applications monetization*Internet marketing*Mobile App Analytics*Growth Hacking*

Tutorial

Это второй урок базового курса по мобильному арбитражу, в рамках которого вы получите общий набор знаний про мобильный арбитраж, фундаментальные понятия и набор инструментов, которые необходимы любому арбитражнику, интернет-маркетологу или трафик-менеджеру.

Предыдущие уроки: 1. Что такое арбитраж

В этом уроке мы рассмотрим основных участников арбитражного рынка: арбитражников, рекламодателей, партнерские сети и источники трафика. Расскажем, как они взаимодействуют между собой. Ниже будет как видео урока, так и его текстовая расшифровка.

→ Презентация

Для начала дадим определение каждому из участников рынка.

Арбитражники — люди, которые покупают платный трафик и привлекают его на товары рекламодателей (офферы). Привлекать трафик может один человек, также возможна командная работа в группе арбитражников.

Рекламодатель — клиент, у которого есть товар и потребность в продвижении этого товара. Это одно из самых важных звеньев цепочки: рекламодатель создает на рынке предложение (оффер), выделяет бюджет на продвижение этого предложения и при этом несет все репутационные риски.

Процесс общения арбитражника с рекламодателем зачастую сложно организовать, поэтому их общение чаще всего реализуется через партнерскую сеть. Рассмотрим этого участника рынка подробнее.

+11

wunder_editor Dec 27 2016 at 11:22

Разбор статистической языковой модели от Google — часть 1: векторное представление символов

8 min

15K

Wunder Fund corporate blogMachine learning*Algorithms*

Translation

В этом году исследователи из Google Brain опубликовали статью под названием Exploring the Limits of Language Modeling (Исследование границ языкового моделирования), в которой была описана языковая модель, позволившая значительно снизить перплексию (с примерно 50 до 30) на словаре One Billion Word Benchmark.

В этом посте мы расскажем про самый низкий уровень этой модели — представление символов.

Читать дальше →

+13

ternaus Dec 27 2016 at 05:36

Kaggle: Allstate Claims Severity

10 min

16K

Data Mining*Machine learning*Sport programming*

Хотелось бы описать решение к недавнему соревнованию по машинному обучению Allstate Claims Severity. (Мой результат 40 из 3055). Так как это это соревнование типа «ансамблевое рубилово», как правило, обсуждение решений вызывает нездоровые священные войны между теми, кто пробовал участвовать и теми кто нет, так что для начала я сделаю небольшое лирическое отступление.

Читать дальше →

+22

kozyrevskaya Sep 13 2016 at 16:46

11 текстов, которые помогут разобраться в больших данных

3 min

25K

Surfingbird corporate blogBig Data*

Сегодня необходимо хотя бы в общих чертах иметь представление о мире big data. Мы отобрали публикации, в которых доступно объясняют, что такое большие данные и как их используют. Статьи рассчитаны, скорее, на новичков, но и люди, разбирающиеся в теме, смогут найти для себя интересные (или просто забавные) кейсы.

Читать дальше →

+14

freetonik Sep 20 2016 at 11:37

Полное практическое руководство по Docker: с нуля до кластера на AWS

39 min

1.7M

Website development*Amazon Web Services*

Translation

Содержание

Вопросы и ответы
Введение
- Пре-реквизиты
- Настройка компьютера
1.0 Играем с Busybox
- 1.1 Docker Run
- 1.2 Терминология
2.0 Веб-приложения и Докер
3.0 Многоконтейнерные окружения
4.0 Заключение
- 4.1 Следующие шаги
- 4.2 Фидбек автору

Вопросы и ответы

Что такое Докер?

Определение Докера в Википедии звучит так:

программное обеспечение для автоматизации развёртывания и управления приложениями в среде виртуализации на уровне операционной системы; позволяет «упаковать» приложение со всем его окружением и зависимостями в контейнер, а также предоставляет среду по управлению контейнерами.

Ого! Как много информации.

Читать дальше →

+123

kapustor Oct 11 2016 at 10:57

Сравнение аналитических in-memory баз данных

19 min

41K

Т-Банк corporate blogBig Data*MySQL*PostgreSQL*SQL*

В последние два месяца лета в управлении хранилищ данных (Data Warehouse, DWH) Тинькофф Банка появилась новая тема для кухонных споров.

Всё это время мы проводили масштабное тестирование нескольких in-memory СУБД. Любой разговор с администраторами DWH в это время можно было начать с фразы «Ну как, кто лидирует?», и не прогадать. В ответ люди получали длинную и очень эмоциональную тираду о сложностях тестирования, премудростях общения с доселе неизвестными вендорами и недостатках отдельных испытуемых.

Подробности, результаты и некое подобие выводов из тестирования — под катом.

Читать дальше →

+41

xopxe Oct 4 2016 at 19:50

Как проверить причинную связь без эксперимента?

9 min

15K

Wunder Fund corporate blogAlgorithms*Machine learning*

Translation

Сегодня поговорим об установлении причинных связей между явлениями, когда невозможно провести эксперимент и А/В-тесты. Это довольно простая статья, которая будет полезна начинающим в статистике и машинном обучении или тем, кто раньше над такими вопросами не задумывался.

Действительно ли пациентам, тестирующим новое лекарство, становится лучше из-за лекарства, или они все все равно бы выздоровели? Ваши продавцы действительно эффективны или же они говорят с теми клиентами, которые и так готовы совершить покупку? Действительно ли Сойлент (или рекламная кампания, которая обойдётся фирме в миллион долларов) стоит вашего времени?

Читать дальше →

+26

kozyrevskaya Aug 24 2016 at 18:52

Как медиа выжить в кризис: опыт мировых СМИ

10 min

10K

Surfingbird corporate blogBusiness Models*E-commerce management*Sales management*Project management*

Конкуренция за внимание читателя растет, а рекламные доходы падают. Издателям приходится сталкиваться с «баннерной слепотой» и сменой алгоритмов соцсетей, из которых приходит львиная доля трафика. В этих условиях медиа постоянно ищут новые способы заработка. Мы собрали опыт мировых СМИ в борьбе за выживание в медиа-бизнесе.

Читать дальше →

semfromshire Aug 2 2016 at 17:15

Машинное обучение для прогнозирования тенниса: часть 1

12 min

72K

Machine learning*Mathematics*Algorithms*

From sandbox

Математическое моделирование тенниса набирает популярность на наших глазах. Каждый год появляются новые аналитические модели и сервисы, соревнующиеся друг с другом в точности прогнозирования исходов теннисных матчей. Это вызвано желанием заработать на стремительно растущем онлайн рынке спортивных ставок: нередки случаи, когда сумма ставок на отдельный матч в профессиональном теннисе достигает миллионов долларов.

В этом обзоре я рассмотрю основные математические методы прогнозирования тенниса: иерархические марковские модели, алгоритмы машинного обучения, а также разберу кейсы IBM, Microsoft и одного российского сервиса, использующих машинное обучение для прогнозирования результатов теннисных матчей.

Читать дальше →

+16

astur May 24 2016 at 09:30

Web scraping при помощи Node.js

10 min

145K

Programming*Node.JS*JavaScript*Data Mining*

Это первая статья в цикле про создание и использование скриптов для веб-скрейпинга при помощи Node.js.

Web scraping при помощи Node.js
Web scraping на Node.js и проблемные сайты
Web scraping на Node.js и защита от ботов
Web scraping обновляющихся данных при помощи Node.js

Тема веб-скрейпинга вызывает всё больше интереса как минимум потому, что это неисчерпаемый источник небольших, но удобных и интересных заказов для фрилансеров. Естественно, что всё больше людей пытаются выяснить, что это такое. Однако, довольно трудно понять, что такое веб-скрейпинг по абстрактным примерам из документации к очередной библиотеке. Гораздо проще разобраться в этой теме наблюдая за решением реальной задачи шаг за шагом.

Обычно, задача для веб-скрейпинга выглядит так: есть данные, доступные только на веб-страницах, и их надо оттуда вытащить и сохранить в неком удобоваримом формате. Конечный формат не важен, так как конвертеры никто не отменял. По большей части речь о том, чтобы открыть браузер, пройтись мышкой по ссылкам и скопипейстить со страниц нужные данные. Ну, или сделать то же самое скриптом.

Цель этой статьи – показать весь процесс создания и использования такого скрипта от постановки задачи и до получения конечного результата. В качестве примера я рассмотрю реальную задачу вроде тех, какие часто можно найти, например, на биржах фриланса, ну, а в качестве инструмента для веб-скрейпинга будем использовать Node.js.

Читать дальше →

+11

yusman Jun 22 2016 at 09:07

Big Data головного мозга

14 min

94K

Big Data*Hadoop*

Наверно, в мире данных нет подобного феномена настолько неоднозначного понимания того, что же такое Hadoop. Ни один подобный продукт не окутан таким большим количеством мифов, легенд, а главное непонимания со стороны пользователей. Не менее загадочным и противоречивым является термин "Big Data", который иногда хочется писать желтым шрифтом(спасибо маркетологам), а произносить с особым пафосом. Об этих двух понятиях — Hadoop и Big Data я бы хотел поделиться с сообществом, а возможно и развести небольшой холивар.
Возможно статья кого-то обидит, кого-то улыбнет, но я надеюсь, что не оставит никого равнодушным.

Демонстрация Hadoop пользователям

Читать дальше →

+35

ZlodeiBaal Feb 12 2016 at 03:51

Нейрореволюция в головах и сёлах

8 min

94K

Image processing*Machine learning*Algorithms*

В последнее время всё чаще и чаще слышишь мнение, что сейчас происходит технологическая революция. Бытует мнение, что мир стремительно меняется.

На мой взгляд такое и правда происходит. И одна из главных движущих сил — новые алгоритмы обучения, позволяющие обрабатывать большие объёмы информации. Современные разработки в области компьютерного зрения и алгоритмов машинного обучения могут быстро принимать решения с точностью не хуже профессионалов.

Я работаю в области связанной с анализом изображений. Это одна из областей которую новые идеи затронули сильнее всего. Одна из таких идей — свёрточные нейронные сети. Четыре года назад с их помощью впервые начали выигрывать конкурсы по обработке изображений. Победы не остались незамеченными. Нейронными сетями, до тех пор стоящими на вторых ролях, стали заниматься и пользоваться десятки тысяч последователей. В результате, полтора-два года назад начался бум, породивший множество идей, алгоритмов, статей.

В своём рассказе я сделаю обзор тех идей, которые появились за последние пару лет и зацепили мою тематику. Почему происходящее — революция и чего от неё ждать.

Кто лишится в ближайшие лет десять работы, а у кого будут новые перспективные вакансии.

Читать дальше →

+74

124

Randl Feb 25 2016 at 00:51

Как компьютер играет в шахматы?

14 min

98K

SoftwareArtificial IntelligenceLogic games

Recovery Mode

Хикару Накамура, недавно бросивший вызов компьютеру

Компьютер уже давно обыграл человека в шахматы, сейчас сильнейшие шахматисты не способны выиграть даже у старенького ноутбука. Теперь шахматные движки используются для анализа партий, поиска новых вариантов и игры по переписке.

Если вам интересно, как же устроены шахматные движки — добро пожаловать под кат.

Читать дальше →

+38

JPEG Feb 22 2016 at 01:31

Поняв Docker

14 min

222K

Website development*Puppet*

Если вы еще никогда не поддерживали чужие приложения, или пусть даже свои, но таких размеров, что уже не помещаются в одной голове, то прошу вас расслабиться, откинуться на спинку кресла и воспринимать прочитанное как поучительную сказку с надуманными проблемами, забавным сюжетом и очевидным счастливым концом. В противном случае, если реальный боевой опыт у вас имеется, добро пожаловать в ад, но с IDDQD и IDKFA.

К вашему сведению! В этой статье мы рассматриваем само явление docker-контейнеров, а не составляем список микросервисов, которые гнездятся внутри. Этим мы займемся в следующей серии, во имя справедливости!

UPDATE: пришлось заменить «докер» на «docker», иначе статья не ищется. Заранее прошу прощения за все «docker'ы» в тексте. Селяви.

Что мы имеем сегодня

Зоопарк дубовых VPS-хостингов.
Дорогие IaaS и PaaS с гарантированным vendor lock in.
Уникальные сервера-снежинки.
Ворох устаревших зависимостей на неподдерживаемой операционке.
Скрытые связи частей приложения.
Незаменимый админ полубог на скейтборде.
Радуга окружений: development, testing, integration, staging, production.
Генерация конфигов для системы управления конфигами.
Feature flagging.

docker run docker

+74

245

moscowart Feb 5 2016 at 15:43

Фальшивомонетчики против банкиров: стравливаем adversarial networks в Theano

13 min

35K

Algorithms*Machine learning*Image processing*

Вы бы никогда не подумали, но это прогулка по пространству нейросети-фальшивомонетчика. Сделано крутейшими людьми Anders Boesen Lindbo Larsen и Søren Kaae Sønderby

Допустим, у нас есть задача — понять окружающий мир.
Давайте для простоты представим, что мир — это деньги.

Метафора, может быть, с некоторой моральной двусмысленностью, но в целом пример не хуже прочих — деньгам (банкнотам) определенно свойственна какая-то сложная структура, тут у них цифра, тут буква, а там хитрые водяные знаки. Предположим, нам нужно понять, как они сделаны, и узнать правило, по которым их печатают. Какой план?

Напрашивающийся шаг — это пойти в офис центрального банка и попросить их выдать спецификацию, но во-первых, вам ее не дадут, а во-вторых, если выдерживать метафору, то у вселенной нет центрального банка (хотя на этот счет есть религиозные разногласия).

Ну, раз так, давайте попробуем их подделать.

Осторожно, тяжелые гифки

+34

ZlodeiBaal Jan 11 2016 at 23:27

Про волнения в головах

13 min

24K

Website development*Machine learning*Algorithms*

Tutorial

Пару месяцев назад мне захотелось поэкспериментировать с нейроинтерфейсом. Никогда этой темой не занимался, но вдруг стало любопытно. Вроде как лет 5-10 назад обещали бум нейроустройств, а всё что мы сейчас имеем на рынке — устройство чтобы махать ушами, устройство чтобы светить камешком, да устройство чтобы левитировать шаром. Где-то на подходе устройство чтобы будить вовремя. Вот тут есть неплохая статья про всё это дело. В то же время регулярно появляются какие-то исследования, где рассказывают, что люди могут научиться двигать роботическими руками-ногами или писать тексты (1, 2, 3, вот тут есть подборка). Но это всё опытное, в единственном экземпляре, со стоимостью аппаратуры как хорошее авто.

А где что-то посередине? Что-то полезное обычному пользователю? Пусть даже не везде, а в каких-то отдельных применениях. Ведь даже навскидку придумывается несколько вещей: детектор засыпания для водителя, повышение работоспособности (например через выбор музыки, или управление перерывами!). Можно выбрать что-то более специфическое. Например смотреть и анализировать своё состояние в киберспорте. Для этого же даже трекеры зрачков выпускают и используют. Почему нет таких применений? Этот вопрос мучил меня. В итоге решил почитать куда наука движется, а так же купить простенькую нейрогарнитуру и затестить. В статье — попытка разобраться в теме, немного исходников и много анализа текущих достижений потребительской электроники.

Читать дальше →

+43

1 2

4 5 6

Нейронные сети: практическое применение

Обзор материалов по машинному обучению (13 — 20 февраля 2017 года)

Офферы и вертикали в арбитраже трафика

Участники арбитражного рынка

Разбор статистической языковой модели от Google — часть 1: векторное представление символов

Kaggle: Allstate Claims Severity

11 текстов, которые помогут разобраться в больших данных

Полное практическое руководство по Docker: с нуля до кластера на AWS

Содержание

Вопросы и ответы

Что такое Докер?

Сравнение аналитических in-memory баз данных

Как проверить причинную связь без эксперимента?

Как медиа выжить в кризис: опыт мировых СМИ

Машинное обучение для прогнозирования тенниса: часть 1

Web scraping при помощи Node.js

Big Data головного мозга

Нейрореволюция в головах и сёлах

Как компьютер играет в шахматы?

Поняв Docker

Что мы имеем сегодня

Рекомендации на потоке

Фальшивомонетчики против банкиров: стравливаем adversarial networks в Theano

Про волнения в головах

Information