Как стать автором

Пользователь

Профиль Публикации Комментарии 153Закладки 42

Siarshai 1 мар 2018 в 09:10

Случайные эволюционные стратегии в машинном обучении

8 мин

17K

Алгоритмы*Математика*Машинное обучение*

Нейронные сети учатся совсем не так как люди. Оптимизация нейронной сети — на самом деле градиентный спуск по некоторой функции потерь

$E(\theta)$ , где переменными являются веса слоёв

$\theta$ . Это очень мощный подход к подстройке системы, который применяется также в физике, экономике и многих других областях. На данный момент предложено немало конкретных методов градиентного спуска, но все они предполагают, что градиент

$E(\theta)$ хорошо себя ведёт: нет обрывов, где он скачкообразно возрастает, или плато, где он обращается в ноль. С первой проблемой можно разобраться при помощи gradient clipping, но вторая заставляет тщательно подумать. Кусочно-линейную или дискретную функцию нетривиально ограничить более приятной функцией

во многих областях reinforcement learning (далее RL)
в VAE с дискретными латентными переменными
в GAN с дискретными генераторами

Как поступать в таких ситуациях?

Под катом много формул и гифок.

Читать дальше →

+48

m1rko 23 фев 2018 в 23:19

Глубинное обучение с подкреплением пока не работает

33 мин

31K

Разработка игр*Алгоритмы*Обработка изображений*Машинное обучение*Разработка робототехники*

Перевод

Об авторе. Алекс Ирпан — разработчик из группы Brain Robotics в Google, до этого работал в лаборатории Berkeley Artificial Intelligence Research (BAIR).

Здесь в основном цитируются статьи из Беркли, Google Brain, DeepMind и OpenAI за последние несколько лет, потому что их работы наиболее заметны с моей точки зрения. Почти наверняка я что-то упустил из более старой литературы и от других организаций, так что прошу прощения — я всего лишь один человек, в конце концов.

Введение

Однажды в Facebook я заявил следующее.

Когда кто-то спрашивает, может ли обучение с подкреплением (RL) решить их проблему, я сразу отвечаю, что не может. Думаю, что это верно как минимум в 70% случаев.

Глубинное обучение с подкреплением сопровождается массой шумихи. И на то есть хорошие причины! Обучение с подкреплением (RL) — невероятно общая парадигма. В принципе, надёжная и высокопроизводительная система RL должна быть прекрасна во всём. Слияние этой парадигмы с эмпирической силой глубинного обучения очевидно само по себе. Глубинное RL — это то, что больше всего похоже на сильный ИИ, и это своего рода мечта, которая подпитывает миллиарды долларов финансирования.

К сожалению, в реальности эта штука пока не работает.

Но я верю, что она выстрелит. Если бы не верил, то не варился бы в этой теме. Но впереди куча проблем, многие из которых фундаментально сложны. Прекрасные демки обученных агентов скрывают всю кровь, пот и слёзы, что пролились в процессе их создания.

Читать дальше →

+59

Chetter2 2 окт 2017 в 15:44

Методы приближенного поиска ближайших соседей

11 мин

53K

Блог компании VKАлгоритмы*Машинное обучение*

Довольно часто программисты и специалисты из области data science сталкиваются с задачей поиска похожих профилей пользователей или подбора схожей музыки. Решения могут сводиться к преобразованию объектов в векторную форму и поиску ближайших.

Мы тоже столкнулись с необходимостью поиска ближайших соседей в задаче распознавания лиц. Там мы формируем векторные представления лиц при помощи нейросети и ищем ближайшие векторы уже известных людей. Изначально для поиска мы выбрали Annoy, как хорошо известный и проверенный алгоритм, используемый в том числе в Spotify. Но быстро поняли, что с его аппетитами по памяти мы либо не вмещаемся в RAM, либо сильно теряем в точности. Это привело к небольшому исследованию. О результатах которого пойдет речь ниже.

Читать дальше →

+53

gridem 12 ноя 2013 в 12:09

Асинхронность: назад в будущее

22 мин

113K

Асинхронность… Услышав это слово, у программистов начинают блестеть глаза, дыхание становится поверхностным, руки начинают трястись, голос — заикаться, мозг начинает рисовать многочисленные уровни абстракции… У менеджеров округляются глаза, звуки становятся нечленораздельными, руки сжимаются в кулаки, а голос переходит на обертона… Единственное, что их объединяет — это учащенный пульс. Только причины этого различны: программисты рвутся в бой, а менеджеры пытаются заглянуть в хрустальный шар и осознать риски, начинают судорожно придумывать причины увеличения сроков в разы… И уже потом, когда большая часть кода написана, программисты начинают осознавать и познавать всю горечь асинхронности, проводя бесконечные ночи в дебаггере, отчаянно пытаясь понять, что же все-таки происходит…

Именно такую картину рисует мое воспаленное воображение при слове “асинхронность”. Конечно, все это слишком эмоционально и не всегда правда. Ведь так?.. Возможны варианты. Некоторые скажут, что “при правильном подходе все будет работать хорошо”. Однако это можно сказать всегда и везде при всяком удобном и не удобном случае. Но лучше от этого не становится, баги не исправляются, а бессонница не проходит.

Так что же такое асинхронность? Почему она так привлекательна? А главное: что с ней не так?

Назад в будущее...

+118

iphysic 23 июн 2017 в 14:40

Автоэнкодеры в Keras, Часть 2: Manifold learning и скрытые (latent) переменные

11 мин

27K

Python*Алгоритмы*Машинное обучение*

Туториал

Содержание

Часть 1: Введение
Часть 2: Manifold learning и скрытые (latent) переменные
Часть 3: Вариационные автоэнкодеры (VAE)
Часть 4: Conditional VAE
Часть 5: GAN (Generative Adversarial Networks) и tensorflow
Часть 6: VAE + GAN

Для того, чтобы лучше понимать, как работают автоэнкодеры, а также чтобы в последствии генерировать из кодов что-то новое, стоит разобраться в том, что такое коды и как их можно интерпретировать.

Читать дальше →

+32

tagir_valeev 2 ноя 2013 в 18:37

Нескучные интегралы

6 мин

175K

Математика*

Некоторые из вас, вероятно, видали на просторах сети эту задачку: какое число продолжает следующий ряд?

Предлагался такой очевидный правильный ответ:

Для тех, кому неочевидно, как он получен, предлагалось объяснение. Пусть

(ну и 1 при x = 0, хотя неважно). Тогда каждый член ряда — это значение следующего интеграла в цепочке:

Пока всё идёт хорошо, но тут внезапно:

В принципе, этого достаточно, чтобы повеселить друзей-математиков, но мне захотелось узнать, как вообще считаются такие интегралы и почему получается такой смешной результат. Если кому-то ещё охота тряхнуть стариной и вспомнить матан с функаном, прошу читать дальше.

Читать дальше →

+243

jzha 23 окт 2016 в 23:49

Выборы-2016. Часть 2 — удивительное рядом и оно разрешено

4 мин

27K

Data Mining*R*Открытые данные*Визуализация данных*

В первой части статьи о выборах 2016 года шла речь о результатах в 225 избирательных округах. В этот раз рассмотрим данные о результатах голосования по участковым избирательным комиссиям (УИК), которых насчитывалось чуть менее 100 тысяч. Этот уровень детализации позволяет увидеть неожиданные явления и удивительные закономерности в результатах голосования.

Читать дальше →

+81

jzha 23 окт 2016 в 23:45

Выборы-2016. Часть 1 — результаты и сравнения

3 мин

17K

Data Mining*R*Открытые данные*Визуализация данных*

В сентябре прошли выборы в Госдуму РФ VII созыва. При голосовании вся территория России была разделена на 225 округов. В каких округах каждая из партий получила высокие (или низкие) результаты? Какие значения принимала явка избирателей и как она влияла на результаты партий? Ответы на эти вопросы и ряд других наблюдений представлены в этой публикации.

Читать дальше →

+42

Mariakozlova 18 окт 2016 в 13:09

Как найти поддомены за считанные минуты?

4 мин

160K

IT-инфраструктура*Сетевые технологии*Серверное администрирование*DNS*Блог компании HOSTING.cafe

Recovery Mode

Перевод

Поиск поддоменов — неотъемлемая часть подготовки ко взлому, а благодаря некоторым инструментам противостояние этим действиям стало намного проще.

Незащищенные поддомены подвергают вашу деятельность серьезной опасности, а в последнее время произошел целый ряд инцидентов, при которых взломщики воспользовались поддоменами для обхода защиты.

В случае последнего из череды инцидентов весь код сайта Vine можно было загрузить с незащищенного поддомена.

Если вы владелец сайта или изучаете вопросы информационной безопасности, вы можете воспользоваться следующими инструментами чтобы найти поддомены любого домена.

Читать дальше →

+25

AloneCoder 6 окт 2016 в 13:18

Подводные камни Bash

32 мин

96K

Совершенный код*Блог компании VKIT-стандарты*Отладка*

Перевод

В этой статье мы поговорим об ошибках, совершаемых программистами на Bash. Во всех приведённых примерах есть какие-то изъяны. Вам удастся избежать многих из нижеописанных ошибок, если вы всегда будете использовать кавычки и никогда не будете использовать разбиение на слова (wordsplitting)! Разбиение на слова — это ущербная легаси-практика, унаследованная из оболочки Bourne. Она применяется по умолчанию, если вы не заключаете подстановки (expansions) в кавычки. В общем, подавляющее большинство подводных камней так или иначе связаны с подстановкой без кавычек, что приводит к разбиению на слова и глоббингу (globbing) получившегося результата.

Содержание

Читать дальше →

+139

anastasiagrishina 5 окт 2016 в 18:21

Обзор курсов по Deep Learning

11 мин

70K

Data Mining*Big Data*Блог компании New Professions LabМашинное обучение*

Привет, Хабр! Последнее время все больше и больше достижений в области искусственного интеллекта связано с инструментами глубокого обучения или deep learning. Мы решили разобраться, где же можно научиться необходимым навыкам, чтобы стать специалистом в этой области.

Читать дальше →

+44

aigame 5 окт 2016 в 18:28

Структура и стартовые настройки мозга

13 мин

33K

Искусственный интеллектМозг

Знание того как работает нейрон недостаточно для понимания того, чем обусловлено разумное и интеллектуальное поведение. Эволюция совершила удивительное мастерство, создав систему из относительно простых элементов, способную поразить невероятной успешностью во взаимодействии с окружающей средой. Недостаточно взять некую массу связанных нейронов (даже сложив слоями) подключить к ней датчики и выводы и получить хоть какое-то подобие мозга. Главным полем работы эволюции на протяжении миллионов лет является не нейрон, а структура и внутренняя организация нервных клеток в нервной системе.

В предыдущей части мы говорили о структуре коры мозжечка и на его примере видно, что структура и организация является фундаментальной для его функций. Давайте разберемся в том, как организована кора больших полушарий, структура благодаря которой Человек стал самым успешным видом на Земле.

Читать дальше →

+23

JamaGava 30 сен 2016 в 10:46

«Правда, чистая правда и статистика» или «15 распределений вероятности на все случаи жизни»

15 мин

253K

Занимательные задачкиАнализ и проектирование систем*Алгоритмы*Математика*

Туториал

Статистика приходит к нам на помощь при решении многих задач, например: когда нет возможности построить детерминированную модель, когда слишком много факторов или когда нам необходимо оценить правдоподобие построенной модели с учётом имеющихся данных. Отношение к статистике неоднозначное. Есть мнение, что существует три вида лжи: ложь, наглая ложь и статистика. С другой стороны, многие «пользователи» статистики слишком ей верят, не понимая до конца, как она работает: применяя, например, тест Стьюдента к любым данным без проверки их нормальности. Такая небрежность способна порождать серьёзные ошибки и превращать «поклонников» теста Стьюдента в ненавистников статистики. Попробуем поставить точки над i и разобраться, какие модели случайных величин должны использоваться для описания тех или иных явлений и какая между ними существует генетическая связь.

Читать дальше →

+33

xbox 26 сен 2016 в 13:26

Дешевые авиабилеты… Или сеть мошеннических сайтов, ворующих деньги с карт. Мое расследование

20 мин

186K

Управление e-commerce*Финансы в IT

Из песочницы

В этой публикации речь пойдет о целой сети мошеннических сайтов, которые на протяжении долгого времени работают с единственной целью — похитить данные банковских карт и увести все доступные денежные средства с этих карт. В этой схеме используются на разных этапах сервисы известных компаний и банков. Таких как Яндекс (Поиск, Директ, YandexMoney, Карты), Промсвязьбанк, Банк Тинькофф и, вероятно, других.

История эта началась совсем недавно. Всего пять дней назад и, можно сказать, что пока еще не закончилась. Один мой знакомый обратился ко мне за консультацией с вопросом, можно ли как-нибудь закрыть «нехороший сайт»…

Итак, что же случилось?

Мой знакомый захотел купить авиабилеты и решил, что самый простой для этого способ — задать вопрос Яндексу. На простой запрос типа «самые дешевые билеты в Анапу» Яндекс одну из первых ссылок выдал на некий сайт, который служит для поиска и покупки дешевых билетов без комиссии. Ссылка эта, вероятно, была в верхнем рекламном блоке. Перейдя по ссылке, мой знакомый нашел себе подходящие билеты, оформил заказ, и попал на страницу оплаты с помощью банковской карты…

Читать дальше →

+210

gonzazoid 24 сен 2016 в 14:57

Определяем Phantom-ных ботов

6 мин

19K

Recovery Mode

» Перевод статьи Detecting PhantomJS Based Visitors | Неплохое обсуждение статьи на Hacker News

Статья старая, помидорами не кидайтесь — лучше делитесь опытом в комментариях.

В наши дни во многих инцидентах по безопасности используется автоматизация (со стороны злоумышленников). Web-scraping, повторное использование паролей, click-fraud — все это совершается злоумышленниками в попытках (зачастую успешных) замаскироваться под обычного пользователя, то есть по сути выглядеть для сервера как броузер обычного пользователя. Как владелец сайта, вы наверно хотите быть уверены в том что обслуживаете людей а не бездушные железки, а как поставщик сервиса вы наверно хотите еще и доступ дать к своему контенту через api, а не через тяжелый и глючный web-интерфейс.

Читать дальше →

+36

alizar 22 сен 2016 в 17:22

На некоторые ноутбуки c Windows 10 нельзя поcтавить Linux

4 мин

56K

Ноутбуки

Компания Microsoft официально декларирует политику «любви» к Linux и свободному программному обеспечению. Компания периодически публикует исходные коды своих программ, внедрила подсистему Linux в ядро Windows. У Microsoft рекордное количество помощников на Github, по этому показателю она вышла на 1-е место, опередив Facebook, Docker и Google.

Тем не менее, очистить свою репутацию и начать жизнь с чистого листа не так просто. Из памяти людей ещё не стёрлись воспоминания об ужасных поступках компании в те времена, когда у руля стоял Стив Балмер. Да и сейчас не всё гладко: Microsoft продолжает вымогать лицензионные отчисления у производителей устройств под Android, предъявляя сомнительные «патенты на Linux», заставляя производителей предустанавливать проприетарный софт от Microsoft. Последней жертвой такой политики месяц назад стала компания Lenovo, которая обязалась предустановить на смартфоны программы Microsoft Office, OneDrive и Skype.

Неудивительно, что в этой ситуации некоторые пользователи подозревают Microsoft в «нечестной игре».

Читать дальше →

+23

marks 17 сен 2016 в 23:41

Ученые впервые составили 3D-модель мозга дрозофилы

4 мин

16K

Научно-популярное

Чернобрюхая дрозофила (источник: geo.ru)

Изучение нервной системы человека и животных ведется учеными сотни лет. Конечно, за это время человек гораздо лучше стал понимать принцип работы отдельных нервных клеток и всей системы, из которых она состоит. Но до полного понимания еще далеко.

Изучение ведется по принципу «от простого к сложному»: если нет возможности сразу понять то, как работает, например, мозг человека, то специалисты занимаются изучением мозга более простых существ. Ученые из Университета Токай выбрали в качестве объекта для изучения мозг дрозофилы.

+18

2