Статьи / Закладки / Профиль varagian / Хабр

Как стать автором

Сергей Парамонов @varagian

Data Scientist, PhD in AI

Профиль Публикации 36Комментарии 404Закладки 270

wunder_editor 6 дек 2016 в 15:02

Особенности Jupyter Notebook, о которых вы (может быть) не слышали

10 мин

365K

Блог компании Wunder FundPython*Программирование*

Перевод

Jupyter Notebook – это крайне удобный инструмент для создания красивых аналитических отчетов, так как он позволяет хранить вместе код, изображения, комментарии, формулы и графики:

Ниже мы расскажем о некоторых фишках, которые делают Jupyter очень крутым. О них можно прочитать и в других местах, но если специально не задаваться этим вопросом, то никогда и не прочитаешь.

Читать дальше →

+41

anastasiagrishina 5 окт 2016 в 18:21

Обзор курсов по Deep Learning

11 мин

70K

Блог компании New Professions LabBig Data*Data Mining*Машинное обучение*

Привет, Хабр! Последнее время все больше и больше достижений в области искусственного интеллекта связано с инструментами глубокого обучения или deep learning. Мы решили разобраться, где же можно научиться необходимым навыкам, чтобы стать специалистом в этой области.

Читать дальше →

+44

Milfgard 24 ноя 2016 в 09:51

Почему настольные игры столько стоят – или настолка своими руками

11 мин

90K

Блог компании МосиграБизнес-модели*Управление продуктом*Управление проектами*

Вырубка карт. Интересна пыль: она на бумажном производстве покрывает всё очень быстро.

Меня уже много раз спрашивали, как коробка резанного картона может стоить 1500 рублей. Что в ней такого?

Цену любого товара можно посчитать тремя способами:

От цепочки формирования, то есть отталкиваясь от затрат на разработку и производство — это нижний ограничитель.
От экономики — сколько человек готов заплатить, и какую цену можно ставить, пока не сожрут конкуренты (это верхний ограничитель, он же показывает, в какую стоимость производства мы должны укладываться).
И от стоимости аналогов-заменителей. В нашем случае кустарного производства. То есть изготовления настольной игры своими руками.

Вы будете чудовищно удивлены, когда придёте с макетами в типографию и попросите их напечатать. У нас три экземпляра игры к выставке получаются за 20 тысяч. Сейчас объясню, почему.

Читать дальше →

+129

Leono 20 ноя 2016 в 17:43

Деконструкция мифа о глубоком обучении. Лекция в Яндексе

13 мин

39K

Блог компании ЯндексАлгоритмы*Математика*Машинное обучение*

Оптимизм по поводу нейронных сетей разделяют не все — или, по крайней мере, уровень такого оптимизма бывает разным. Старший преподаватель факультета компьютерных наук ВШЭ Сергей Бартунов согласен, что нейросетевая область сейчас на подъеме. С другой стороны, он хочет внести в происходящее некоторую ясность, определить реальный потенциал нейросетей. Вне зависимости от точки зрения докладчика, глубокое обучение и правда не проникает в нашу сферу совсем уж стремительными темпами. Традиционные методы обучения всё ещё работают и не обязательно будут вытеснены машинным интеллектом в ближайшей будущем.

Под катом — расшифровка лекции и часть слайдов Сергея.

+79

Leono 6 ноя 2016 в 13:47

Синтез изображений с помощью глубоких нейросетей. Лекция в Яндексе

15 мин

49K

Блог компании ЯндексОбработка изображений*Занимательные задачкиАлгоритмы*

Пусть в блоге Яндекса на Хабрахабре эта неделя пройдет под знаком нейронных сетей. Как мы видим, нейросети сейчас начинают использоваться в очень многих областях, включая поиск. Кажется, что «модно» искать для них новые сферы применения, а в тех сферах, где они работают уже какое-то время, процессы не такие интересные.

Однако события в мире синтеза визуальных образов доказывают обратное. Да, компании еще несколько лет назад начали использовать нейросети для операций с изображениями — но это был не конец пути, а его начало. Недавно руководитель группы компьютерного зрения «Сколтеха» и большой друг Яндекса и ШАДа Виктор Лемпицкий рассказал о нескольких новых способах применения сетей к изображениям. Поскольку сегодняшняя лекция — про картинки, то она очень наглядная.

Под катом — расшифровка и большинство слайдов.

+81

xopxe 31 окт 2016 в 15:40

[ В закладки ] Зоопарк архитектур нейронных сетей. Часть 2

8 мин

40K

Блог компании Wunder FundАлгоритмы*Машинное обучение*

Перевод

Публикуем вторую часть статьи о типах архитектуры нейронных сетей. Вот первая.

За всеми архитектурами нейронных сетей, которые то и дело возникают последнее время, уследить непросто. Даже понимание всех аббревиатур, которыми бросаются профессионалы, поначалу может показаться невыполнимой задачей.

Поэтому я решил составить шпаргалку по таким архитектурам. Большинство из них — нейронные сети, но некоторые — звери иной породы. Хотя все эти архитектуры подаются как новейшие и уникальные, когда я изобразил их структуру, внутренние связи стали намного понятнее.

Читать дальше →

+36

s_suhanov 17 окт 2016 в 07:08

Xcode: наверное, лучший способ работы со сторибордами

5 мин

50K

Xcode*Разработка под iOS*

Этот пост является вольным переводом статьи Xcode: A Better Way to Deal with Storyboards by Stan Ostrovskiy

Некоторые примеры кода в оригинальной статье устарели (ввиду выхода Swift 3) и в переводе были изменены.

Советы и рекомендации по работе с Interface Builder.

Apple серьезно улучшили Interface Builder в новом Xcode 8. Использование size classes стало более интуитивным, возможность масштабирования сториборда — очень удобной, а полное превью прям в Interface Builder — просто великолепным. Для тех у кого были сомнения насчет использования Interface Builder, это может стать хорошими плюсами.

С другой стороны, у многих разработчиков все еще есть некоторые проблемы с Interface Builder когда они создают большие многоэкранные приложения со сложной навигацией.

В этой статье я поделюсь некоторыми из лучших практик для работы со сторибордами в вашем проекте. Вы уже пользуетесь Interface Builder, или только делаете первые шаги в этом направлении? — в любом случае, эти советы будут полезны для вас.

1. Если вы работаете в команде, используйте отдельный сториборд для каждого экрана. Даже если вы работаете один — это наверняка станет хорошей привычкой.

В вашем проекте есть один файл main.storyboard, который выглядит вот так?

С точки зрения дизайнера, все хорошо: полностью видно UI и навигацию. И это именно то, для чего Interface Builder и был создан.

Но для разработчика это несет множество проблем:

Читать дальше →

+22

mephistopheies 12 окт 2016 в 18:59

Обзор топологий глубоких сверточных нейронных сетей

18 мин

109K

Блог компании VKАлгоритмы*Математика*Машинное обучение*Обработка изображений*

Это будет длиннопост. Я давно хотел написать этот обзор, но sim0nsays меня опередил, и я решил выждать момент, например как появятся результаты ImageNet’а. Вот момент настал, но имаджнет не преподнес никаких сюрпризов, кроме того, что на первом месте по классификации находятся китайские эфэсбэшники. Их модель в лучших традициях кэгла является ансамблем нескольких моделей (Inception, ResNet, Inception ResNet) и обгоняет победителей прошлого всего на полпроцента (кстати, публикации еще нет, и есть мизерный шанс, что там реально что-то новое). Кстати, как видите из результатов имаджнета, что-то пошло не так с добавлением слоев, о чем свидетельствует рост в ширину архитектуры итоговой модели. Может, из нейросетей уже выжали все что можно? Или NVidia слишком задрала цены на GPU и тем самым тормозит развитие ИИ? Зима близко? В общем, на эти вопросы я тут не отвечу. Зато под катом вас ждет много картинок, слоев и танцев с бубном. Подразумевается, что вы уже знакомы с алгоритмом обратного распространения ошибки и понимаете, как работают основные строительные блоки сверточных нейронных сетей: свертки и пулинг.

Читать дальше →

+108

AloneCoder 6 окт 2016 в 13:18

Подводные камни Bash

32 мин

97K

Блог компании VKIT-стандарты*Отладка*Совершенный код*

Перевод

В этой статье мы поговорим об ошибках, совершаемых программистами на Bash. Во всех приведённых примерах есть какие-то изъяны. Вам удастся избежать многих из нижеописанных ошибок, если вы всегда будете использовать кавычки и никогда не будете использовать разбиение на слова (wordsplitting)! Разбиение на слова — это ущербная легаси-практика, унаследованная из оболочки Bourne. Она применяется по умолчанию, если вы не заключаете подстановки (expansions) в кавычки. В общем, подавляющее большинство подводных камней так или иначе связаны с подстановкой без кавычек, что приводит к разбиению на слова и глоббингу (globbing) получившегося результата.

Содержание

Читать дальше →

+139

Javian 6 мар 2015 в 17:56

[UPDATE] Возбуждено уголовное дело в отношении группы «Даурия Аэроспейс»

4 мин

46K

Космонавтика

Ярким представителем частного космоса в РФ является компания Даурия Аэроспейс, у которой есть свой блог на Хабре и об успехах которой не раз рассказывал здесь Zelenyikot. В портфеле заказов Даурии два геостационарных телекоммуникационных спутника для Индии и два аппарата ДЗЗ (дистанционного зондирования Земли) для Роскосмоса, которые должны быть введены в эксплуатацию в 2015 году.

Сегодня стало известно, что Главное следственное управление Следственного комитета РФ по Московской области возбудило уголовное дело по признакам преступления, предусмотренного ч. 4 ст. 159 УК РФ («Мошенничество в особо крупном размере»), совершенного в ходе выполнения опытно-конструкторской работы «Космическая платформа «Карат-200» (ОКР «Карат-200»). В центре уголовного дела — контракт между ФГУП «НПО имени Лавочкина» и ООО «Научно-производственное предприятие «Даурия». В уголовном деле упомянуты только две фамилии — гендиректора НПО имени Лавочкина Виктора Хартова и гендиректора Даурия Аэроспейс Сергея Иванова.

Читать дальше →

+44

Shestakov088 20 сен 2016 в 14:05

CIKM Cup 2016 – международное соревнование в области Data Science

6 мин

4.3K

Блог компании DCA (Data-Centric Alliance)Big Data*Занимательные задачки

Big Data наступают по всем фронтам — их роль растёт в науке, бизнесе, медицине, управлении безопасностью и в экономике. Поэтому каждая из сфер готова на на шутку бороться за лучшие умы специалистов. Среди самых удачных попыток найти самых-самых — важнейшее мировое соревнование в области анализа данных CIKM Cup 2016, который проходит в рамках 25-ой международной конференции CIKM Conf. 2016. Российская технологическая компания DCA, специализирующаяся на работе с большими данными и высоконагруженными системами, на этот раз стала партнером конференции и соревнования. DCA сформировала задачу, которую предстоит решить участникам CIKM Cup 2016, а также обеспечила необходимым набором данных для анализа. Хотите узнать немного больше о задаче и попробовать силы в соревнованиях Data Scientist — вам под кат. Кому как не нам знать, насколько сильны российские специалисты в сфере обработки данных.

Мы ищем своих Брюсов Уиллисов.

Читать дальше →

+18

Zalina 7 авг 2016 в 20:17

Самое главное о нейронных сетях. Лекция в Яндексе

30 мин

187K

Блог компании ЯндексАлгоритмы*Машинное обучение*Обработка изображений*Программирование*

Кажется, не проходит и дня, чтобы на Хабре не появлялись посты о нейронных сетях. Они сделали машинное обучение доступным не только большим компаниям, но и любому человеку, который умеет программировать. Несмотря на то, что всем кажется, будто о нейросетях уже всем все известно, мы решили поделиться обзорной лекцией, прочитанной в рамках Малого ШАДа, рассчитанного на старшеклассников с сильной математической подготовкой.

Материал, рассказанный нашим коллегой Константином Лахманом, обобщает историю развития нейросетей, их основные особенности и принципиальные отличия от других моделей, применяемых в машинном обучении. Также речь пойдёт о конкретных примерах применения нейросетевых технологий и их ближайших перспективах. Лекция будет полезна тем, кому хочется систематизировать у себя в голове все самые важные современные знания о нейронных сетях.

Константин klakhman Лахман закончил МИФИ, работал исследователем в отделе нейронаук НИЦ «Курчатовский институт». В Яндексе занимается нейросетевыми технологиями, используемыми в компьютерном зрении.

Под катом — подробная расшифровка со слайдами.

Читать дальше →

+130

Dreadatour 20 ноя 2013 в 03:02

Профилирование и отладка Python, инструменты

14 мин

110K

Блог компании VKPython*Django*

В предыдущей статье мы на практике разобрались, где и в каких случаях можно использовать ручное профилирование, а так же познакомились со статистическими профайлерами.

Сегодня мы познакомимся с основной и самой многочисленной группой инструментов — событийными профайлерами.

Приступим!

+66

sergeykorol 6 сен 2016 в 16:15

Почта России для чайников

6 мин

307K

Блог компании HFLabsЧитальный зал

Почта России — это большая, сложная и не очень дружественная структура. На неё принято плеваться в социальных сетях, а поход за письмом или посылкой часто превращается в маленький квест. Про такое говорят: «Жизнь меня к этому не готовила».

Хочешь отправить книжку в подарок другу. Приходишь в отделение, а уставшая женщина спрашивает: «Как отправляем, заказной бандеролью с объявленной ценностью или первым классом?». И ты понимаешь, что это будет посложнее высоконагруженных систем, больших данных и нейросетей.

Мы в «Дадате» сильно связаны с почтой: исправляем адреса и неплохо разбираемся в особенностях её работы. Написали подробный гид по услугам Почты России, для чайников. Автор статьи — Сергей Король, редактор и почтовый гик.

Почта. Инструкция по применению

+58

mephistopheies 9 авг 2016 в 15:59

Стилизация изображений с помощью нейронных сетей: никакой мистики, просто матан

14 мин

92K

Блог компании VKАлгоритмы*Математика*Машинное обучение*Обработка изображений*

Приветствую тебя, Хабр! Наверняка вы заметили, что тема стилизации фотографий под различные художественные стили активно обсуждается в этих ваших интернетах. Читая все эти популярные статьи, вы можете подумать, что под капотом этих приложений творится магия, и нейронная сеть действительно фантазирует и перерисовывает изображение с нуля. Так уж получилось, что наша команда столкнулась с подобной задачей: в рамках внутрикорпоративного хакатона мы сделали стилизацию видео, т.к. приложение для фоточек уже было. В этом посте мы с вами разберемся, как это сеть "перерисовывает" изображения, и разберем статьи, благодаря которым это стало возможно. Рекомендую ознакомиться с прошлым постом перед прочтением этого материала и вообще с основами сверточных нейронных сетей. Вас ждет немного формул, немного кода (примеры я буду приводить на Theano и Lasagne), а также много картинок. Этот пост построен в хронологическом порядке появления статей и, соответственно, самих идей. Иногда я буду его разбавлять нашим недавним опытом. Вот вам мальчик из ада для привлечения внимания.

Читать дальше →

+137

Bredun 15 июл 2016 в 10:38

Как искусственные ограничения помогают в работе

4 мин

38K

Блог компании Простая Наука

Не так давно поймал себя на мысли, что работая над проектом «Простая наука», будь то книги или видео для ТВ, я постоянно ставлю какие-то рамки внутри этих продуктов. Например, собираясь сесть за работу над очередной книгой, я сначала продумываю ее структуру. И это как бы понятно. Странно подходить к работе, не имея более-менее четкого плана или представления о нем.

Но дело в другом:

Читать дальше →

+13

jeston 29 июл 2016 в 16:17

5 книг для лета, которые советует прочитать Билл Гейтс

3 мин

44K

Профессиональная литература*

Билл Гейтс один из немногих по-настоящему известных в индустрии людей, который регулярно озвучивает свой список книг для чтения. Ему вторит молодой коллега — Марк Цукерберг — специально создавший в Facebook отдельное сообщество A Year of the Book, в котором сообща выбирают самую значимую книгу года. Также в интернете можно встретить и другие подборки литературы, которые тот или иной заметный в своей сфере человек считает важными, но, судя по всему, только от Билла Гейтса можно получить настоящую "обратную связь" и узнать, что предпочитает читать самый богатый человек на Земле. У бывшего главы Microsoft для этой цели есть личный блог, где он и описывает свои впечатления от новинок.

Эта публикация — вторая в серии. Ранее можно было узнать о тех шести книгах, которые Гейтс рекомендовал в 2015 году.

Читать дальше →

+25

XakepRU 8 июл 2016 в 11:51

Vulners — Гугл для хакера. Как устроен лучший поисковик по уязвимостям и как им пользоваться

9 мин

98K

Блог компании Журнал ХакерИнформационная безопасность*

Туториал

Часто нужно узнать всю информацию о какой-нибудь уязвимости: насколько найденный баг критичен, есть ли готовые сплоиты, какие вендоры уже выпустили патчи, каким сканером проверить наличие бага в системе. Раньше приходилось искать вручную по десятку источников (CVEDetails, SecurityFocus, Rapid7 DB, Exploit-DB, базы уязвимостей CVE от MITRE/NIST, вендорские бюллетени) и анализировать собранные данные. Сегодня эту рутину можно (и нужно!) автоматизировать с помощью специализированных сервисов. Один из таких — Vulners, крутейший поисковик по багам, причем бесплатный и с открытым API. Посмотрим, чем он может быть нам полезен.

Читать дальше →

+45

Alexey_mosc 29 июн 2016 в 01:37

Методические заметки об отборе информативных признаков (feature selection)

39 мин

22K

Блог компании Align Technology, R&DR*Data Mining*

Туториал

Всем привет!

Меня зовут Алексей Бурнаков. Я Data Scientist в компании Align Technology. В этом материале я расскажу вам о подходах к feature selection, которые мы практикуем в ходе экспериментов по анализу данных.

В нашей компании статистики и инженеры machine learning анализируют большие объемы клинической информации, связанные с лечением пациентов. В двух словах смысл этой статьи можно свести к извлечению ценных крупиц знания, содержащихся в небольшой доле доступных нам зашумленных и избыточных гигабайтов данных.

Данная статья предназначена для статистиков, инженеров машинного обучения и специалистов, которые интересуются вопросами обнаружения зависимостей в наборах данных. Также материал, изложенный в статье, может быть интересен широкому кругу читателей, неравнодушных к data mining. В материале не будут затронуты вопросы feature engineering и, в частности, применения таких методов как анализ главных компонент.

Источник.

Читать дальше →

+18

feriat 6 мая 2016 в 11:52

Meduza.io: а как же лайки?

5 мин

48K

Data Mining*Python*Визуализация данных*

Из песочницы

Как-то раз, читая новости на Медузе, я обратил внимание на то, что у разных новостей разное соотношение лайков из Facebook и ВКонтакте. Какие-то новости мегапопулярны на fb, а другими люди делятся только во ВКонтакте. Захотелось присмотреться к этим данным, попытаться найти в них интересные закономерности. Заинтересовавшихся приглашаю под кат!

Читать дальше →

+57

6

7 8 ...