Articles / Bookmarks / Profile of FeanorPk / Habr

How to become an author

User

Profile Publications Comments 3Bookmarks 68

buriy May 6 2019 at 21:36

Огромный открытый датасет русской речи

3 min

35K

Open source*Open data*Machine learning*Sound

Специалистам по распознаванию речи давно не хватало большого открытого корпуса устной русской речи, поэтому только крупные компании могли позволить себе заниматься этой задачей, но они не спешили делиться своими наработками.

Мы торопимся исправить это годами длящееся недоразумение.

Итак, мы предлагаем вашему вниманию набор данных из 4000 часов аннотированной устной речи, собранный из различных интернет-источников.

Подробности под катом.

Читать дальше →

+91

nanton Jun 14 2018 at 13:39

Чему я научился, пройдя множество собеседований в компаниях и стартапах из сферы ИИ

14 min

38K

Studying in ITIT careerInlyIT corporate blogArtificial Intelligence

Translation

За последние восемь месяцев я прошел собеседования в самых разных компаниях — DeepMind в Google, Wadhwani Institute of AI, Microsoft, Ola, Fractal Analytics и некоторых других — в основном на позиции Data Scientist, Software Engineer и Research Engineer. По ходу дела мне предоставлялись возможности не только пообщаться со многими талантливыми людьми, но также по-новому взглянуть на себя с пониманием того, что хотят услышать работодатели, когда беседуют с кандидатами. Думаю, если бы я располагал этой информацией раньше, то мог бы избежать многих ошибок и подготовиться к собеседованиям куда лучше. Это и стало импульсом к написанию данной статьи — возможно, она поможет кому-нибудь получить работу мечты.

В конце концов, если уж собираешься две трети своего времени (если не больше) проводить за работой, она должна быть этого достойна.

Читать дальше →

+12

VVLADOSS Dec 19 2017 at 17:45

Гиппократ и IT. Что же между ними общего?

4 min

3.2K

Research and forecasts in IT*E-commerce management*Legislation in IT

Проблема

Существует множество решений, которые мы совершаем в нашей жизни. Некоторые из них довольно незначительны, например, какую одежду одеть утром или какой купить сок сегодня вечером в магазине. Но есть одно важное решение, которое мы не можем принять самостоятельно – выбор того, в каком теле родиться и жить. Случается так, что человек живет в теле, в котором уже заложены множественные недуги и неизбежные болезни. Состояние здоровья напрямую связано с жизнью человека. Именно поэтому тема здоровья и здравоохранения всегда была и остается актуальной. Отрасль нуждается в постоянных реформах и преобразованиях.

Читать дальше →

+12

ZlodeiBaal Aug 11 2014 at 02:28

Увидеть незримое

8 min

92K

Algorithms*Image processing*

Tutorial

Пару лет назад на Хабре проскакивало две статьи, в которых упоминался интересный алгоритм. Статьи, правда, были написаны нечитабильно. В стилистике «новости»(1, 2), но ссылка на сайт присутствовала, подробно можно было разобраться на месте (алгоритм за авторством MIT). А там была магия. Абсолютно волшебный алгоритм, позволяющий увидеть незримое. Оба автора на Хабре этого не заметили и сфокусировались на том, что алгоритм позволял увидеть пульс. Пропустив самое главное.

Алгоритм позволял усиливать движения, невидные глазу, показать вещи, которые никто никогда не видел живьём. Видео чуть выше – презентация c сайта MIT второй части алгоритма. Микросаккады, которые приведены начиная с 29ой секунды, раньше наблюдались только как отражения установленных на зрачках зеркалах. А тут они видны глазами.
Пару недель назад я опять натолкнулся на те статьи. Мне сразу стало любопытно: а что народ сделал за эти два года готового? Но… Пустота. Это определило развлечение на следующие полторы недели. Хочу сделать такой же алгоритм и разобраться, что с ним можно сделать и почему его до сих пор нет в каждом смартфоне, как минимум для измерения пульса.

В статье будет много матана, видео, картинок, немного кода и ответы на поставленные вопросы.

Читать дальше →

+175

Siarshai Jan 4 2017 at 14:18

Методы оптимизации нейронных сетей

17 min

213K

Algorithms*Mathematics*Machine learning*

В подавляющем большинстве источников информации о нейронных сетях под «а теперь давайте обучим нашу сеть» понимается «скормим целевую функцию оптимизатору» лишь с минимальной настройкой скорости обучения. Иногда говорится, что обновлять веса сети можно не только стохастическим градиентным спуском, но безо всякого объяснения, чем же примечательны другие алгоритмы и что означают загадочные $\inline \beta$ и $\inline \gamma$ в их параметрах. Даже преподаватели на курсах машинного обучения зачастую не заостряют на этом внимание. Я бы хотел исправить недостаток информации в рунете о различных оптимизаторах, которые могут встретиться вам в современных пакетах машинного обучения. Надеюсь, моя статья будет полезна людям, которые хотят углубить своё понимание машинного обучения или даже изобрести что-то своё.

Под катом много картинок, в том числе анимированных gif.

Читать дальше →

+78

beliakov Sep 20 2016 at 11:55

Как определить знак зодиака с абсолютной точностью?

3 min

253K

Popular scienceAstronomy

На волне ажиотажа по поводу "паники в женских журналах", хотелось бы поглубже копнуть такой несерьезный вопрос как определение знака зодиака. Давайте временно закроем глаза на то, что "астрология — не наука" и знак зодиака — "не созвездие". Просто попробуем с серьезным видом разобраться, какие факторы надо учесть, чтобы абсолютно точно определить, в каком созвездии находилось Солнце в момент рождения человека.

Космополитан публикует реальную таблицу знаков гороскопа с поправками на прецессию, по состоянию на 2016 год:

Козерог: 20 января — 16 февраля
Водолей: 16 февраля — 11 марта
Рыбы: 11 марта — 18 апреля
Овен: 18 апреля — 13 мая
Телец: 13 мая — 21 июня
Близнецы: 21 июня — 20 июля
Рак: 20 июля — 10 августа
Лев: 10 августа — 16 сентября
Дева: 16 сентября — 30 октября
Весы: 30 октября — 23 ноября
Скорпион: 23 ноября — 29 ноября
Змееносец: 29 ноября — 17 декабря
Стрелец: 17 декабря — 20 января

Это все здорово, но как быть тем, кто родился в переходный день, например, 16 сентября? Лев он или Дева?

Читать дальше →

+33

dima117 Dec 23 2016 at 17:24

Умный дом на .NET — релиз ThinkingHome 3.0

4 min

20K

Привет! Сегодня я наконец-то могу поделиться с вами результатами своей работы на протяжении последних двух лет! Вчера вечером я выпустил новую версию 3.0 системы управления умным домом ThinkingHome.

ThinkingHome — это программа (.NET Windows service), с помощью которой вы можете организовать на своем компьютере управляющий центр умного дома. Это центр, который дружит между собой "железки" с разными интерфейсами от разных производителей, позволяет автоматизировать работу с ними (писать скрипты на JavaScript) и управлять всем этим хозяйством через веб-интерфейс.

Под катом более подробное описание системы, список изменений в новой версии и небольшое объявление для тех, кто ненавидит Windows :)

Читать дальше →

+23

murr Oct 20 2016 at 13:47

Глупый дом

24 min

69K

Краткое предисловие

TLDR: переходите сразу к заключению!

Когда я читаю многочисленные статьи про автоматизацию дома на непрофильных ресурсах (вроде Хабра), меня постоянно гложет мысль о том, что представление об умном доме у разных людей очень сильно расходятся. Когда передо мною стала задача проектирования собственного дома и я заинтересовался связанными с проектированием индивидуальных жилых домов темами (отоплением, электрикой, водоснабжением и т.д) — расхождение во взглядах на мир еще более усилилось.

Многословное введение

В данной заметке мне бы хотелось поделиться некоторыми своими взглядами на существующее положение вещей в сфере домашней автоматизации и, возможно, побудить читателя переосмыслить некоторые «базовые» на сегодняшний день идеи, связанные с этой темой.

Сразу хочу отметить, что:
во-первых — являюсь дилетантом во всем, что связанно с хардварной частью реализации умных домов;
во-вторых — описываю положение вещей с точки зрения потребителя из среднего класса, не касаясь дорогих и ультра-дорогих решений из премиум сегмента, которые лишены как большинства указанных мною в заметке недостатков, так и резона их покупать в случаях, если у вас нет лишних ста тысяч долларов;
в-третих — я не пытаюсь вам ничего навязать, продать или пропиарить какой-то сервис;
в-четвертых — в статье много текста

и всего одна картинка

+72

olemskoi May 16 2017 at 08:12

Из инженеров в руководители: сохранение технических навыков

7 min

19K

Слёрм corporate blogDevelopment Management*Project management*IT career

Translation

Я стал техническим руководителем около двух лет назад. За это время одной из самых сложных задач оказалось нахождение баланса между обязанностями руководителя и желанием программировать.

Похоже, я не единственный, кто столкнулся с такого рода трудностями, поэтому думаю, что стоит добавить в обсуждение этого вопроса и мои пять копеек.

Читать дальше →

+32

AlexeyNadezhin Feb 20 2017 at 20:59

Могучий малыш — TrueRMS мультиметр Aneng AN8001

2 min

55K

LampTest corporate blogGadgetsComputer hardware

Несколько лет назад невозможно было себе представить, что TrueRMS-мультиметр с автоматическим переключением диапазонов, способный измерять постоянное и переменное напряжение, постоянный и переменный ток, сопротивление, ёмкость и частоту с 6000 отсчётами и 0.5-процентной точностью может стоить меньше 15 долларов. Сегодня этот прибор у меня в руке.

Читать дальше →

+29

AloneCoder Feb 1 2017 at 18:13

Архитектура микросервисов

18 min

258K

High performance*Website development*VK corporate blogDesigning and refactoring*Microservices*

Translation

К сожалению, у меня нет опыта работы с микросервисами, но около года назад я очень активно интересовался этой темой и изучил все источники информации, какие смог найти. Я просмотрел несколько выступлений на конференциях, прочитал несколько статей очень авторитетных и опытных специалистов вроде Мартина Фаулера, Фреда Джорджа, Эдриана Кокрофта и Криса Ричардсона, чтобы как можно больше узнать о микросервисах. Эта статья — результат моих изысканий.

+71

Karaoke Oct 25 2016 at 13:51

Как объяснить бабушке, что такое Agile за 15 минут с картинками

7 min

1.2M

Development Management*Edison corporate blogProject management*Agile*Product Management*

Translation

«Любое дело всегда длится дольше, чем ожидается, даже если учесть закон Хофштадтера.»
— закон Хофштадтера

Самый просматриваемый ролик на YouTube по теме agile. 744 625 просмотров на момент публикации данной статьи. Легкий стиль изложения, картинки и всего 15 минут — лучшее что я видел. TED отдыхает.

+54

xopxe Oct 26 2016 at 19:44

[ В закладки ] Зоопарк архитектур нейронных сетей. Часть 1

10 min

92K

Algorithms*Machine learning*Wunder Fund corporate blog

Translation

Это первая часть, вот вторая.
За всеми архитектурами нейронных сетей, которые то и дело возникают последнее время, уследить непросто. Даже понимание всех аббревиатур, которыми бросаются профессионалы, поначалу может показаться невыполнимой задачей.

Поэтому я решил составить шпаргалку по таким архитектурам. Большинство из них — нейронные сети, но некоторые — звери иной породы. Хотя все эти архитектуры подаются как новейшие и уникальные, когда я изобразил их структуру, внутренние связи стали намного понятнее.

Читать дальше →

+49

wirex Oct 10 2016 at 13:15

Музыкальная теория для гиков

17 min

120K

Professional literature*Wirex corporate blogSound

Translation

Кто-то считает музыку уделом избранных талантов, кто-то — набором физических закономерностей. Автор материала делает попытку объяснить знакомые каждому музыкальные термины, такие как тон, интервал, амплитуда, нота, октава, партитура, аккорд и так далее с помощью расчетов и технических обоснований. Ниже перевод оригинального текста.

Я ничего не знаю о музыке. Я знаю, что в музыке есть знаковые обозначения, но иногда у них вырастают закорючки. Я знаю, что увеличение октавы удваивает высоту звука. Я знаю, что для того, чтобы написать песню в стиле поп достаточно всего четырех аккордов. Вот, пожалуй, и все.

Все остальные правила для меня выглядят совершенно, ну просто абсолютно произвольно. Почему у нас есть 12 нот, но для их обозначения применяются только 7 букв? Откуда взялись знаки при ключе? Почему ни одну статью по музыке в Википедии просто невозможно понять, не прочитав сперва все остальные?

Читать дальше →

+101

marked-one Nov 13 2014 at 11:36

Лицензия для вашего open-source проекта

98 min

181K

В этой статье я хочу немного поговорить об авторском праве и свободных лицензиях на ПО. Текст является результатом самостоятельного выбора лицензий и их применения к своим проектам.

Статья будет полезна тем, кто хочет:

— в общих чертах понять, что такое авторское право (но лучше обратиться к юристу);
— подобрать свободную лицензию для своего проекта;
— разобраться, что нужно писать в шапке файла исходного кода.

Читать дальше →

+128

infotanka Sep 28 2016 at 12:48

Алгоритм визуализации сложных данных

9 min

26K

Data visualization*Лаборатория данных corporate blog

Tutorial

За три года существования Лаборатория данных выпустила около тридцати интерактивных визуализаций, в формате заказных, собственных проектов и бесплатных советов. Мы в лаборатории визуализируем финансовые и научные данные, данные городской транспортной сети, результаты забегов, эффективность маркетинговых кампаний и многое другое. Весной мы получили бронзовую медаль на престижной премии Malofiej 24 за визуализацию результатов Московского марафона.

Последние полгода я работаю над алгоритмом визуализации данных, который систематизирует этот опыт. Моя цель — дать рецепт, который позволит разложить любые данные по полочкам и решать задачи по визуализации данных также чётко и последовательно, как математические задачи. В математике не важно, складывать яблоки или рубли, распределять кроликов по ящикам или бюджеты на рекламные кампании — есть стандартные операции сложения, вычитания, деления и т.д. Я хочу создать универсальный алгоритм, который поможет визуализировать любые данные, при этом учитывает их смысл и уникальность.

Я хочу поделиться с читателями Хабра результатами своих исследований.

Читать дальше →

+70

Milfgard Apr 1 2015 at 09:50

Вы неправильно пишете животных

5 min

358K

Abnormal programming*Website development*Mobile applications testing*

Животные – это платформы с очень ограниченной памятью, вычислительными способностями и возможностями модификаций. Разработчикам энимал-сцены приходится выдавать практически гениальные низкоуровневые алгоритмы. Правда, большое количество хардкода вызывает характерные проблемы с отсутствием проверки в экзотических условиях. Та же фильтрация входных данных делается очень и очень криво.

Уязвимость рекурсивных алгоритмов навигации муравья: спираль смерти

Не знаю, кто писал большую часть птиц, но я хочу обратить внимание на особенность, позволяющую провести инъекцию произвольного яйца в гнездо. Дело в том, что птица проверяет только расположение и количество яиц, но не их хэши. В 20% случаев кукушка, эксплуатирующая этот баг, может внести яйцо с сохранением контрольной суммы, чего вполне достаточно для повышения прав в гнезде.

Но пойдём далее. Я не знаю, кто разрабатывал архитектуру ящериц, но они бегают в одном процессе, а дышат в другом. При этом платформа не поддерживает многозадачность, поэтому костыль с максимальной длиной бега в 4-6 секунд просто эпичен.

Читать дальше →

+434

Milfgard Sep 22 2016 at 09:48

IMHO, как писать на Хабр

10 min

38K

Мосигра corporate blogProject management*Community management*

Акронис на прошлой неделе попросил меня рассказать про опыт на Хабре. После семинара я обещал выложить основные тезисы. Возможно, вы найдёте что-то полезное ниже.

Итак, Хабр, по моему мнению, это сейчас самая большая площадка Рунета для образованных людей. Сами по себе посты очень хорошо читаются, и это одна из главных сторон. Можно охватить порядка шести миллионов разных людей за пару лет.

При этом активных (голосующих) пользователей всего около 3 тысяч. Уровень знаний аудитории на входе в пост — в примерно 95% случаев низкий, в 5% — экспертный (разбиение оценочное). Проще говоря, есть люди, которые вообще не понимают, что вы хотите сказать (и их большинство), и есть те, кто разбирается в теме на голову лучше вас. Поэтому лучший пост — это тот, что проходит от ликбеза к хардкору. На площадке довольно высокий уровень агрессии (точнее, желания проверить материал на прочность). Ранее был экстремально высок. Средняя или низкая внимательность читателя (ранее была высокая).

Разумеется, это всё моё личное мнение, и можно поспорить. Сейчас постараюсь объяснить, почему я так считаю, и как это влияет на посты. Я основываюсь на опыте примерно 1500 постов за 6 лет, которые написал сам или помогал готовить.

Но начнём с численных показателей. Вот эти компании так или иначе вызвали мой интерес тем, что для них работают агентства или выделенный инхаусный пиар:

^{Данные тут на конец августа, я их к другому семинару (в Хабре для владельцев блогов) готовил.}

Читать дальше →

+164

BarakAdama Jun 8 2016 at 13:00

Будущее браузеров и искусственный интеллект. Дзен в Яндекс.Браузере

8 min

61K

Яндекс corporate blogBrowsersMachine learning*

В будущем, как нам кажется, все популярные браузеры выйдут за рамки программ для открытия веб-страниц и научатся лучше понимать людей, которые ими пользуются. Сегодня я расскажу вам, каким мы видим это будущее на примере персональной ленты Дзен в Яндекс.Браузере, которая теперь доступна пользователям Windows, Android и iOS.

Несмотря на кажущуюся простоту, в основе Дзена лежат довольно сложные технологии. Я расскажу немного о том, как это реализовано у нас, где и почему мы использовали традиционное машинное обучение, а где — нейронные сети и искусственный интеллект, и буду благодарен за ваше мнение об этом подходе.

Читать дальше →

+47

ilya-chumakov Apr 6 2016 at 12:08

Hangfire — планировщик задач для .NET

7 min

77K

Hangfire design

Изображение с hangfire.io

Hangfire — многопоточный и масштабируемый планировщик задач, построенный по клиент-серверной архитектуре на стеке технологий .NET (в первую очередь Task Parallel Library и Reflection), с промежуточным хранением задач в БД. Полностью функционален в бесплатной (LGPL v3) версии с открытым исходным кодом. В статье рассказывается, как пользоваться Hangfire.

План статьи:

Принципы работы
Внутренности и возможности Hangfire-сервера
Повторяемые и отложенные задачи
Микрообзор Quartz.NET
Про (не)нагрузочное тестирование
Выводы. Опрос.

Читать дальше →

+11

1