Articles / Bookmarks / Profile of rimsleur / Habr

@rimsleur

User

Profile Publications 2Comments 153Bookmarks 40

xopxe Jan 13 2016 at 18:10

Shazam: алгоритмы распознавания музыки, сигнатуры, обработка данных

13 min

159K

Wunder Fund corporate blogProgramming*Java*Algorithms*

Translation

В ресторане заиграла почти забытая песня. Вы слушали её в далёком прошлом. Сколько трогательных воспоминаний способны вызвать аккорды и слова… Вы отчаянно хотите послушать эту песню снова, но вот её название напрочь вылетело из головы! Как быть? К счастью, в нашем фантастическом высокотехнологичном мире есть ответ на этот вопрос.

У вас в кармане лежит смартфон, на котором установлена программа для распознавания музыкальных произведений. Эта программа – ваш спаситель. Для того чтобы узнать название песни, не придётся ходить из угла в угол в попытках выудить из собственной памяти заветную строчку. И ведь не факт, что это получится. Программа, если дать ей «послушать» музыку, тут же сообщит название композиции. После этого можно будет слушать милые сердцу звуки снова и снова. До тех пор, пока они не станут с вами единым целым, или – до тех пор, пока вам всё это не надоест.

Мобильные технологии и невероятный прогресс в области обработки звука дают разработчикам алгоритмов возможность создавать приложения для распознавания музыкальных произведений. Одно из самых популярных решений такого рода называется Shazam. Если дать ему 20 секунд звучания, неважно, будет ли это кусок вступления, припева или часть основного мотива, Shazam создаст сигнатурный код, сверится с базой данных и воспользуется собственным алгоритмом распознавания музыки для того, чтобы выдать название произведения.

Как же всё это работает?

Читать дальше →

+52

ZlodeiBaal Jan 13 2016 at 03:36

Постановка задачи компьютерного зрения

13 min

72K

Website development*System Analysis and Design*Algorithms*Image processing*Machine learning*

Последние лет восемь я активно занимаюсь задачами, связанными с распознаванием образов, компьютерным зрением, машинным обучением. Получилось накопить достаточно большой багаж опыта и проектов (что-то своё, что-то в ранге штатного программиста, что-то под заказ). К тому же, с тех пор, как я написал пару статей на Хабре, со мной часто связываются читатели, просят помочь с их задачей, посоветовать что-то. Так что достаточно часто натыкаюсь на совершенно непредсказуемые применения CV алгоритмов.
Но, чёрт подери, в 90% случаев я вижу одну и ту же системную ошибку. Раз за разом. За последние лет 5 я её объяснял уже десяткам людей. Да что там, периодически и сам её совершаю…

В 99% задач компьютерного зрения то представление о задаче, которое вы сформулировали у себя в голове, а тем более тот путь решения, который вы наметили, не имеет с реальностью ничего общего. Всегда будут возникать ситуации, про которые вы даже не могли подумать. Единственный способ сформулировать задачу — набрать базу примеров и работать с ней, учитывая как идеальные, так и самые плохие ситуации. Чем шире база-тем точнее поставлена задача. Без базы говорить о задаче нельзя.

Тривиальная мысль. Но все ошибаются. Абсолютно все. В статье я приведу несколько примеров таких ситуаций. Когда задача поставлена плохо, когда хорошо. И какие подводные камни вас ждут в формировании ТЗ для систем компьютерного зрения.

Читать дальше →

+72

DuDDiTs Jan 8 2016 at 15:13

Как я написал компилятор C за 40 дней

19 min

70K

Compilers*C*

Translation

Предлагаю вам перевод дневника Руи Уэяма (Rui Ueyama), программиста из Google, который он вел во время работы над реализацией компилятора языка C около трех с половиной лет назад (но опубликовал только в минувшем декабре).
Этот дневник не несет какой-то практической пользы и не является туториалом, но мне было очень интересно его прочитать, надеюсь и вам эта история тоже понравится :)

Я написал C компилятор за 40 дней, который назвал 8cc. Это дневник написанный мной в то время. Код и его историю можно посмотреть на GitHub.

Читать дальше →

+64

tangro Jan 6 2016 at 12:17

Итоги 2015-го года для C++

5 min

34K

Инфопульс Украина corporate blogProgramming*C++*System Programming*Compilers*

Tutorial

Translation

Возможно, я скажу банальную вещь, но прошедший год был хорошим годом для С++!

Просто факты:

Вышла Visual Studio 2015 с отличной поддержкой возможностей С++14/17 и даже нескольких экспериментальных вещей
Вышел долгожданный GCC 5.0
С++ набрал серьёзную популярность. Где-то с июля — третье место в Tiobe Ranking
На конференции CppCon 2015 было сделано несколько важных анонсов

А теперь об этом и другом немного подробнее

Читать дальше →

+34

halamyzer Jan 2 2016 at 16:42

Как заработать максимум на своем сайте. 22 способа и 240+ ссылок

Easy

17 min

459K

Web services monetization*Display advertising*Contextual advertising*

Tutorial

Эта статья родилась из личного опыта. Я искал самые эффективные способы монетизации сайта (ныне уже проданного на Telderi) и в какой-то момент понял, что тема очень обширная и требует подробного исследования. А его результаты могут быть интересны не мне одному.

Рассматриваются способы, наиболее актуальные для России и СНГ и не требующие участия разработчиков или требующие в минимальной степени.

Статья ввиду большого объема писалась не один месяц, поэтому не серчайте сильно, если где-то встретите неточности (в расценках, форматах). Просто напишите об этом в комментариях.

Читать дальше →

+15

icanchoose-it Dec 24 2015 at 18:37

Книги-двигатели карьеры

5 min

37K

icanchoose.ru corporate blogPersonnel Management*IT career

Recovery Mode

Есть книги-двигатели: закрываешь и понимаешь, что энергии, сил и творческого топлива стало сильно больше. Эти 11 книг помогут вам завести карьеру и стартовать снова. Вы не заглохли!

Читать дальше →

+10

Zav Dec 28 2015 at 12:30

Я хочу, чтобы сайты открывались мгновенно

10 min

139K

High performance*Website development*Perfect code*Client optimization*

Здравствуйте, меня зовут Александр Зеленин и я веб-разработчик. Я расскажу, как сделать так, чтобы ваш сайт открывался быстро. Очень быстро.

Я хочу, чтобы мой сайт открывался быстро

+114

Chekit Dec 23 2015 at 12:09

Создание веб-сайта. Курс молодого бойца

24 min

839K

Website development*CSS*JavaScript*HTML*

From sandbox

Как-то меня попросили провести небольшой семинар в лицее, где я когда-то учился, по созданию веб-сайта. В процессе написания речи я подумал, что она может вылиться в материал, который, возможно, будет полезен многим начинающим в области веб-дизайна, вёрстки веб-страниц и пр. Я не претендую на истину в первой инстанции и всё изложенное носит чисто личностный взгляд на работу с дизайном и кодом. Статья даёт поверхностный взгляд на понятия и средства, которые, на мой взгляд, могут стать неплохим стартом для того, кто готов идти дальше.

Читать дальше →

+68

Realizator Dec 21 2015 at 14:10

Зрение для робота на Raspberry Pi: карта глубин

11 min

36K

GadgetsRoboticsAR and VR

Нынче все технологии «дроностроительства» активно дешевеют. Кроме одной: получение карты окружающего пространства. Тут есть две крайности: либо дорогие лидары (тысячи долларов) и оптические решения для построения карты глубин (много сотен долларов), либо совсем копеечные решения типа ультразвуковых дальномеров.
Поэтому возникла идея на базе недорогой Raspberry Pi с одной камерой сделать решение, которое окажется в пустующей нише и позволит получать карту глубин «за недорого». Причем сделать это на простом языке программирования типа Python, чтобы это было доступно новичкам для экспериментов. Собственно, о своих результатах я и хотел рассказать. Получившиеся скрипты с примерами фоток можно запускать и на десктопе.

+41

ssg1712 Dec 15 2015 at 09:28

Настольная робо-рука манипулятор из оргстекла на сервоприводах своими руками или реверс-инжиниринг uArm

5 min

86K

RoboticsDIYElectronics for beginners

Привет, гиктаймс!

Хочу поделиться с вами результатами реверс-инжиниринга uArm – простого настольно манипулятора из оргстекла на сервоприводах.

Проект uArm от uFactory собрал средства на кикстартере уже больше двух лет назад. Они с самого начала говорили, что это будет открытый проект, но сразу после окончания компании они не торопились выкладывать исходники. Я хотел просто порезать оргстекло по их чертежам и все, но так как исходников не было и в обозримом будущем не предвиделось, то я принялся повторять конструкцию по фотографиям.

Сейчас моя робо-рука выглядит так:

Работая не спеша за два года я успел сделать четыре версии и получил достаточно много опыта. Описание, историю проекта и все файлы проекта вы сможете найти под катом.

Читать дальше →

+40

Kanedias Dec 13 2015 at 23:38

Полный перевод Unix-коанов на русский язык

16 min

75K

Programming*

Представляю на ваш суд ещё один перевод коанов о Мастере Фу на русский язык. В данный сборник вошли все коаны, на данный момент опубликованные на сайте Эрика Реймонда. Надо сказать, что сам Эрик личность весьма неординарная, но упоминания в данной статье стоящая. Помимо холиваров в списках рассылки всевозможных проектов за его авторством также несколько серьёзных трудов о Unix — в том числе и о сообществе, без которого экосистема современных открытых проектов не была бы возможной (полный список книг). Идея перевести коаны в очередной раз пришла мне в голову во время чтения одного из таких трудов, а именно «The Art of Unix Programming», поскольку многое из скрытого смысла коанов становится ясно только после прочтения очередной главы оттуда.

Ну и конечно же, дисклеймер: все комментарии и специфика переложения есть плод воображения вашего покорного слуги.
Я публикую этот перевод в надежде на то, что он может кому-то понравиться, но не предоставляю на него никаких гарантий, в том числе соответствия канонам перевода или пригодности для цитирования где бы то ни было.

Итак

+120

frman Dec 7 2015 at 11:13

100 ресурсов и инструментов для продвижения стартапов на международном рынке

5 min

25K

Фонд развития интернет-инициатив corporate blogGrowth Hacking*Content-marketing*

Большой интерес к нашей исходной компиляции на эту тему вдохновил нас на адаптацию пары (1, 2) добротных подборок, составленных пользователями GitHub.

Читать дальше →

+12

nevskyiplaw Dec 3 2015 at 14:47

Бесплатные базы патентной информации онлайн. Версия 1.09

3 min

57K

ФрешДок corporate blogFreelanceLegislation in ITPatenting*

Подборка ссылок на патентную информацию и поисковые ресурсы в интернете.
Версия 1.0. Будем дополнять.
Поделитесь в комментариях своими ресурсами. Будем благодарны и добавим в пост для удобства.

Подробности

+11

shimapa23 Nov 19 2015 at 17:09

400 потрясающих бесплатных сервисов

16 min

721K

Web design*Typography*Interfaces*

Translation

Рад представить дополнение оригинального списка из 300 потрясающих бесплатных сервисов. Автор оригинальной статьи Ali Mese добавил ещё +100 новых сервисов, которые помогут найти все — от источников вдохновения и редакторов фотографий до создания опросов и бесплатных иконок.

И еще подборку +500 инструментов от 10 марта 2017 г. смотрите здесь.

A. Бесплатные веб-сайты

HTML5 UP: Адаптивные шаблоны HTML5 и CSS3.
Bootswatch: Бесплатные темы для Bootstrap.
Templated: Коллекция 845 бесплатных шаблонов CSS и HTML5.
Wordpress.org | Wordpress.com: Бесплатное создание веб-сайта.
Strikingly: Конструктор веб-сайтов.
Layers: Создание сайтов на WordPress (new).
Bootstrap Zero: Самая большая коллекция бесплатных шаблонов Bootstrap (new).
Landing Harbor: Продвижение мобильного приложения c помощью бесплатного лендинга (new).

Читать дальше →

+70

curiousGeorge Nov 5 2015 at 14:44

Компьютер скруткой — это очень просто

10 min

40K

Old hardwareDIY

Наигравшись вдоволь с построением компьютеров из моего детства в самых разных вариантах, с использованием как тогдашних, так и современных технологий, я решил, что пришло время переключиться на что-то более существенное. Первым шагом, дабы потом было поменьше соблазнов построить еще что-нибудь, героически взялся за расчистку рабочего места с целью дарения накопившегося добра каким-нибудь юным техникам. Однако, как это часто бывает, даже сам процесс разбора завалов оказался довольно увлекательным — нашлось много интересных штучек, о которых я уже и забыл (или вообще не помнил). В частности, обнаружилось, что у меня намного больше инструментов и расходников для монтажа накруткой (wire wrapping), чем я думал.

Хотя в свое время я потратил целых пять минут на опробование данной технологии, но у меня что-то не пошло (кривизна рук оказалась больше допустимого), и все было отодвинуто в дальний ящик. Мне крайне не нравится сдаваться в любых делах — всегда пытаюсь доводить все если не до полного завершения, то до осознания, что точно могу сделать, если уж действительно захочу. Поэтому решил осчастливить юных техников попозже, а перед этим все-таки собрать какую-нибудь штуковину, используя монтаж накруткой.

Долго насчет штуковины для сборки не думал — оставался еще один древний компьютер, до которого ни в детстве, ни сейчас руки так и не дошли. Это был «Специалист», разработанный в 1985 году и опубликованный в журнале «Моделист-Конструктор» в 1987. Так как про этот компьютер (впрочем, как об остальных подобных) есть масса информации, я не буду вдаваться в его особенности, остановлюсь просто на технологии монтажа накруткой и своих впечатлениях о ней.

Замечание — в статье рассказывается о практически мертвой технологии, нет никаких полезных или интересных know how и тому подобных вещей, полностью отсутствуют великие откровения, поэтому ее стоит читать только при отсутствии у вас в данный момент более полезного/интересного занятия, либо же ярым любителям компьютерной некрофилии.

Читать дальше →

+62

kzn Aug 26 2013 at 10:21

Способы представления словарей для автоматической обработки текстов

10 min

20K

Algorithms*

Автоматический анализ текстов практически всегда связан с работой со словарями. Они используются для морфологического анализа, выделения персон (нужны словари личных имен и фамилий) и организаций, а также других объектов.

В общем виде словарь — множество записей вида {строка, данные ассоциированные с этой строкой}.

Например, для морфологического анализа словарь состоит из троек {словоформа, нормальная форма, морфологические характеристики}. При анализе слова «мыла» из предложения «мама мыла раму» надо уметь получать следующие варианты анализа:

Нормальная форма	Характеристики
МЫЛО	S (существительное), РОД (родительный падеж), ЕД (единственное число), СРЕД (средний род), НЕОД (неодушевленность)
МЫЛО	S (существительное), ИМ (именительный падеж), МН (множественное число), СРЕД (средний род), НЕОД (неодушевленность)
МЫЛО	S (существительное), ВИН (винительный падеж), МН (множественное число), СРЕД (средний род), НЕОД (неодушевленность)
МЫТЬ	V (глагол), ПРОШ (прошедшее время), ЕД (единственное число), ИЗЪЯВ (изъявительное наклонение), ЖЕН (женский род), НЕСОВ (несовершенный вид)

Читать дальше →

+30

bulgak0v Oct 21 2015 at 07:56

Алгоритм извлечения информации в ABBYY Compreno. Часть 1

7 min

30K

Content AI corporate blogSearch engines*Semantics*

Привет, Хабр!

Меня зовут Илья Булгаков, я программист отдела извлечения информации в ABBYY. В серии из двух постов я расскажу вам наш главный секрет – как работает технология Извлечения Информации в ABBYY Compreno.

Ранее мой коллега Даня Скоринкин DSkorinkin успел рассказать про взгляд на систему со стороны онтоинженера, затронув следующие темы:

В этот раз мы опустимся глубже в недра технологии ABBYY Compreno, поговорим про архитектуру системы в целом, основные принципы ее работы и алгоритм извлечения информации!

Читать дальше →

+36

Dreadatour Sep 24 2015 at 10:58

19 советов по повседневной работе с Git

14 min

286K

VK corporate blogWebsite development*Programming*Git*

Tutorial

Translation

Если вы регулярно используете Git, то вам могут быть полезны практические советы из этой статьи. Если вы в этом пока новичок, то для начала вам лучше ознакомиться с Git Cheat Sheet. Скажем так, данная статья предназначена для тех, у кого есть опыт использования Git от трёх месяцев. Осторожно: траффик, большие картинки!

Содержание:

Параметры для удобного просмотра лога
Вывод актуальных изменений в файл
Просмотр изменений в определённых строках файла
Просмотр ещё не влитых в родительскую ветку изменений
Извлечение файла из другой ветки
Пара слов о ребейзе
Сохранение структуры ветки после локального мержа
Исправление последнего коммита вместо создания нового
Три состояния в Git и переключение между ними
Мягкая отмена коммитов
Просмотр диффов для всего проекта (а не по одному файлу за раз) с помощью сторонних инструментов
Игнорирование пробелов
Добавление определённых изменений из файла
Поиск и удаление старых веток
Откладывание изменений определённых файлов
Хорошие примечания к коммиту
Автодополнения команд Git
Создание алиасов для часто используемых команд
Быстрый поиск плохого коммита

Читать дальше →

+146

mezastel May 19 2010 at 13:35

Data acquisition, часть 1

8 min

4.3K

.NET*

Одно из приемуществ всеобщего удешевления аппаратуры и интернета в том, что сбор информации из разных источников в интернете почти ничего не стоит и может производиться без особых проблем. Задача получения и обработки больших объемов данных является коммерчески превлекательной ввиду спроса на считывание («скрейпинг») веб-сайтов со стороны заказчиков (обычно это описывается термином ‘social media analysis’, т.е. анализ социальных медиа). Ну и в принципе это достаточно интересно – по крайней мере по сравнению с рутинной разработкой сайтов, отчетов, и т.д.

В этой статье я начну рассказ про то, как можно реализовать сбор и обработку данных с использованием платформы .Net. Было бы интересно послушать про то как делать то же самое в стеке Java, поэтому если кто-то хочет присоединиться к данной статье в качестве соавтора – милости прошу.

Если интересно...

+23

mezastel May 20 2010 at 23:54

Data acquisition, часть 2

7 min

2.2K

.NET*

В первой части моего рассказа про data acquisition, я написал про то, какой инструментарий используется для получения HTML из интернета. В этом посте я более детально расскажу про то, как из этого HTML получать нужные данные, и как эти данные трансформировать в нужный нам формат.

Если интересно...

+13