Articles / Bookmarks / Profile of 0decca / Habr

Дмитрий Лобашевский @0decca

User

ProfileArticles3PostsNewsComments185

ilaskov May 16 2013 at 05:31

Распределенная файловая система Ceph FS за 15 минут

4 min

113K

Big Data*

Tutorial

From sandbox

Нам понадобится всего лишь несколько минут для того что бы поднять распределенную файловую систему Ceph FS

Читать дальше →

+48

108

snikolenko Apr 12 2013 at 12:31

Вероятностные модели: байесовские сети

8 min

88K

Surfingbird corporate blogData Mining*

Tutorial

В этом блоге мы уже много о чём поговорили: были краткие описания основных рекомендательных алгоритмов (постановка задачи, user-based и item-based, SVD: 1, 2, 3, 4), о нескольких моделях для работы с контентом (наивный Байес, LDA, обзор методов анализа текстов), был цикл статей о холодном старте (постановка задачи, текстмайнинг, теги), была мини-серия о многоруких бандитах (часть 1, часть 2).

Чтобы двигаться дальше и поместить эти и многие другие методы в общий контекст, нам нужно выработать некую общую базу, научиться языку, на котором разговаривают современные методы обработки данных, – языку графических вероятностных моделей. Сегодня – первая часть этого рассказа, самая простая, с картинками и пояснениями.

Читать дальше →

+45

YUVladimir Apr 6 2013 at 17:56

Blind Deconvolution — автоматическое восстановление смазанных изображений

6 min

148K

Algorithms*Image processing*

Смазанные изображения — один из самых неприятных дефектов в фотографии, наравне с расфокусированными изображениями. Ранее я писал про алгоритмы деконволюции для восстановления смазанных и расфокусированных изображений. Эти, относительно простые, подходы позволяют восстановить исходное изображение, если известна точная траектория смаза (или форма пятна размытия).
В большинстве случаев траектория смаза предполагается прямой линией, параметры которой должен задавать сам пользователь — для этого требуется достаточно кропотливая работа по подбору ядра, кроме того, в реальных фотографиях траектория смаза далека от линии и представляет собой замысловатую кривую переменной плотности/яркости, форму которой крайне сложно подобрать вручную.

В последние несколько лет интенсивно развивается новое направлении в теории восстановления изображений — слепая обратная свертка (Blind Deconvolution). Появилось достаточно много работ по этой теме, и начинается активное коммерческое использование результатов.
Многие из вас помнят конференцию Adobe MAX 2011, на которой они как раз показали работу одного из алгоритмов Blind Deconvolution: Исправление смазанных фотографий в новой версии Photoshop
В этой статье я хочу подробнее рассказать — как же работает эта удивительная технология, а также показать практическую реализацию SmartDeblur, который теперь тоже имеет в своем распоряжении этот алгоритм.
Внимание, под катом много картинок!

Читать дальше →

+235

150

sic Mar 13 2013 at 19:04

Построение системы оптического распознавания структурной информации на примере Imago OCR

19 min

37K

Open source*Algorithms*Image processing*

В настоящей заметке я расскажу о том, как можно построить систему оптического распознавания структурной информации, опираясь на алгоритмы, применяющиеся в обработке изображений и их реализации в рамках библиотеки OpenCV. За описанием системы стоит активно развивающийся open source проект Imago OCR, который может быть непосредственно полезен в распознавании химических структур, однако в заметке я не буду говорить о химии, а затрону более общие вопросы, решение которых поможет в распознавании структурированной информации различного рода, например таблицы или графики.

Читать дальше →

+64

vvzvlad Mar 3 2013 at 18:40

Популярно о генеалогии 3D-принтеров. Кто есть кто?

5 min

62K

Box Overview corporate blog

Ситуация с 3д-принтерами напоминает ситуацию с Linux-дистрибутивами, особенно для новичка. Огромная куча конструкций под кодовыми именами, половина из которых поставляется в собранном виде, половину надо собирать как конструктор из деталей, а для еще одной половины все детали надо найти самому, да еще и напильником поработать. Кстати, откуда взялась третья половина — тоже непонятно. Попробуем в этом всем разобраться.

Читать дальше →

+80

silvansky Mar 1 2013 at 09:05

19 команд ffmpeg для любых нужд

3 min

583K

Working with video*Sound

Tutorial

Translation

От переводчика:
Многие знают, что ffmpeg — это сила, но не все знают, какая именно. Он многогранен и безграничен, а его man объёмен и местами малопонятен, лишь немногие постигли дао профессиональной работы с ним. И тем не менее, этот инструмент может быть полезен почти всем, кто хоть иногда работает с видео и звуком, даже на бытовом уровне. О некоторых полезных консольных командах ffmpeg и пойдёт речь в статье. В некоторых местах я взял на себя смелость вставить ссылки на поясняющие статьи.

ffmpeg — это кроссплатформенная open-source библиотека для обработки видео- и аудиофайлов. Я собрал 19 полезных и удивительных команд, покрывающих почти все нужды: конвертация видео, извлечение звуковой дорожки, конвертирование для iPod или PSP, и многое другое.

1. Получение информации о видеофайле

ffmpeg -i video.avi

2. Превратить набор картинок в видео

ffmpeg -f image2 -i image%d.jpg video.mpg

Эта команда преобразует все картинки из текущей директории (названные image1.jpg, image2.jpg и т.д.) в видеофайл video.mpg

(примечание переводчика: мне больше нравится такой формат:

ffmpeg -r 12 -y -i "image_%010d.png" output.mpg

здесь задаётся frame rate (12) для видео, формат «image_%010d.png» означает, что картинки будут искаться в виде image_0000000001.png, image_0000000002.png и тд, то есть, в формате printf)

Читать дальше →

+206

107

snikolenko Feb 7 2013 at 09:57

Многорукие бандиты: введение и алгоритм UCB1

5 min

55K

Surfingbird corporate blogAlgorithms*

Tutorial

Это первый пост из блога Surfingbird, который я выношу в общие хабы алгоритмов и искусственного интеллекта; честно говоря, раньше просто не догадался. Если интересно, заходите к нам, чтобы прочесть предыдущие тексты, – я не знаю, что произойдёт, если просто добавить новые хабы к постам несколькомесячной давности.

Краткое содержание предыдущих серий о рекомендательных системах:

В этот раз начинаем новую тему – о многоруких бандитах. Бандиты – это самая простая, но от этого только более важная постановка задачи в так называемом обучении с подкреплением…

Читать дальше →

+31

walker Feb 6 2013 at 17:42

Крошечный конструктор-квадрокоптер-дрон стал доступен для предварительного заказа

1 min

196K

Electronics for beginners

Recovery Mode

Крошечный open-source дрон разработанный Bitcraze «прожжуживает» свой путь на рынок этой весной, нацеленный на хакеров и моддеров, экспериментирующих, как в помещениях так и на открытом воздухе.

Читать дальше →

+103

139

cigulev Jan 22 2013 at 16:21

Приём онлайн платежей в Европе в 2013 году

6 min

31K

Web-payment.ru corporate blogPayment systems*

Translation

Чтобы зарабатывать деньги в сети, у вас должна быть возможность принимать платежи. Это может казаться простым, но в действительности это не совсем так, и американские подрывные инновационные компании, такие как Stripe и Square, пока ещё не функционируют в Европе.

Поиск вариантов приёма платежей для Vinetrade стал для меня одной из самых сложных задач, но я многому научился. Поэтому я решил, что стоит изложить свои мысли о рынке карточных платежей, о перспективах его развития и о том, чего недостает европейскому сегменту этого рынка.

Почему это сложно

Самый простой способ приёма платежей онлайн – это использование банковской карты (кредитной или дебетовой). За всеми карточными платежами стоит определённое количество банковских операций. Законы о защите прав потребителей позволяют покупателям требовать у своего банка возврата денег, если что-либо пойдет не так (например, если они заплатили за товар, но не получили его). Если банк не сможет получить эти деньги от предприятия, принявшего платёж, он терпит убытки.

Читать дальше →

+39

DejmosSm Jan 13 2013 at 19:51

ViBe — алгоритм вычитания фона

5 min

16K

C++*Algorithms*Image processing*

Tutorial

Предыстория

Пару лет назад, в процессе выполнения одного проекта, связанного с выделением и сопровождением движущихся объектов, было просмотрено немало алгоритмов вычитания фона, и в итоге одним из самых интересных оказался тот, о котором дальше и пойдет речь. Основной его недостаток — куча патентов, которыми он защищен. Но одно из несомненных достоинств — наличие библиотеки под Linux, которую разрешено использовать в некоммерческих проектах. На странице с его описанием можно найти эту самую библиотеку, а также demo-программы под Windows и Android, ссылки на патенты (где и можно найти основные описания алгоритма) и прочую интересную информацию.

Читать дальше →

+22

feihunt Jan 8 2013 at 15:45

Простейшая кластеризация изображени методом к-средних (k-means)

5 min

88K

C++*Image processing*

Tutorial

From sandbox

Зачастую при поиске движущихся объектов на видео будь то методом вычитания фона, временной разности, оптического потока, в итоге мы получаем множество точек, которые после действия вышеупомянутых алгоритмов помечены как изменившие свое положение относительно предыдущего кадра и относящиеся к переднему плану.

После такой обработки встает вопрос о сегментации объектов методом кластерного анализа, о котором пойдет речь ниже и собственно его реализация на C++.

Читать дальше →

+33

m7d7o7 Jan 8 2013 at 13:38

Предсказание информационных эпидемий путём анализа социального графа

2 min

24K

Web analytics*

From sandbox

В какой-то момент тихую гавань воспринимаемого мной интернета всколыхнула одна из лекций TED.

Описание лекции с сайта:

После составления карты запутанных социальных сетей Николас Кристакис и его коллега Джеймс Фаулер исследовали возможности использования этой информации во благо. И сейчас Николас Кристакис обнародует свое последнее открытие: социальные сети можно использовать как самый быстрый метод для обнаружения распространения любых эпидемий: от новаторских идей до социально опасного поведения или вирусов.

Читать дальше →

+15

nrcpp Jan 4 2013 at 09:35

Ищем деньги. Каталог инвесторов для стартапа

4 min

230K

GTD*

UPD: получил инвестиции под свой проект в сфере обучения облачным технологиям

Здравствуйте уважаемые Хабравчане, особенно те, у кого есть идея своего стартапа! А вот с деньгами и осведомленностью похуже. Хочу Вам в помощь поделиться небольшой таблицей IT-инвесторов, которая была составлена для себя. Дело в том, что я также как и вы, обладаю минимум информации. Такие вопросы как: «к кому идти за деньгами», «как составить бизнес-план», и наконец «кому я вообще нужен со своей идеей» — давно стали навязчивыми.
Именно сейчас, после Новогодних праздников, самое время начать искать тех самых менторов, инвесторов, бизнес-ангелов, да и в целом зачитываться информацией на эту тему. Да, и у меня есть свой стартап, который перестал быстро развиваться и я активно ищу инвестора на дальнейшее развитие (О чем уже писал неделю назад).
Под катом таблица, со списком полезных ссылок, в помощь начинающим IT-компаниям.

Читать дальше →

+64

alizar Jun 3 2011 at 13:31

«Выглядит похоже». Как работает перцептивный хэш

6 min

126K

Image processing*

Translation

За последние несколько месяцев несколько человек спросили меня, как работает TinEye и как в принципе работает поиск похожих картинок.

По правде говоря, я не знаю, как работает поисковик TinEye. Он не раскрывает деталей используемого алгоритма(-ов). Но глядя на поисковую выдачу, я могу сделать вывод о работе какой-то формы перцептивного хэш-алгоритма.

Читать дальше →

+141

alizar Dec 27 2012 at 14:32

10 дистрибутивов Linux специального назначения

2 min

224K

Open source*

Translation

Прелесть Linux в том, что можно сделать дистрибутив под любые запросы. Требуется лишь время и желание. Многие популярные дистрибутивы Linux — результат работы отдельных энтузиастов или групп, недовольных имеющимся набором опций. Вот некоторые из дистрибутивов Linux специального назначения.

1. Parted Magic OS: дистрибутив для восстановления дисков и работы с разделами, который поддерживает более десяти файловых систем и включает различные утилиты для «переноса, копирования, создания, удаления, расширения и сжатия дисковых разделов. Клонирование дисков и осуществление полного бэкапа. Тестирование дисков на возможность сбоя в будущем. Поиск сбойных секторов. Тестирование производительности компьютера. Безопасная полная очистка диска без возможности восстановления. Доступ к незагружаемым HDD для восстановления важных данных».

Читать дальше →

+96

110

lutov Dec 4 2012 at 10:23

Автописатель

Easy

5 min

16K

Website development*

Opinion

Труд посредственного писателя может, а значит, должен быть автоматизирован.

Для людей, далеких от сетературы, может быть неочевидным, насколько много художественных произведений уже написано, или будет написано в ближайшее время. Такие сайты как Самиздат или Проза.ру содержат объемы текста, не снившиеся программистам даже самых сложных и высоконагруженных систем. Даже самый захудалый литературный конкурс в сети собирает от десятков до сотен участников, и, надо заметить, что уникальность текстов является условием участия в большинстве из них. То есть, производство нового подстегивается жизнью, но качество этого нового и сравнительно невысоко и не востребовано: издать книгу за деньги удается едва каждому сотому пишущему, победить в конкурсе — аналогично.

Это обусловлено и ограниченностью ресурсов (покупательской способностью и спросом среди читателей, производственными мощностями типографии и оформительскими — издательства, призовым фондом, временем членов жюри), и, в немалой степени, качеством произведений. Если отбросить откровенно безграмотные и неадекватные тексты — а это, по скромным прикидкам, не менее четверти любого потока на издание или победу — то все равно останется слишком много стандартных, заезженных, скучных, вторичных, малоинтересных в наше время текстов, подражающих достижениям писателей прошлого и друг другу. Все чаще слышатся предположения, что даже робот смог бы написать такое — грамотное, но абсолютно невыразительное, отличающееся от подобных только именами собственными, произведение. Так почему бы роботу действительно не сделать это?

Читать дальше →

+19

kshiian Dec 21 2012 at 21:18

HTML::TokeParser

5 min

12K

Perl*

Одним из наиболее часто используемых мною модулем при парсинге HTML является HTML::TokeParser. Этот модуль разбивает весь HTML документ на токены, с которым позже можно удобно работать.

Давайте рассмотрим какой-либо пример на практике. Возьмем сайт habrahabr.ru

Читать дальше →

MKrivosheev Dec 19 2012 at 16:24

ABBYY Labs. Проект «Q&A»: демонстрация возможностей

4 min

6.5K

Content AI corporate blogSearch engines*

Краткое содержание прошлых серий:

ABBYY Labs? Что это?

Идея студенческих лабораторий очень проста: мы собираем команду студентов, которые занимаются решением задач под руководством наших специалистов. В МФТИ это проходит в рамках годового курса «Инновационный практикум». Цель проекта – дать возможность студентам в процессе обучения решать задачи, в большей степени приближенные к реальным, чем это бывает в обычном учебном процессе. И «погрузить» их при этом в соответствующее окружение: среда, в которой проходит разработка, – реально действующая IT-компания.

Проекты прошлых лет

Распознавание формул
Постановка задачи:

Студенческие лаборатории ABBYY
Решение задачи:

ABBYY Labs – what's new?

Текущие проекты

Приложение для Android

ABBYY Labs: Проект «FromWord» — играем словами на Android
Вопросно-ответная система

ABBYY Labs. Проект «Q&A»: начало
+↓

Кратко о проекте:
Задача: Иметь возможность найти часть ранее загруженного текста, наиболее полно отвечующую на вопрос пользователя, заданный на естественном языке.
Текущее состояние: Можно пощупать ручками!
Будущее: Туманно. Зависит от реакции и платёжеспособности аудитории.
Поэтому: Не проходите мимо!

Под катом ссылка на демо-пример, и вообще, логическое продолжение прошлой части.

Читать дальше →

+12

shtirlitsus Dec 17 2012 at 16:12

Вторая жизнь старых часов

4 min

100K

DIY

В продолжение знакомства с LaunchPad mps430 предлагаю статью о восстановлении работоспособности старых настенных маятниковых часов.

Читать дальше →

+60

Wildy Dec 16 2012 at 21:10

Про двумерную упаковку: online алгоритмы

12 min

30K

Algorithms*

Это продолжение поста про оффлайн алгоритмы упаковки.

Суть задачи: имеем полубесконечную полосу — как в тетрисе, только без game over'а, и конечный набор прямоугольников. Данные о прямоугольниках поступают в режиме реального времени; каждый новый прямоугольник необходимо немедленно разместить и больше не двигать с места. Цель — минимизировать общую высоту упакованных прямоугольников.
Это online-вариация задачи об упаковке прямоугольников в полуограниченную полосу (2 Dimensional Strip Packing, 2DSP).

Чуть больше теоретических сведений можно найти в предыдущей статье, а пока, без лишних слов, перейдем к алгоритмам.

Читать дальше →

+36

1 2 ...

6 7

9 10