Comments / Profile of agorkov / Habr

Горьков Алексей @agorkov

SQL

Habr Career

ProfileArticles33PostsNewsComments216

Dagaz: Пинки здравому смыслу (часть 3)

agorkov Mar 12 2015 at 17:14

Очень интересно! Спасибо!

Look

Метод фрагментарного сжатия видеопотока

agorkov Mar 8 2015 at 09:25

Удалось добиться такого эффекта за счёт использования деревьев секущих функций, которые позволяют получать среднюю длину кода почти как у теоретического Хаффмана.

Look

Метод фрагментарного сжатия видеопотока

agorkov Mar 8 2015 at 07:32

В алгоритме и правда нет компенсации движения, тем не менее он весьма неплохо показывает себя на обычных записях. В качестве эксперимента алгоритмом был сжат полный сезон сериала Star Trek. Итоговый коэффициент сжатия оказался даже чуть больше, чем расчётный.

Look

Метод фрагментарного сжатия видеопотока

agorkov Mar 8 2015 at 07:01

Я даже могу предположить, что это за причина: энтропийные префиксные кодировщики только в теории выглядят красиво, на практике реализовать их весьма тяжело (из-за ошибок с округлением или переполнением), кроме того процесс кодирования условно сводится к поиску соответствующего элемента среди всех листьев дерева и восстановлению траектории по дереву. Если листьев несколько сот миллионов это довольно тяжело.
Основная «фишка» данного метода — использование деревьев секущих, что позволяет строить префиксе деревья и кодировать на их основе почти в реальном времени.

Look

Метод фрагментарного сжатия видеопотока

agorkov Mar 8 2015 at 06:57

Конечно можно и так поступать. Возможно многие так и делают, но разве это повод не изобретать что-то новое и более эффективное? Кроме того Yuls(Max) использует преобразование цветовых пространств, что привносит ошибки. Если разрешить преобразование цветовых пространств для МФС коэффициент сжатия станет >5, а это уже выигрыш не на 2%, а как минимум на 40%.

Look

Метод фрагментарного сжатия видеопотока

agorkov Mar 8 2015 at 06:30

Я не спорю, что у метода достаточно узкая область применения, но в той сфере, где он используется (медицинские записи) он показывает большую эффективность. И выигрыш в степени сжатия в несколько процентов на практике превращается в сотни мегабайт, что на установках с ограниченными ресурсами очень важно.

Look

Метод фрагментарного сжатия видеопотока

agorkov Mar 8 2015 at 06:14

Разрешение брали 720p, а разжимает со скоростью около 70 кадров в секунду.

Look

Метод фрагментарного сжатия видеопотока

agorkov Mar 7 2015 at 19:56

Код выложу на github, когда приведу его в порядок. Сейчас там очень много лишнего. Скорость сжатия пока оставляет желать лучшего секунда видео жмётся где-то за 1.2-1.5 секунды реального времени, но есть обоснованное подозрение, что после приведения кода в порядок скорость вырастет.

Look

Методы сжатия данных

agorkov Feb 25 2015 at 08:34

Мне кажется несколько преждевременно называть язык, который активно развивается и на котором создаётся множество новых проектов мёртвым.

Look

Методы сжатия данных

agorkov Feb 24 2015 at 10:54

Практика показывает, что это далеко не всегда так.

Look

Об особенностях реализации префиксного энтропийного кодирования для больших алфавитов

agorkov Mar 9 2014 at 10:59

Если у нас алфавит из десятков миллионов, то и размер описания дерева тоже будет — десятки миллионов байтов.

И экономия хотя бы одного бита на символ выльется в сотни мегабайт экономии.

Кодирование Хаффмана в принципе не очень подходит для решения задач в таких масштабах. В моей работе используется разработанный специально для подобных задач вид бинарных деревьев.

Look

Об особенностях реализации префиксного энтропийного кодирования для больших алфавитов

agorkov Mar 9 2014 at 04:48

Отличная идея! Но проблема в п. 2: перекос дерева очень сильный. Частоты самого частого и самого редкого элемента отличаются на несколько порядков.

Look

Об особенностях реализации префиксного энтропийного кодирования для больших алфавитов

agorkov Mar 9 2014 at 04:17

Особенностью нашего метода является то, что сжимаются массивы из миллиардов элементов, при этом алфавиты составляют десятки миллионов элементов. При таких масштабах даже концептуально простые алгоритмы реализовать становится если не невозможно, то очень и очень сложно. А учитывая, что работа имеет не только академическую, но и практическую ценность, вычислительную сложность тоже надо учитывать.

Look

Об особенностях реализации префиксного энтропийного кодирования для больших алфавитов

agorkov Mar 8 2014 at 18:51

Напишу обязательно. Я использую не Хаффмана, а кодирование с помощью специального бинарного дерева, которые разработали на кафедре. А арифметическое кодирование тут применять вообще равносильно самоубийству. Вы хоть представляете какая точность арифметики понадобится?

Look

Об особенностях реализации префиксного энтропийного кодирования для больших алфавитов

agorkov Mar 8 2014 at 17:43

Спасибо за наводку. Обязательно исследую этот вопрос.

Look

Применение машинного обучения в построении ИИ для игры в японские шахматы (сёги)

agorkov Jan 9 2014 at 15:51

Касаемо сути. Эвристики используются для того, чтобы потенциально наиболее сильные ходы рассматривались раньше. Логичным способом сравнения эффективности традиционных и «машинных» эвристик является сравнение индексов действительно сильных ходов (подтверждённых просчётом дерева) в массивах упорядоченных по различным оценкам. Сравнение эффективности на основе количества вызовов процедуры отсечения кажется мне богомерзким извращением.

Look

Применение машинного обучения в построении ИИ для игры в японские шахматы (сёги)

agorkov Jan 9 2014 at 15:33

1. Ты умудрился так написать про AB-отсечение, что я его наконец-то понял.
2. Идея использовать машинное обучение для предварительной сортировки ходов порочна по сути своей.
3. В сёги я играю лучше.

Look

Алгоритмы заливки многоугольников

agorkov Nov 2 2013 at 16:27

Попробуйте тут посмотреть — gorkoff.ru/?page_id=34

Look

Гаджеты, вдохновленные сериалом «Доктор Кто»

agorkov Oct 22 2013 at 06:01

Полночь ещё отличная серия!

Look

Java школа: обзор

agorkov Oct 9 2013 at 06:51

Вы не поняли, я описывал ситуацию с первым набором в эту школу, а до 16 октября рассматривают заявки второго набора.