Search
Write a publication
Pull to refresh
19
0
Андрей Смачёв @Biga

User

Send message

Огромный открытый датасет русской речи версия 1.0

Reading time2 min
Views20K

image


В начале этого года по ряду причин мы загорелись идеей создать самый большой открытый датасет русской речи. Подробнее о нашей мотивации и о том, как всё начиналось,
можно прочитать в этой статье — Огромный открытый датасет русской речи. С тех пор наш проект прошел через ряд масштабных изменений, мы в три раза увеличили количество данных, повысили их качество, добавили лейблы для спикеров и сейчас мы наконец готовы представить вам версию 1.0.


Также мы не готовы останавливаться на достигнутом и планируем продолжать делать интесивную работу над ошибками в последующих версиях и улучшать качество уже опубликованных данных. Версию 1.1 мы планируем посвятить масштабной работе над ошибками.

Читать дальше →

Как я создал фильтр, не портящий изображение даже после миллиона прогонов

Reading time10 min
Views8.9K
Завершив создание веб-архитектуры для нашего нового веб-комикса Meow the Infinite, я решил, что самое время написать несколько давно назревших технических статей. Данная статья будет посвящена фильтру, разработанному мной несколько лет назад. Он никогда не обсуждался в области сжатия видео, хотя мне кажется, что это стоит сделать.

В 2011 году я разработал “half-pel filter”. Это особый вид фильтра, который берёт входящее изображение и максимально убедительно отображает, как бы выглядело изображение при сдвиге ровно на полпикселя.

Вероятно, вы задаётесь вопросом, зачем вообще может понадобиться такой фильтр. На самом деле, они достаточно часто встречаются в современных видеокодеках. Видеокодеки используют подобные фильтры, чтобы брать фрагменты предыдущих кадров и использовать их в последующих кадрах. Более старые кодеки перемещали данные кадра только по целому пикселю за раз, однако новые кодеки пошли дальше и для лучшей передачи мелких движений позволяют выполнять сдвиг на половину или даже на четверть пикселя.

При анализе поведения алгоритмов компенсации движения в традиционных halfpel-фильтрах, Джефф Робертс выяснил, что при многократном применении к последовательным кадрам они быстро деградируют, заставляя другие части видеокомпрессора использовать для исправления артефактов больше данных, чем необходимо. Если отключить эти исправления и взглянуть на «сырые» результаты halfpel-фильтра, то такое исходное изображение:


превращается вот в такое:


всего спустя одну секунду видео. Как и должно, оно сдвинуто в сторону, потому что каждый кадр сдвигал изображение на полпикселя. Но результат выглядит не как перемещённая версия исходного изображения, он серьёзно искажён.
Читать дальше →

Процедурная генерация планет

Reading time19 min
Views39K

От переводчика:
Представляю вашему вниманию статью авторства Andy Gainey, в прошлом независимого разработчика игровых инструментов, ныне сотрудника Paradox Development Studio. На мой взгляд, автор играючи создал один из лучших процедурных генераторов планет с открытым исходным кодом.

Читать дальше →

Огромный открытый датасет русской речи

Reading time3 min
Views37K
image

Специалистам по распознаванию речи давно не хватало большого открытого корпуса устной русской речи, поэтому только крупные компании могли позволить себе заниматься этой задачей, но они не спешили делиться своими наработками.

Мы торопимся исправить это годами длящееся недоразумение.

Итак, мы предлагаем вашему вниманию набор данных из 4000 часов аннотированной устной речи, собранный из различных интернет-источников.

Подробности под катом.
Читать дальше →

Чего бы почитать. Список русскоязычной фантастики за 2017 и 2018 год

Reading time3 min
Views29K
Обзор русскоязычной художественной литературы, за последние два года. В список попали самые лучшие работы по моему вкусу в 2017-2018 году.
Здесь предыдущая статья, за 2010-2016 года.

Короткий список


Финикийский торговец Принцип неопределенности
Авторская аннотация: Философско-приключенческий фанфик о попаданце во вселенную «Звёздных войн». История о поиске своего места в чужой и незнакомой вселенной. Учитывая дуализм этой вселенной, её мистицизм и глубокую символичность, как и извечный конфликт Орденов и сторон Силы – это наилучшие декорации для рассматриваемых вопросов. В таких случаях пишут — «осторожно философия». Также читателя ждут контрабанда, космос и всё, что с ними связанно.
Автору удалось описать огромный высокотехнологичный мир. Мир Звездных Войн, эта — галактика с многотысячелетней историей. Практически все произведения и авторы по SW не смогли передать ощущения действительно огромного мира, ведь это серьезнейшим образом влияет на экономику, торговлю, культуру и культурные различия.
Второй особенностью являются философия, и ее тут действительно много. Автор глубоко углубляется в темы мышления, цели и смысла жизни.
Минусом является объем, да и иначе быть не могло, огромный мир, глубокое пережевывание идей. Автор запрягает медленно, и уносит далеко далеко.

MaxKitsch Большой Дом
Ядреная смесь юмора и хоррора. Фанфик на Простоквашино, с использованием оккультизма. Оккультизм тут хорош, с десятками ссылок и хорошей жутью. И все это в исполнении персонажей из Простоквашино. Вышло шикарно.
Поначалу, это отличный юмор, ты сидишь и смеешься, смеешься и тут БАМ! вместо ожидаемой смехучки, качественный хоррор. Диссонанс рвет эмоции и дает интересные ощущения.
Читать дальше →

Регулятор оборотов минидрели

Reading time3 min
Views41K
Сверление печатных плат — настоящая головная боль для электронщика, но наше новое устройство поможет ее немного смягчить. Это простое и компактное дополнение к минидрели позволит продлить жизнь двигателю и сверлам. Схема, плата, инструкции по настройке, видео — все в статье!


Асинхронная бизнес-логика в наши дни

Reading time19 min
Views15K

Вкратце:


  • Пруф уже реализован на C++, JS и PHP, подходит для Java.
  • Быстрее чем coroutine и Promise, больше фич.
  • Не требует выделения отдельного программного стека.
  • Дружит со всеми средствами безопасности и отладки.
  • Работает на любой архитектуре и не требует особых флагов компилятора.

Читать дальше →

Лайфхаки изготовления двухслойных плат (ЛУТ)

Reading time8 min
Views66K

Потребность делать железо периодически возникает у многих технарей. Иногда задача позволяет нафигачить всё проводами на макетке, а иногда, к сожалению, нужно нечто посерьёзнее. Вот и меня однажды настигла потребность делать печатные платы… Лазерно-утюжная технология кустарного изготовления плат по началу сильно отталкивает своей рандомностью (на чём печатать, как греть, с какой силой давить, как отдирать, и т.д.), но друзья поделились опытом, и оказалось, что это действительно не так уж сложно. ЛУТ бесспорно дешевле любого другого варианта, и (внезапно) вполне подходит для двухслойных плат.


Кому интересно посложнее, подороже и поточнее, можно делать фоторезистом, но наша методика (основным элементом которой является особая бумага) позволяет стабильно прорабатывать шины 0.3/0.3 мм, так что в нашем сообществе бытует мнение что тян фоторезисты не нужны.


Кто не видит смысла в кустарном производстве плат, скорее всего сможет вспомнить пару случаев, когда приходилось пилить дорожки и припаивать проводки на целой партии плат. А сделав одну плату дома, можно её хорошенько отладить и приобрести уверенность в фабричных платах.


Под катом я поделюсь детерминированной методикой изготовления двухслойных печатных плат по технологии ЛУТ с различными резервными схемами на случай косяков. От идеи до включения. Будем работать с KiCad, Inkscape, наждачкой, утюгом, персульфатом аммония и гравёром.


Игры для программистов, часть вторая

Reading time5 min
Views83K
Прошло четыре с половиной года с тех пор, как я, пользуясь свежеполученным инвайтом, написал предыдущий хабрапост с подобным заголовком. Большой срок для игровой индустрии. Успело появиться много новых хороших игр, и недавно я ощутил настоятельную необходимость поделиться знанием о них с широкой общественностью.

Несмотря на опасность, что вновь возникнет спор относительно названия, я решил оставить его прежним, дабы сохранить преемственность. Можно воспринимать его как «игры для тех, кто имеет способность к программированию», или ещё как-нибудь в этом духе. Однако я полагаю, что вы читаете этот пост не ради рассуждений о семантике, потому перейдём к сути.

Infinifactory


image
И что же это за майнкрафт такой?

FSE кодирование

Reading time9 min
Views15K
Finite State Entropy (FSE) – алгоритм энтропийного кодирования, чем-то похожий и на алгоритм Хаффмана, и на арифметическое кодирование. При этом он взял лучшее от них обоих: работает так же быстро, как хаффмановский, и со степенью сжатия как у арифметического кодирования.

FSE принадлежит семейству кодеков ANS (Asymmetric Numeral Systems),  изобретённых Яреком Ду́дой. На основе его исследований Ян Колле разработал оптимизированный вариант алгоритма, впоследствии названный FSE.

В заметках Яна Колле непросто разобраться, поэтому я изложу объяснение в несколько ином порядке, более удобном для понимания, на мой взгляд.


Читать дальше →

Официальная позиция администрации opensharing.org по вопросу блокировки ресурса Роскомнадзором

Reading time7 min
Views264K
image

Приветствую уважаемое Хабрасообщество!

Как уполномоченному представителю opensharing.org, мне поручено озвучить официальную позицию администрации по вопросу блокировки нашего ресурса Роскомнадзором.

Волею случая, нашему ресурсу выпала сомнительная честь стать первой жертвой «антипиратского» закона № 187-ФЗ. 21 августа 2013 нас «осчастливили» внесением в «пиратский» реестр. Произошедшее вызвало у нас, мягко говоря, недоумение, а так же массу вопросов.

Давайте с этого момента поподробнее

Читать дальше →

То, чего еще никто не писал про Нокиа, Элопа и горящую платформу

Reading time40 min
Views551K
Взявшись за этот пост, автор полностью отдает себе отчет. И в том что «набило оскомину». И что «только ленивый не кинул камень». И про то что «хватит уже, достали». Однако, вдоволь начитавшись доморощенных и не очень аналитиков, автор решил все-таки выразить собственное мнение, которое отличается от того общепринятого, что с некоей мазохистской истомой доселе перепечатывалось здесь и тут различными авторами, интерпретаторами и переводчиками. Вероятно кому-то будет интересно его прочитать.

Традиционно, для тех кто не любит много буков, краткие (более-менее) тезисы:

  • Будучи долгое время лидером на рынке, Нокиа сильно расслабилась и загадила свою внутреннюю инфраструктуру бюрократией, чрезмерным аутсорсингом и огромным количеством бесполезной «менеджерской прослойки».
  • Будучи долгое время лидером, Нокиа просрала потратила много денег на ненужные операционные расходы, поглощения никому не нужных фирм и на невменяемую модель аутсорсинга.
  • Полностью оторвавшись от реальности с уходом Йормы Оллилла, Нокиа, под управлением гениального юриста CEO Олли-Пекки Каласвуо, потратила кучу денег и усилий на создание бесполезной и неконкурентоспособной сервисной инфраструктуры Ovi. В результате этого, помимо денег, Нокиа потеряла уйму полезного времени, которое можно и нужно было потратить на развитие основного бизнеса — телефонов, софта и т.д.
  • Бюрократия и непотопляемая менеджерская прослойка в Нокиа, последовательно мигрировала из одного передового проекта в другой, в составе одних и тех же групп лиц, самореплицируясь в виде кучи формальных дебилопроцессов комитетов и управленческих групп, немного перетасовываемых с учетом специфики. В итоге именно эта бюрократия убила и Symbian, и Ovi, и MeeGo и остальные попытки догнать уходящий поезд своими силами.
  • Борьба с бюрократией и прослойкой в Нокиа зашла в полный тупик.
  • У великого CEO Элопа просто не было другого выхода кроме как прибить всю старую, неповоротливую и прогнившую организацию, путем создания альянса с Майкрософтом и переходом на Windows Phone. Тем самым все старые процессы, компетенции, технологии и самое главное — люди резко стали, что называется, «не в тему». И следовательно тем самым можно было под благовидным предлогом прибить этот табун менеджеров, бесконечно рисующих фэнтезийные роадмапы с единорогами и перекладывающих бумаги с левого края стола на правый.
  • Новая Нокиа, после 2011 года и старая Нокиа до 2011 года – это две РАЗНЫЕ организации. Их объединяет только общее название и операционка S40 для телефонов Asha.
  • Горящая платформа, это не Symbian и не MeeGo. Горящая платформа, это то состояние в которое Нокиа загнали годы расслабленного лидерства и тупоголовые амбиции предыдущего CEO – Олли-Пекки Каласвуо с кликой подкаркивающих вице-президентов.
  • С бюрократией и бизнес процессами, имеющимися на 2010 год, Нокиа не спас бы ни Андроид, ни половина населения Бангалора, пишущих на Qt под MeeGo. Даже если бы Apple бесплатно передал Нокиа iOS и все сервисы, то они бы выродились руками всяких Requirement Managerов в типичные Нокийские дизайн-химеры и в итоге загнулись через какое-то время.
  • То, что сделал великий CEO Элоп – было единственно возможным разумным решением, дающим хоть какие-то шансы на выживание. Вопрос «каким образом он это сделал?», остается открытым, равно как и вопрос «поможет ли это Нокиа?» в итоге. Не следует забывать, что нынешняя Нокиа — это совершенно новая организация, поэтому глупо предполагать, что она разом вернет себе лидерство. Как и всем новым организациям ей придется за это лидерство долго бороться.
  • Без ошибок и побед Нокиа никогда не было бы ни Андроида, ни Айфона. И Google и Apple тщательно проанализировали достоинства и недостатки более старших конкурентов перед тем как шагнуть вперед.

Все это в деталях — под катом. Предупреждаю что клевых картинок там нет. Сплошное графоманство и ёрничанье.
Читать дальше →

Доклад о вреде копирайта был удалён с сайта одного из комитетов конгресса США через день после публикации

Reading time4 min
Views127K
В пятницу, 16 ноября на сайте Republican Study Committee — организации, объединяющей более 170 членов палаты представителей США от республиканской партии, появился интереснейший документ. Под этим 9-страничным докладом не постеснялись бы подписаться многие активисты пиратских партий по всему миру. Не прошло и суток, как этот доклад убрали с сайта под предлогом того, что он не прошёл всех согласований и вообще не соответствует стандартам RSC. Что же было в этом, столь поспешно спрятанном документе?
Читать дальше →

Когнитивное смещение универсального интеллекта

Reading time36 min
Views20K

Введение.


В предыдущих статьях ( http://habrahabr.ru/post/150056/ и http://habrahabr.ru/post/150902/ ) мы рассмотрели простейшие модели идеального минимального интеллекта (ИМИ), в частности, модель AIξ. C не слишком существенными оговорками можно почти согласиться с тем, что «AIXI model is the most intelligent unbiased agent possible» [Hutter, 2007] и что ИМИ в своем поведении будет не более ограниченным, чем человек, но при наличии достаточных вычислительных ресурсов и информации. Последняя оговорка и поясняет основные причины, почему эти модели не привели к созданию реального ИИ и почему их можно рассматривать только в качестве первого маленького шага по направлению к нему. Здесь важно определить, куда двигаться дальше.
Читать дальше →

Жонглирование. Теория. Практика

Reading time5 min
Views43K
Настороженно отношусь к непрофильным топикам, но решил написать этот по следующим причинам:
  • У жонглирования есть своя теория — стройная и математически привлекательная!
  • Мы живем не только работой. Жонглирование — отличное развлечение и разминка после долгого сидения за компом.
  • В пятницу приятно немного расслабиться и почитать не очень серьезные статьи. К тому же, будет чем заняться на выходные, особенно если у вас не было определенных планов.

Теория


Утверждать, что жонглирование — это последовательность бросков, все равно, что сказать, что музыка — это просто последовательность нот. Нельзя назвать это неправдой, но любой, хоть немного знакомый с музыкальной теорией, возмутится последним определением — столь поверхностным и недалеким.
Читать дальше →

Иисус Христос и этика свободного копирования

Reading time10 min
Views87K
Роджер Желязны, роман «Князь Света»:
Ниррити положил руку ему на плечо.

— Значит, само твоё существо изнемогает, должно быть, от боли, внимая насаждаемому ими богохульству!

— Не очень-то я их жалую, да и они меня тоже.

— Ещё бы. Но вот Сэм — он же делал то же самое — преумножая число ересей, ещё глубже погребая истинное Слово…

— Оружие, Ренфрю, — сказал Ольвегг. — Оружие и ничего более. Я уверен, что он хотел стать богом не больше, чем ты или я.

— Может быть. Но лучше бы он подыскал другое оружие. Хоть он и побеждает, души их всё равно потеряны.
Конец цитаты.

Эти строки покойного фантаста наилучшим образом отражают то настроение, в которое я погрузился, когда aleksandrit двенадцать дней назад (5 января 2012 года) ознакомил всех нас с новостью о том, что в Швеции файлообмен и вообще свободное копирование теперь рассматривается как отдельная религия, как новая церковь, как вероучение — копимизм.

Является ли эта перемена, это событие скорее победою свободного копирования над учением правоторговцев о копирайте, или же торжество копимизма вернее свидетельствует о тяжёлом моральном, идеологическом, вероисповедном и духовном поражении копимистов в этой борьбе?

Чтобы ответить на этот вопрос, следует прежде всего увидеть всю картину событий в её исторической перспективе.

Для начала давайте вспомним, что заповедная черта между идеологическими и вероисповедными доводами в споре о копировании была впервые пересечена отнюдь не недавними шведами копимизма. Как раз наоборот, это сделали сторонники копирайта и правоторговли, причём достаточно давно. Уместно думать, что черта эта была впервые нарушена тогда, когда нелицензионное компьютерное копирование впервые широко объявили кражею. (Я считаю разумным думать, что сделал это Билл Гейтс 3 февраля 1976 года в четвёртом абзаце «An Open Letter to Hobbyists», защищая бизнес-интересы своей компании, тогда называвшейся «Micro-Soft» через дефис.) В вероисповедном отношении это значит, что нелицензионное копирование (совершаемое вместо уплаты денег поставщику) было тогда объявлено грехом (нарушением Божией заповеди «не укради», которая среди десяти заповедей в православии считается восьмою, а лютеранами и римско-католическою церковью считается седьмою).

Вижу, что ожидания правоторговцев всецело оправдалися: постановка знака равенства между нелицензионным копированием и воровством действительно стала тяжким ударом по айтишникам из числа христиан — ударом по их совести. Даже сейчас, спустя более чем тридцать пять лет, нет-нет да и встретишь на христианском форуме беседу (иногда на десятки страниц) о том, является ли нарушение копирайта грехом, требует ли исповедания греха и последующего деятельного раскаяния.

Но ведь и ответ копимистов на этот удар, их новое вероисповедное оружие выглядит неудовлетворительным. Ну то есть для неверующего, может быть, и кажется полезным притвориться, что копирование — это такая как бы церковь, чтобы юристы поменьше доставали. Но уж христианину-то не приличествует отречься от Христа и переменить веру во имя одной только свободы копирования. Крайне глупо отказываться заплатить правообладателю деньгами, но быть вполне согласным поплатиться душою. (Да и вся ситуация не выглядит ведь поводом для такого глубокого отчаяния, как «мы другова Бога сыщем» в сказке у Саморядова.)

Вместо того достаточно было бы попристальнее вглядеться и вникнуть в настоящее (а не вымышленное) отношение христианства к копирайту.

Читать дальше →

Chumby Hacker Board

Reading time2 min
Views5.2K

Многие, наверное, уже слышали о таком замечательном гаджете как Chumby One. Например, здесь был его анонс. Многие даже, наверное, слышали о Sony Dash. Под эти гаджеты сделано уже более 1500 приложений.
Теперь же, если вы любитель «DIY или Сделай Сам», то можете купить саму его начинку, кастомизировать и встроить куда угодно.
Подробнее о нем и его характеристиках

По следам интеллекта

Reading time3 min
Views9.3K

По следам интеллекта


С момента первых попыток моделировать процессы, протекающие в человеческом мозге, наука прошла множество ступенек приближающих нас к ИИ. Но мозг человека, совершает пока что неподъемную и слабо отслеживаемую работу по непрерывной обработке потока сенсорной информации. Я попытаюсь осмысленно рассказать основные вехи эволюции искусственных нейронных сетей (ИНС).
Читать дальше →

О нелегитимности копирайта

Reading time3 min
Views3K
Свою позицию по авторскому праву я излагал здесь: раз, два. Дописать это небольшое дополнение меня сподвигло небезызвестное выступление господина Акопова.

Господин Акопов, обращаясь к пользователям «ВКонтакте» пишет:

Мы очень надеемся, что владельцы и управляющие крупнейших сайтов соберутся где-нибудь вместе и договорятся друг с другом перейти на легальную модель. Это было бы величайшим доказательством справедливого устройства мира для миллионов людей. Это можно было бы назвать гражданским подвигом. В самом деле, я не думаю, что, например, сеть В Контакте создавалась для того, чтобы размещать ворованное видео — просто был реализован функционал загрузки и просмотра, а дальше получилось «как всегда». И уж тем более я не думаю, что аудитория сети разбежится, если в ней останутся только ссылки на легальное видео.


Господин Акопов — а он (либо его референт), судя по тексту, довольно образованный человек — употребил здесь правильное слово, которое я позволил себе выделить: легальный. Легальность означает соответствие закону — законность, проще говоря.

Но я позволю себе напомнить господину Акопову о другом термине с тем же корнем: легитимность. Легитимность — это признание обществом законности государственных институтов. В широком смысле слова, легитимность — признание справедливым социального устройства общества.

Так вот, господин Акопов: копирайт нелегитимен.

А почему?

10 вещей, которые никогда не преподаются программистам в вузах

Reading time2 min
Views9.8K
10 вещей, которые никогда не преподаются программистам в вузах.

1. Мы не правы


Программисты зачастую имеют большое эго. Поэтому часто бывает трудно осознать, что мы не правы в чем-то. Я видел много споров относительно архитектуры проектов, где разработчики расхваливают свои идеи. Но, предположим, что мы все неправы. И отличаемся только в степени своих заблуждений.
Очень важно осознать и принять этот факт только один раз и мы будем открыты, чтобы выслушать других и использовать свои идеи, чтобы создать лучшее решение.

далее

Information

Rating
4,275-th
Location
Вологда, Вологодская обл., Россия
Date of birth
Registered
Activity