Как стать автором
Обновить
82
0

Пользователь

Отправить сообщение

Continuous Integration вместе с buildbot: а зачем?

Время на прочтение2 мин
Количество просмотров10K

В прошлом посте я хотел познакомить хабражителей с buildbot'ом. Но тема была мной раскрыта не до конца.
Сегодня я постараюсь немного наверстать упущенное.
Читать дальше →
Всего голосов 34: ↑20 и ↓14+6
Комментарии6

Задача изменения голоса. Часть 1. Что такое голос?

Время на прочтение12 мин
Количество просмотров55K
Этим постом мы хотели бы начать цикл статей, посвященных задаче изменения голоса. В зарубежной литературе данную задачу часто именуют термином voice morphing, в отечественной литературе данная задача ещё не получила достаточного освещения как в научных, так и в инженерных кругах. Тема является достаточно обширной и во многом творческой. В результате работы в данном направлении у нас накопился определенный опыт, который мы планируем систематизировать и изложить, а также передать основную суть некоторых алгоритмов.

image

Изменение голоса может преследовать разную цель. Два основных направления, которые тут однозначно можно выделить – это получение реалистичного звучания измененного голоса и получение некоторого причудливо-фантастичного звучания. Неплохих результатов во втором случае вполне можно добиться, обрабатывая речевой сигнал как обычный звук, не заостряя внимание на его особенностях и делая многие допущения. Например, индустрия электронной музыки породила колоссальное количество разнообразных аудио-эффектов и результат их применения к речевому сигналу помогает создать самый невероятный образ говорящего.
В задаче реалистичного изменения голоса применение «музыкальных» (назовем их так) аудио-эффектов может привнести искажения, не характерные для натуралистичного звучания речи. В подобном случае необходимо более точно понимать, из каких звуков состоит речь, как они образуются и какие их свойства являются критическими для восприятия. Проще говоря — необходимо производить анализ сигнала перед его обработкой. При автоматизированной обработке речевого сигнала в реальном времени этот анализ усложняется многократно, т.к. умножается количество неопределенностей, которые надо как-то попытаться разрешить, и сокращается количество применимых алгоритмов.
В ближайших статьях мы рассмотрим варианты простейшей реализации таких эффектов, как изменение пола говорящего и изменение возраста говорящего. Чтобы читатель лучше понимал, какие параметры сигнала будут изменяться, в первых статьях будут затронуты основные вопросы образования звуков речи и способы формального описания речевого сигнала. После этого уже будут обсуждаться конкретные предлагаемые алгоритмы изменения голоса, их сильные и слабые стороны.

P.S.
Добавил дополнительные ссылки на первоисточники

Читать дальше →
Всего голосов 94: ↑93 и ↓1+92
Комментарии31

Профилирование и отладка Python, отладка

Время на прочтение7 мин
Количество просмотров110K
В предыдущей статье мы закончили разговор о профилировании обзором событийных профайлеров.

Сегодня я предлагаю рассмотреть методы отладки программ.

Начнём!
Всего голосов 50: ↑48 и ↓2+46
Комментарии26

Поиск кропнутых дубликатов изображений с помощью перцептуальных хешей

Время на прочтение6 мин
Количество просмотров71K
В этой статье пойдет речь о том, как решалась небольшая задачка поиска дубликатов по фрагменту или кропу картинки.



Читать дальше →
Всего голосов 129: ↑118 и ↓11+107
Комментарии39

Введение в анализ текстовой информации с помощью Python и методов машинного обучения

Время на прочтение9 мин
Количество просмотров65K

Введение


Сегодня я продолжу рассказ о применении методов анализа данных и машинного обучения на практических примерах. В прошлой статье мы с вами разбирались с задачей кредитного скоринга. Ниже я попытаюсь продемонстрировать решение другой задачи с того же турнира, а именно «Задачи о паспортах» (Задание №2).
При решении будут показаны основы анализа текстовой информации, а также ее кодирование для построения модели с помощью Python и модулей для анализа данных (pandas, scikit-learn, pymorphy).
Читать дальше →
Всего голосов 38: ↑38 и ↓0+38
Комментарии9

Извлечение объектов и фактов из текстов в Яндексе. Лекция для Малого ШАДа

Время на прочтение6 мин
Количество просмотров42K
В докладе рассказывается о том, как мы извлекаем сущности (например, имена людей и географические названия) из текстов и запросов. А также об извлечении фактов, т.е. связей между объектами. Мы рассмотрим несколько подходов к решению этих задач: формулирование правил, составление словарей всевозможных объектов, машинное обучение.

Лекция рассчитана на старшеклассников — студентов Малого ШАДа, но и взрослые смогут с ее помощью восполнить некоторые пробелы.

http://video.yandex.ru/users/e1coyot/view/4/
Конспект лекции
Всего голосов 77: ↑71 и ↓6+65
Комментарии23

Как и почему я начал ходить на Управленческие поединки в Киеве

Время на прочтение5 мин
Количество просмотров8K


Сначала о Тарасове и его технологиях



О Тарасове и его концепции Искусства управленческой борьбы я впервые прочитал у Архангельского в его монографии «Организация времени», сама концепция борьбы, где «на войне обман морален», меня насторожила (сказался недостаток жизненного опыта — ну подросток, что вы хотите?). Почитал «Книгу для героев» — не понравилось, книга показалась каким-то вычурным гуруизмом автора. Ну и так я себе и жил дальше. Потом как-то наткнулся на хороший отзыв об аудиозаписи семинара «Управления по Макиавелли». Скачал (понимаю что украл – каюсь, надеюсь возместить авторскую плату) – послушал, и пришел в восторг: многие основополагающие вещи, как говорится «по жизни», я для себя открыл заново. Это было сродни какому-то взрослению, вроде как таблетку съел – и стал взрослым:)

Шутка, на самом деле это дало совершенно другой взгляд на мир, точнее дало социально-технологический взгляд на мир. Потому как именно здесь у меня был большой пробел. Это все равно что ты вдруг вынырнул совсем в другом мире, я понял, что не видел значительной, огромной по важности, стороны жизни. Я увидел неадекватность своей картины мира, очень надеюсь, что благодаря этому моя картина мира стала более адекватной. Я начал видеть те “мелочи жизни”, которые имеют невероятное влияние на жизнь (неспроста вначале этой статьи была такая картинка — ведь даже гвоздь, лежащий на дороге регулирует движение автомобилей).
Читать дальше →
Всего голосов 28: ↑10 и ↓18-8
Комментарии4

Решение японских кроссвордов в Wolfram Mathematica

Время на прочтение8 мин
Количество просмотров25K


Японский кроссворд — это известная головоломка, ответом которой является рисунок. Что это такое и как это решать, можно почитать на Википедии. Я хочу показать, как можно написать программу, которая будет решать японский кроссворд в системе Wolfram Mathematica путем перебора.
Читать дальше →
Всего голосов 49: ↑48 и ↓1+47
Комментарии36

Пишем красивый идиоматический Python

Время на прочтение4 мин
Количество просмотров113K

Иногда сложно найти в Сети правильные, а главное актуальные «best practices» для языка. Документация, конечно же, содержит всю необходимую информацию, но отсеять нужную вещь в абзацах подробного (на то она и документация) описания довольно сложно. Но недавно мне улыбнулся поиск Google, и я наткнулся на очень полезные «паттерны» языка Python от одного из core разработчиков — Raymond Hettinger.

Примечание: Все рекомендации даны в нескольких вариантах: сначала идут самые «плохие» варианты, а дальше предлагается лучшая альтернатива. Актуально для версии языка 2.7, отличия для версии 3.3 читайте в примечаниях к конкретному «паттерну».
Читать дальше →
Всего голосов 125: ↑99 и ↓26+73
Комментарии71

Microsoft Robotics. Параллельная обработка данных

Время на прочтение7 мин
Количество просмотров7.1K
Один из продуктов Microsoft — Microsoft Robotics включает библиотеку Concurrent and Coordination Runtime. Библиотека очень нужна роботам для организации параллельных вычислений при обработке звука и изображений (да и не только их). В посте я расскажу как с помощью данной библиотеки создать параллельный алгоритм умножения матрицы A (m × n элементов) на вектор B (1 × n элементов) по следующей формуле: . Алгоритм вычисления вектора C (m × 1 элементов) легко распараллеливается, так как значение i-го элемента вектора не зависит от значений других его элементов. Перед запуском примера из исходников рекомендуется установить Microsoft Robotics.
Подробности
Всего голосов 14: ↑11 и ↓3+8
Комментарии0

Архитектура Поиска Яндекса. Лекция для Малого ШАДа

Время на прочтение4 мин
Количество просмотров29K
В этой лекции на примере Яндекса будут рассмотрены базовые компоненты, необходимые для организации интернет-поисковика. Мы поговорим о том, как эти компоненты взаимодействуют и какими особенностями обладают. Вы узнаете также, что такое ранжирование документов и как измеряется качество поиска.

Лекция рассчитана на старшеклассников – студентов Малого ШАДа, но и взрослые могут узнать из нее много нового об устройстве поисковых машин.





Первый компонент нашей поисковой машины – это Паук. Он ходит по интернету и пытается выкачать как можно больше информации. Робот обрабатывает документы таким образом, чтобы по ним было проще искать. По простым html-файлам искать не очень удобно. Они очень большие, там много лишнего. Робот отсекает все лишнее и делает так, чтобы по документам было удобно искать. Ну и непосредственно поиск, который получает запросы и выдает ответы.
Конспект лекции
Всего голосов 62: ↑59 и ↓3+56
Комментарии9

OpenVX: стандарт компьютерного зрения

Время на прочтение4 мин
Количество просмотров28K
Автор: Виктор Ерухимов, исполнительный директор Itseez, председатель рабочей группы OpenVX

The Khronos Group 18 ноября 2013 года представила предварительную спецификацию стандарта OpenVX 1.0 для компьютерного зрения. Поскольку Itseez был одним из инициаторов этой деятельности и активно участвовал в создании спецификации, мы решили рассказать про этот стандарт аудитории Хабрахабра.

Читать дальше →
Всего голосов 55: ↑52 и ↓3+49
Комментарии19

Нестандартные чекбоксы

Время на прочтение4 мин
Количество просмотров11K

Задача


Получить возможность стилизовать чекбоксы с полным функционалом стандартных, с возможностью оставить стандартные при выключенном javascript-е, и вооружить различными колбеками и кастомными событиями. Иметь возможность изменять состояние групы чекбоксов.



Посмотреть пример на jsfiddle
Читать дальше →
Всего голосов 36: ↑14 и ↓22-8
Комментарии76

JavaFX и Spring. Вместе веселей

Время на прочтение8 мин
Количество просмотров32K


В данной статье я хочу рассказать о своем опыте интеграции таких вещей как JavaFX и Spring. И заодно использовать базу данных Derby и Maven для сборки приложения.

Введение


JavaFX выглядит довольно удобной и привлекательной технологией для реализации десктопных решений на платформе Java. Начиная с версии Java SE 7 Update 6, JavaFX является частью реализации Oracle Java SE, т.е. никаких дополнительных установок на стороне пользователя не требуется.

Spring со своей стороны, дает удобные фишечки в виде IoC, управление транзакциями и т.д., которые не хочется реализовывать самому.

Читать дальше →
Всего голосов 15: ↑14 и ↓1+13
Комментарии9

Учимся писать в информационном стиле

Время на прочтение2 мин
Количество просмотров105K
По работе я пишу тексты: посты на хабр, email-рассылку, статьи в СМИ. Пишу уже пару лет, последние полгода не меньше двух текстов в неделю. Значительным шагом в развитии моего навыка письма было открытие для себя информационного стиля и советов Максима Ильяхова.

Цель текста в информационном стиле — донести информацию до читателя. Информационный стиль: лаконичный, однозначный, точный и объективный. В информационных текстах нет лишних слов, эмоций, личного мнения. Они читаются легко и быстро.

Максим вводит понятие стоп-слов. Стоп-слова не характерны для текстов в информационном стиле и если вы встретили его — задумайтесь и перефразируйте это место. Стоп-слова это «кстати», междометия, модальные глаголы, отглагольные существительные и другие, всего около 100.

В какой-то момент мне стало сложно искать эти слова в текстах, поэтому я создал себе в помощь Test The Text. Test The Text выделяет в тексте слова нехарактерные для информационного стиля и объясняет почему.


Читать дальше →
Всего голосов 215: ↑199 и ↓16+183
Комментарии88

Открытые данные уже здесь

Время на прочтение6 мин
Количество просмотров9.9K
Не так давно я наткнулся на активно развивающуюся в России тему, которая у многих на слуху — Открытые данные.
Поскольку государственные органы агрегируют в себе большой массив полезных и важных данных, очевидна мотивация раскрыть информацию общественности.

Из официальных определений:
Открытые данные – это информация, созданная госорганами в пределах своих полномочий, которая может использоваться в любых законных целях без ограничения.


Погрузившись в поисковики, я нашел несколько площадок и даже конкурсных номинаций, где публикуются перспективные сервисы на основе государственных открытых данных, что мнгновенно натолкнуло меня на желание сделать для вас небольшой обзор наиболее заинтересовавших меня сервисов.

Читать дальше →
Всего голосов 18: ↑15 и ↓3+12
Комментарии8

WOW CSS

Время на прочтение2 мин
Количество просмотров38K
Доброго времени суток, уважаемые хабравчане. Не так уж давно, для того чтобы сделать что-то «округленное» с нефиксированной высотой приходилось создавать таблицу и крайним ячейкам в бэкграунд задавать нарезанные углы. Вообще любое «непрямоугольное» могло быть только графическим изображением. Сейчас же современные стандарты CSS позволяют создавать весьма интересные вещи. Но все нетипичные фигуры в большинстве своем дозволено сделать благодаря псевдо-селекторам :before и :after. Даже существуют некоторые «паттерны» для этого. А в недалеком будущем появится возможность задавать любые формы для элементов. С приходом CSS Masking я бы сказал наступит веб-дизайнерская сингулярность — веб-дизайн сможет быть любым. Единственное ограничение — это предел фантазии дизайнера. Но не будем о будущем. Все же я предлагаю вдохновиться прекрасным настоящим. В этом посте я собрал несколько крутых CSS реализаций. В некоторых из них спрятаны полезные техники, а в других любовь к CSS творчеству авторов этих подделок.

Не для таких же как и я каскадных зануд хочу добавить, что CSS изобретения могут быть и коммерчески выгодными. Только присутствие в CSSAWARDS, СSSWINNER, CSSREEL или CSSDESIGNAWARDS будет неплохой рекламой.

Таймер на чистом CSS




Читать дальше →
Всего голосов 82: ↑73 и ↓9+64
Комментарии14

Идеальный сайт – ТЗ как основа работы сайта, построенного на базе грамотных программных решений

Время на прочтение4 мин
Количество просмотров9.2K

Идеальный сайт – ТЗ как основа работы сайта, построенного на базе грамотных программных решений



Представьте себе, что Вы как владелец некой компании заказываете сайт компании у студии разработчика. Ситуация вполне стандартная и развивающаяся по стандартному сценарию.
Читать дальше →
Всего голосов 11: ↑4 и ↓7-3
Комментарии7

Почему 98% текстов на ваших сайтах не работают. Вообще. И как это починить

Время на прочтение7 мин
Количество просмотров284K

Вот так люди видят вашу страницу

Привет!
Проблема вот в чём. Если зайти на практически любой сайт интернет-магазина или компании с услугами, вы встретите контент. Точнее — отвратительные тексты, которые писали, кажется, маркетологи, воспитанные сеошниками.

Разумеется, можно не делать, как они. Если работать по-умному, то вы поможете и читателям по жизни, и себе в продажах.

По моим примерным подсчётам (усреднение с ряда позиций), конверсии для нас выглядят так:
  • Только название и картинка — около 1,5%.
  • С описанием от производителя — чуть более 2%.
  • С описанием человека, который держал это в руках и знает правила — около 6%.

Ниже — рассказ про то, как мы доводили время на сайте от 3 минут сначала до 6:40, а потом до 20:48. Да-да, двадцати минут сорока восьми секунд для среднего посетителя. Честного среднего, с учётом отказов и по полной выборке.
Читать дальше →
Всего голосов 294: ↑282 и ↓12+270
Комментарии121

Продающий дизайн интернет-магазина. Часть 2. Элементы интерфейса

Время на прочтение7 мин
Количество просмотров74K
Вторая часть статьи из цикла «Продающий дизайн интернет-магазина». Для тех, кто пропустил первую, её можно прочитать тут: «Продающий дизайн интернет-магазина. Часть 1. Аналитика». Сегодня я расскажу про разные части интерфейсов магазинов, которые важны для конверсии и продаж. Постараюсь обозначить какие элементы должны быть в шапке и футере сайта, на главной странице, на странице каталога и многое другое.

Логотипы крупнейших интернет-магазинов
Читать дальше →
Всего голосов 58: ↑41 и ↓17+24
Комментарии10

Информация

В рейтинге
Не участвует
Зарегистрирован
Активность