Articles / Bookmarks / Profile of Ruzin / Habr

Рузин Алексей @Ruzin

Разработчик

Profile Publications 2Comments 65Bookmarks 126

AlekSandrDr Apr 20 2019 at 17:14

Python Testing с pytest. Использование pytest с другими инструментами, ГЛАВА 7

24 min

41K

Python*

Tutorial

Translation

Вернуться

Обычно pytest используется не самостоятельно, а в среде тестирования с другими инструментами. В этой главе рассматриваются другие инструменты, которые часто используются в сочетании с pytest для эффективного и результативного тестирования. Хотя это отнюдь не исчерпывающий список, обсуждаемые здесь инструменты дадут вам представление о вкусе силы смешивания pytest с другими инструментами.

Читать дальше →

+12

Vasyutka May 29 2017 at 01:56

Нейронные сети в детектировании номеров

7 min

53K

Recognitor corporate blogImage processing*Machine learning*Algorithms*

Распознавание автомобильных номеров до сих пор является самым продаваемым решением на основе компьютерного зрения. Сотни, если не тысячи продуктов конкурируют на этом рынке уже на протяжении 20-25 лет. Отчасти поэтому сверточные нейронные сети (CNN) не бьют прежние алгоритмические подходы на рынке.

Но опыт последних лет говорит, что алгоритмы CNN позволяют делать надежные и гибкие для применения решения. Есть и еще одно удобство: при таком подходе всегда можно улучшить надежность решения на порядок после реального внедрения за счет переобучения. Кроме того, такие алгоритмы отлично реализуются на GPU (графических модулях), которые значительно эффективней с точки зрения потребления электроэнергии, чем обычные процессоры. А платформа Jetson TX от NVidia так просто потребляет очень мало по меркам современных вычислителей. Наглядное «энергетическое превосходство»:

Читать дальше →

+67

habit Apr 20 2016 at 11:31

Создание пакета Debian с нуля

10 min

40K

ua-hosting.company corporate blog

Translation

Создание пакета Debian с нуля является своего рода волшебным процессом. Вы могли бы начать гуглить с запросом “Создание пакета Debian с нуля” и получить множество результатов, ни один из которых не стал бы тем, который Вам необходим. Несомненно, Вы найдете большой обзор команд, которые используются в Debian и, если Вы роете достаточно глубоко, Вы сможете все же найти пару команд, которые помогут создать базовый пакет Debian, но не смогут объяснить, что происходит. Более подробную информацию о том, что все же «происходит» Вы можете получить, в данном посте мы попробуем это частично затронуть.

Читать дальше →

+17

rotor Mar 14 2016 at 10:41

Ардуино С++11 библиотека для управления светодиодными матрицами

2 min

13K

Developing for Arduino*

Сегодня я хотел бы выступить в необычном для хаба Arduino качестве и рассказать не об устройстве, а о библиотеке.
Речь пойдет о библиотеке LedMatrix (русскоязычное описание), которая умеет управлять светодиодными матрицами 8x8 на чипах MAX7219 и MAX7221.

Читать дальше →

Milfgard Jan 26 2016 at 16:58

Как писать презентацию для вложения в письмо

3 min

18K

Бюро копирайтинга Textbroker.ru corporate blogContent-marketing*Media management*

Привет! Я продолжаю цикл (в блоге замечательного человека Михаила, владельца Текстброкера) про буквы, и что с ними можно сделать.

Скорее всего, презентация нафиг не нужна никому, кроме вас. За презентацией прячутся сотрудники, которые не умеют писать что надо словами. В большинстве случаев это просто костыль, лишь бы чего лишнего не ляпнуть.

Есть два важных исключения. Первое – это когда вы говорите с большим бизнесом. Там презентация будет заботливо распечатана и положена на стол руководителю. Руководитель и получатель вашего письма – разные лица, поэтому нужна суть, которая дойдёт и до него. Второе исключение – это когда нужно укомпоновать много картинок, графиков и других штук, то есть, по факту, приложить или каталог товаров, или же схему проекта.

Главное правило презентации очень простое: если первый и второй кадр про вас, а не про получателя – она сразу летит в корзину без вопросов.

Читать дальше →

+19

yarigpopov Jan 19 2016 at 22:53

Опыт переезда для работы программистом в Берлин (часть 2)

7 min

46K

IT career

Добрый день! В первой части я рассказывал о том, как получал визу и искал жилье, а в этой расскажу, как найти работу в Германии и как это делал я. Забегая вперед, скажу, что в Берлине мне потребовалась 10 дней, чтобы получить первый оффер, который я в итоге и принял. Но приготовления были, конечно, более длительными.

Читать дальше →

+30

108

frii_fond Jan 14 2016 at 09:41

Диалог с инвестором: Живой пример и разбор ситуации

10 min

23K

Фонд развития интернет-инициатив corporate blogVenture investmentProject management*

Translation

Cтэнфордский курс CS183B: How to start a startup. Стартовал в 2012 году под руководством Питера Тиля. Осенью 2014 года прошла новая серия лекций ведущих предпринимателей и экспертов Y Combinator:

Вторая часть курса

Кирсти Нейту и Кэролинн Леви: Юридические основы запуска стартапа;
Кирсти Нейту и Кэролинн Леви: Основы привлечения инвестиций;
Кирсти Нейту и Кэролинн Леви: Основы работы с сотрудниками;
Тайлер Босмени: С чего начинать и как общаться с клиентами;
Майкл Сайбл и Касар Юнис: Как убедить инвестора и получить финансирование.

Первая часть курса

Сэм Альтман и Дастин Московитц: Как и зачем создавать стартап?
Сэм Альтман: Как сформировать команду и культуру стартапа?
Пол Грэм: Нелогичный стартап;
Адора Чьюнг: Продукт и кривая честности;
Адора Чьюнг: Стремительный рост стартапа;
Питер Тиль: Конкуренция – удел проигравших;
Питер Тиль: Как построить монополию?
Алекс Шульц: Введение в growth hacking [1, 2, 3];
Кевин Хейл: Тонкости в работе с пользовательским опытом [1, 2];
Стэнли Тэнг и Уокер Уильямс: Начинайте с малого;
Джастин Кан: Как работать с профильными СМИ?
Андрессен, Конуэй и Конрад: Что нужно инвестору;
Андрессен, Конуэй и Конрад: Посевные инвестиции;
Андрессен, Конуэй и Конрад: Как работать с инвестором;
Брайан Чески и Альфред Лин: В чем секрет культуры компании?
Бен Сильберман и братья Коллисон: Нетривиальные аспекты командной работы [1, 2];
Аарон Леви: Разработка B2B-продуктов;
Рид Хоффман: О руководстве и руководителях;
Рид Хоффман: О лидерах и их качествах;
Кит Рабуа: Управление проектами;
Кит Рабуа: Развитие стартапа;
Бен Хоровитц: Увольнения, повышения и переводы по службе;
Бен Хоровитц: Карьерные советы, вестинг и опционы;
Эммет Шир: Как проводить интервью с пользователями; 
Эммет Шир: Как в Twitch разговаривают с пользователями;
Хосейн Рахман: Как в Jawbone проектируют hardware-продукты;
Хосейн Рахман: Процесс проектирования в Jawbone.

Читать дальше →

+13

ZlodeiBaal Jan 13 2016 at 03:36

Постановка задачи компьютерного зрения

13 min

72K

Algorithms*System Analysis and Design*Machine learning*Image processing*Website development*

Последние лет восемь я активно занимаюсь задачами, связанными с распознаванием образов, компьютерным зрением, машинным обучением. Получилось накопить достаточно большой багаж опыта и проектов (что-то своё, что-то в ранге штатного программиста, что-то под заказ). К тому же, с тех пор, как я написал пару статей на Хабре, со мной часто связываются читатели, просят помочь с их задачей, посоветовать что-то. Так что достаточно часто натыкаюсь на совершенно непредсказуемые применения CV алгоритмов.
Но, чёрт подери, в 90% случаев я вижу одну и ту же системную ошибку. Раз за разом. За последние лет 5 я её объяснял уже десяткам людей. Да что там, периодически и сам её совершаю…

В 99% задач компьютерного зрения то представление о задаче, которое вы сформулировали у себя в голове, а тем более тот путь решения, который вы наметили, не имеет с реальностью ничего общего. Всегда будут возникать ситуации, про которые вы даже не могли подумать. Единственный способ сформулировать задачу — набрать базу примеров и работать с ней, учитывая как идеальные, так и самые плохие ситуации. Чем шире база-тем точнее поставлена задача. Без базы говорить о задаче нельзя.

Тривиальная мысль. Но все ошибаются. Абсолютно все. В статье я приведу несколько примеров таких ситуаций. Когда задача поставлена плохо, когда хорошо. И какие подводные камни вас ждут в формировании ТЗ для систем компьютерного зрения.

Читать дальше →

+72

ser0t0nin Jul 2 2015 at 18:09

Иерархическая классификация сайтов на Python

8 min

27K

DCA (Data-Centric Alliance) corporate blogBig Data*Python*Machine learning*

Привет, Хабр! Как упоминалось в прошлой статье, немаловажной частью нашей работы является сегментация пользователей. Как же мы это делаем? Наша система видит пользователей как уникальные идентификаторы cookies, которые им присваиваем мы или наши поставщики данных. Выглядит этот id, например, так:

42bcfae8-2ecc-438f-9e0b-841575de7479

Эти номера выступают ключами в различных таблицах, но первоначальным value является, в первую очередь, URL страниц, на которых данная кука была загружена, поисковые запросы, а также иногда некоторая дополнительная информация, которую даёт поставщик – IP-адрес, timestamp, информация о клиенте и прочее. Эти данные довольно неоднородные, поэтому наибольшую ценность для сегментации представляет именно URL. Создавая новый сегмент, аналитик указывает некоторый список адресов, и если какая-то кука засветится на одной из этих страничек, то она попадает в соответствующий сегмент. Получается, что чуть ли не 90% рабочего времени таких аналитиков уходит на то, чтобы подобрать подходящий набор урлов – в результате кропотливой работы с поисковиками, Yandex.Wordstat и другими инструментами.

Получив таким образом более тысячи сегментов, мы поняли, что этот процесс нужно максимально автоматизировать и упростить, при этом иметь возможность мониторинга качества алгоритмов и предоставить аналитикам удобный интерфейс для работы с новым инструментом. Под катом я расскажу, как мы решаем эти задачи.

Читать дальше →

+36

ser0t0nin Jan 11 2016 at 16:35

Рекурентная нейронная сеть в 10 строчек кода оценила отзывы зрителей нового эпизода “Звездных войн”

11 min

160K

DCA (Data-Centric Alliance) corporate blogPython*Machine learning*

Hello, Habr! Недавно мы получили от “Известий” заказ на проведение исследования общественного мнения по поводу фильма «Звёздные войны: Пробуждение Силы», премьера которого состоялась 17 декабря. Для этого мы решили провести анализ тональности российского сегмента Twitter по нескольким релевантным хэштегам. Результата от нас ждали всего через 3 дня (и это в самом конце года!), поэтому нам нужен был очень быстрый способ. В интернете мы нашли несколько подобных онлайн-сервисов (среди которых sentiment140 и tweet_viz), но оказалось, что они не работают с русским языком и по каким-то причинам анализируют только маленький процент твитов. Нам помог бы сервис AlchemyAPI, но ограничение в 1000 запросов в сутки нас также не устраивало. Тогда мы решили сделать свой анализатор тональности с блэк-джеком и всем остальным, создав простенькую рекурентную нейронную сеть с памятью. Результаты нашего исследования были использованы в статье “Известий”, опубликованной 3 января.

В этой статье я немного расскажу о такого рода сетях и познакомлю с парой классных инструментов для домашних экспериментов, которые позволят строить нейронные сети любой сложности в несколько строк кода даже школьникам. Добро пожаловать под кат.

Читать дальше →

+68

chubakur Sep 23 2015 at 13:39

Распознавание речи с помощью CMU Sphinx

4 min

84K

Sound

From sandbox

CMU Sphinx сейчас является крупнейшим проектом по распознаванию человеческой речи. В инструментарий входят следующие программы и библиотеки:

Pocketsphinx — небольшая программа, которая принимает на вход произвольные акустические модели, грамматики и словари, а также звуковой поток(либо звуковой файл, либо сам берет поток с микрофона). На выходе получается распознанный текст. Написана на C, работает быстро.
Sphinxbase — библиотека необходимая для работы Pocketsphinx
Sphinx4 — гибкая библиотека для распознавания, написана на Java.
Sphinxtrain — программа для обучения акустических моделей.

Для работы со CMU Sphinx важно запомнить несколько определений и понять их отличия.

Акустическая модель — отвечает за сопоставление звуку произнесенной фонемы. Акустическую модель для русского языка можно скачать на сайте проекта. Русская акустическая и языковая модели. А также словарь.
Словарь — это файл, в котором написаны сопоставлены лексемы и фонемы (слово и его транскрипция). Например, калькулятор (k ay ll k u ll ja t ay r). Он необходим для преобразования фонем, распознанных акустической моделью в лексемы.
Грамматика — это формальные правила, которые описывают простые правила построения предложений. Лексемы, полученные на предыдущем шаге пытаются сопоставиться с грамматикой и если удачно, то выводится результат.
Языковая модель — это статистическая модель языка. Она описывает вероятности слов и их комбинаций. Таким образом распознавание лексем — это максимизация правдоподобности распознанной фразы.

Чем сложнее язык, чем обширней правила и размер словаря, тем хуже точность распознавания. Поэтому, для минимизации ошибки, имеет смысл создания упрощенных правил, которые будут описывать конкретную задачу.

Читать дальше →

+18

olartamonov Dec 24 2014 at 13:21

Black Swift: зачем мы его сделали

7 min

126K

Black Swift corporate blog

Как уважаемые хабровчане знают, вот уже почти год мы разрабатываем маленький компьютер (примерно с SD-карточку), работающий под OpenWRT, со встроенным Wi-Fi, USB, Ethernet, азартными играми и доступными женщинами. Дмитрий dzhe уже несколько раз писал про него — и, в общем, с каждым разом собирал в комментариях один и тот же вопрос: а зачем вы вообще его делаете? Ну ведь есть же Raspberry Pi, стоит он столько же, есть VoCore, Carambola, Edison, в конце концов, — зачем нужен ещё один «нанокомпьютер»?

Пожалуй, надо наконец на этот вопрос ответить — заодно отметив этим ответом появление у нас своего корпоративного блога (спасибо, Хабр!), а также запуск отдельного веб-сайта, посвященного только этому проекту.

Если коротко: хотя изначально проект начинался как «а не сделать ли нам нанокомпьютер как у китайцев, но для себя и подешевле?», мотивация довольно быстро сместилась — мы поняли, что можем сделать его если не дешевле, то лучше и удобнее, и не только для себя.

Читать дальше →

+118

228

Milfgard Dec 24 2014 at 15:10

Как нормальные пацаны заходят в Мегу: 7 магазинов за месяц

6 min

125K

Мосигра corporate blog

^{Мы в Меге Химки, фото одного из наших тайных покупателей на независимой проверке}

Привет!
Тут рассказывали, что Мега — это невозможно. Скажем так, наш опыт показывает немного обратное. И, чтобы не плодить иллюзии, расскажу чуть подробнее.

Во-первых, надо понимать, что Мега — это настоящий Клондайк. Если знать и уметь. Причина очень простая — реально много людей (не каждый торговый центр так может), все они ориентированы на шоппинг и очень платёжеспособны, плюс очень правильная и отточенная инфраструктура, порядки. Что, собственно, из плюсов может становиться минусами, если вы не развились до нужного уровня.

У нас с весны открыт магазин в Химках, полтора года работает магазин в Нижнем Новгороде, был магазин в Меге Уфы. В декабре мы открыли ещё 7 магазинов в Мегах.

Читать дальше →

+196

148

VladGorbatiuk Dec 10 2014 at 15:22

Параллельное программирование с CUDA. Часть 1: Введение

11 min

132K

EPAM corporate blogGPGPU*Concurrent computing*

Tutorial

Еще одна статья о CUDA — зачем?

На Хабре было уже немало хороших статей по CUDA — раз, два и другие. Однако, поиск комбинации «CUDA scan» выдал всего 2 статьи никак не связанные с, собственно, алгоритмом scan на GPU — а это один из самых базовых алгоритмов. Поэтому, вдохновившись только что просмотренным курсом на Udacity — Intro to Parallel Programming, я и решился написать более полную серию статей о CUDA. Сразу скажу, что серия будет основываться именно на этом курсе, и если у вас есть время — намного полезнее будет пройти его.

Читать дальше →

+23

filldens Nov 24 2014 at 14:06

Интерактивное голосовое редактирование текста с помощью новых речевых технологий от Яндекса

11 min

97K

Яндекс corporate blogAPI*Yandex API*

Сегодня наше приложение Диктовка для интерактивного написания и редактирования текста голосом появилось в AppStore и Google Play. Его главная задача — продемонстрировать часть новых возможностей комплекса речевых технологий Яндекса. Именно о том, чем интересны и уникальны наши технологии распознавания и синтеза речи, я хочу рассказать в этом посте.

Пара слов, чтобы вы понимали, о чём пойдёт речь. Яндекс уже давно предоставляет бесплатное мобильное API, которое можно использовать, например, для распознавания адресов и голосовых запросов к поиску. За этот год мы смогли довести его качество почти до того же уровня, на котором такие запросы и реплики понимают сами люди. И теперь мы делаем следующий шаг — модель для распознавания свободной речи на любую тему.

Кроме этого, наш синтез речи поддерживает эмоции в голосе. И, насколько нам известно, это пока первый коммерчески доступный синтез речи с такой возможностью.

Обо всём этом, а также о некоторых других возможностях SpeechKit: об активации голосом, автоматической расстановке пунктуационных знаков и распознавании смысловых объектов в тексте — читайте ниже.

Читать дальше →

+110

104

MaryaA Feb 3 2012 at 12:33

«One Last Thing» — документальный фильм о Стиве Джобсе (2011 год), профессиональный русский перевод

1 min

13K

IT-companies

«Одна последняя вещь» (One Last Thing) — документальный фильм о Стиве Джобсе, выпущенный в 2011 году. В фильм включено неизвестное интервью Стива Джобса, данное в 1994 году, а также интервью со Стивом Возняком, Рональдом Уэйном, Дином Хови, Россом Перо. Перевод на русский язык — канал GTV.

Читать дальше →

+34

alexn Nov 10 2011 at 19:38

Маверики в деле

3 min

811

Lumber room

Don't worry about what anybody else is going to do… The best way to predict the future is to invent it.

Эта книга — воплощение вдохновения.

Она дает «крылья» или мощнейший «пинок под зад», кому как больше нравится.

Авторы исследовали и выделили общие черты трех дюжин компаний, которые благодаря своей оригинальности и креативности разделили всю отрасль на две половины: себя и всех остальных.

Читать дальше →

ddespot Aug 11 2011 at 16:15

3 в 1: Обсуждения, задачи, документация

4 min

IT-companies

В нашей команде работает более 30 человек. Мы разрабатываем масштабируемые решения для web. Живем в Томске, Санкт-Петербурге и в Москве. Для организации совместной работы над задачами мы использовали task-трекер. Во время проектов создавались ценные наработки и нужно было организовать работу со знаниями. Мы пробовали различные wiki-системы. Оказалось, что большая часть наших знаний создается при решении текущих задач. Мы сталкивались с проблемами:

Заносить и вести все задачи в task-трекере неудобно, и поэтому сотрудники все время переходят на общение через мессенджеры.
Много знаний оседает в e-mail и месенджерах. Перенос знаний из переписки в task-трекер и wiki отнимает много сил и времени.
Если при планировании проекта в wiki была записана вся концепция проекта, то с каждым днем различий между информацией в wiki и реальным положением дел становится все больше, и поддержка базы знаний становится неоправданно трудоемкой.

Решая эти проблемы, мы разработали собственную методологию и среду совместной работы. Так родился новый проект. В этой статье хотим рассказать о нем. Для начала посмотрим на то, как организована совместная работа в команде.

Читать дальше →

+33

freetonik Aug 10 2011 at 10:35

Ричард Фейнман: удовольствие делать открытия

1 min

12K

Interview

Первая часть программы Horizon (BBC, 1981) с Ричардом Фейнманом. О красоте, об отце, о названиях и именах, об алгебре, о наблюдениях и униформе. Это интервью во многом пересекается с книгой "Вы, конечно, шутите, мистер Фейнман", поэтому по большей части монолог касается жизни ученого, его взгляде на жизнь и тому, как такой взгляд развился и кто на него повлиял.

Читать дальше →

+163

grevus Jun 12 2011 at 22:33

Работа и жизнь в Дубае. Мой опыт

3 min

9.5K

IT-emigration

В процессе общения в личке с Londoner после его поста, а также вопросов, которые начали задавать после моего комментария появилось желание рассказать о том, как мне живется и работается в Дубае (ОАЭ) и ответить на все поставленные вопросы.

Готовы ли Вы рассматривать ОАЭ как страну для постоянного проживания? Уж очень много восточной специфики, или я не прав?

Что касается Дубая в частности и ОАЭ в целом, то да… Я рассматриваю этот город как место постоянного проживания) Собственно тут, я уже проживаю год (без малого). И собираюсь оставаться как можно дольше.

Дальше больше...

+112

174

2 3 ...

6 7