Статьи / Закладки / Профиль Ruzin / Хабр

Рузин Алексей @Ruzin

Разработчик

Профиль Публикации 2Комментарии 65Закладки 126

AlekSandrDr 20 апр 2019 в 17:14

Python Testing с pytest. Использование pytest с другими инструментами, ГЛАВА 7

24 мин

36K

Python*

Туториал

Перевод

Вернуться

Обычно pytest используется не самостоятельно, а в среде тестирования с другими инструментами. В этой главе рассматриваются другие инструменты, которые часто используются в сочетании с pytest для эффективного и результативного тестирования. Хотя это отнюдь не исчерпывающий список, обсуждаемые здесь инструменты дадут вам представление о вкусе силы смешивания pytest с другими инструментами.

Читать дальше →

+12

Vasyutka 29 мая 2017 в 01:56

Нейронные сети в детектировании номеров

7 мин

51K

Алгоритмы*Обработка изображений*Блог компании RecognitorМашинное обучение*

Распознавание автомобильных номеров до сих пор является самым продаваемым решением на основе компьютерного зрения. Сотни, если не тысячи продуктов конкурируют на этом рынке уже на протяжении 20-25 лет. Отчасти поэтому сверточные нейронные сети (CNN) не бьют прежние алгоритмические подходы на рынке.

Но опыт последних лет говорит, что алгоритмы CNN позволяют делать надежные и гибкие для применения решения. Есть и еще одно удобство: при таком подходе всегда можно улучшить надежность решения на порядок после реального внедрения за счет переобучения. Кроме того, такие алгоритмы отлично реализуются на GPU (графических модулях), которые значительно эффективней с точки зрения потребления электроэнергии, чем обычные процессоры. А платформа Jetson TX от NVidia так просто потребляет очень мало по меркам современных вычислителей. Наглядное «энергетическое превосходство»:

Читать дальше →

+67

habit 20 апр 2016 в 11:31

Создание пакета Debian с нуля

10 мин

38K

Блог компании ua-hosting.company

Перевод

Создание пакета Debian с нуля является своего рода волшебным процессом. Вы могли бы начать гуглить с запросом “Создание пакета Debian с нуля” и получить множество результатов, ни один из которых не стал бы тем, который Вам необходим. Несомненно, Вы найдете большой обзор команд, которые используются в Debian и, если Вы роете достаточно глубоко, Вы сможете все же найти пару команд, которые помогут создать базовый пакет Debian, но не смогут объяснить, что происходит. Более подробную информацию о том, что все же «происходит» Вы можете получить, в данном посте мы попробуем это частично затронуть.

Читать дальше →

+17

rotor 14 мар 2016 в 10:41

Ардуино С++11 библиотека для управления светодиодными матрицами

2 мин

13K

Разработка под Arduino*

Сегодня я хотел бы выступить в необычном для хаба Arduino качестве и рассказать не об устройстве, а о библиотеке.
Речь пойдет о библиотеке LedMatrix (русскоязычное описание), которая умеет управлять светодиодными матрицами 8x8 на чипах MAX7219 и MAX7221.

Читать дальше →

Milfgard 26 янв 2016 в 16:58

Как писать презентацию для вложения в письмо

3 мин

18K

Блог компании Бюро копирайтинга Textbroker.ruКонтент и копирайтинг*Управление медиа*

Привет! Я продолжаю цикл (в блоге замечательного человека Михаила, владельца Текстброкера) про буквы, и что с ними можно сделать.

Скорее всего, презентация нафиг не нужна никому, кроме вас. За презентацией прячутся сотрудники, которые не умеют писать что надо словами. В большинстве случаев это просто костыль, лишь бы чего лишнего не ляпнуть.

Есть два важных исключения. Первое – это когда вы говорите с большим бизнесом. Там презентация будет заботливо распечатана и положена на стол руководителю. Руководитель и получатель вашего письма – разные лица, поэтому нужна суть, которая дойдёт и до него. Второе исключение – это когда нужно укомпоновать много картинок, графиков и других штук, то есть, по факту, приложить или каталог товаров, или же схему проекта.

Главное правило презентации очень простое: если первый и второй кадр про вас, а не про получателя – она сразу летит в корзину без вопросов.

Читать дальше →

+19

yarigpopov 19 янв 2016 в 22:53

Опыт переезда для работы программистом в Берлин (часть 2)

7 мин

46K

Карьера в IT-индустрии

Добрый день! В первой части я рассказывал о том, как получал визу и искал жилье, а в этой расскажу, как найти работу в Германии и как это делал я. Забегая вперед, скажу, что в Берлине мне потребовалась 10 дней, чтобы получить первый оффер, который я в итоге и принял. Но приготовления были, конечно, более длительными.

Читать дальше →

+30

108

frii_fond 14 янв 2016 в 09:41

Диалог с инвестором: Живой пример и разбор ситуации

10 мин

23K

Блог компании Фонд развития интернет-инициативУправление проектами*Венчурные инвестиции

Перевод

Cтэнфордский курс CS183B: How to start a startup. Стартовал в 2012 году под руководством Питера Тиля. Осенью 2014 года прошла новая серия лекций ведущих предпринимателей и экспертов Y Combinator:

Вторая часть курса

Кирсти Нейту и Кэролинн Леви: Юридические основы запуска стартапа;
Кирсти Нейту и Кэролинн Леви: Основы привлечения инвестиций;
Кирсти Нейту и Кэролинн Леви: Основы работы с сотрудниками;
Тайлер Босмени: С чего начинать и как общаться с клиентами;
Майкл Сайбл и Касар Юнис: Как убедить инвестора и получить финансирование.

Первая часть курса

Сэм Альтман и Дастин Московитц: Как и зачем создавать стартап?
Сэм Альтман: Как сформировать команду и культуру стартапа?
Пол Грэм: Нелогичный стартап;
Адора Чьюнг: Продукт и кривая честности;
Адора Чьюнг: Стремительный рост стартапа;
Питер Тиль: Конкуренция – удел проигравших;
Питер Тиль: Как построить монополию?
Алекс Шульц: Введение в growth hacking [1, 2, 3];
Кевин Хейл: Тонкости в работе с пользовательским опытом [1, 2];
Стэнли Тэнг и Уокер Уильямс: Начинайте с малого;
Джастин Кан: Как работать с профильными СМИ?
Андрессен, Конуэй и Конрад: Что нужно инвестору;
Андрессен, Конуэй и Конрад: Посевные инвестиции;
Андрессен, Конуэй и Конрад: Как работать с инвестором;
Брайан Чески и Альфред Лин: В чем секрет культуры компании?
Бен Сильберман и братья Коллисон: Нетривиальные аспекты командной работы [1, 2];
Аарон Леви: Разработка B2B-продуктов;
Рид Хоффман: О руководстве и руководителях;
Рид Хоффман: О лидерах и их качествах;
Кит Рабуа: Управление проектами;
Кит Рабуа: Развитие стартапа;
Бен Хоровитц: Увольнения, повышения и переводы по службе;
Бен Хоровитц: Карьерные советы, вестинг и опционы;
Эммет Шир: Как проводить интервью с пользователями; 
Эммет Шир: Как в Twitch разговаривают с пользователями;
Хосейн Рахман: Как в Jawbone проектируют hardware-продукты;
Хосейн Рахман: Процесс проектирования в Jawbone.

Читать дальше →

+13

ZlodeiBaal 13 янв 2016 в 03:36

Постановка задачи компьютерного зрения

13 мин

71K

Веб-разработка*Анализ и проектирование систем*Алгоритмы*Обработка изображений*Машинное обучение*

Последние лет восемь я активно занимаюсь задачами, связанными с распознаванием образов, компьютерным зрением, машинным обучением. Получилось накопить достаточно большой багаж опыта и проектов (что-то своё, что-то в ранге штатного программиста, что-то под заказ). К тому же, с тех пор, как я написал пару статей на Хабре, со мной часто связываются читатели, просят помочь с их задачей, посоветовать что-то. Так что достаточно часто натыкаюсь на совершенно непредсказуемые применения CV алгоритмов.
Но, чёрт подери, в 90% случаев я вижу одну и ту же системную ошибку. Раз за разом. За последние лет 5 я её объяснял уже десяткам людей. Да что там, периодически и сам её совершаю…

В 99% задач компьютерного зрения то представление о задаче, которое вы сформулировали у себя в голове, а тем более тот путь решения, который вы наметили, не имеет с реальностью ничего общего. Всегда будут возникать ситуации, про которые вы даже не могли подумать. Единственный способ сформулировать задачу — набрать базу примеров и работать с ней, учитывая как идеальные, так и самые плохие ситуации. Чем шире база-тем точнее поставлена задача. Без базы говорить о задаче нельзя.

Тривиальная мысль. Но все ошибаются. Абсолютно все. В статье я приведу несколько примеров таких ситуаций. Когда задача поставлена плохо, когда хорошо. И какие подводные камни вас ждут в формировании ТЗ для систем компьютерного зрения.

Читать дальше →

+72

ser0t0nin 2 июл 2015 в 18:09

Иерархическая классификация сайтов на Python

8 мин

27K

Python*Big Data*Машинное обучение*Блог компании DCA (Data-Centric Alliance)

Привет, Хабр! Как упоминалось в прошлой статье, немаловажной частью нашей работы является сегментация пользователей. Как же мы это делаем? Наша система видит пользователей как уникальные идентификаторы cookies, которые им присваиваем мы или наши поставщики данных. Выглядит этот id, например, так:

42bcfae8-2ecc-438f-9e0b-841575de7479

Эти номера выступают ключами в различных таблицах, но первоначальным value является, в первую очередь, URL страниц, на которых данная кука была загружена, поисковые запросы, а также иногда некоторая дополнительная информация, которую даёт поставщик – IP-адрес, timestamp, информация о клиенте и прочее. Эти данные довольно неоднородные, поэтому наибольшую ценность для сегментации представляет именно URL. Создавая новый сегмент, аналитик указывает некоторый список адресов, и если какая-то кука засветится на одной из этих страничек, то она попадает в соответствующий сегмент. Получается, что чуть ли не 90% рабочего времени таких аналитиков уходит на то, чтобы подобрать подходящий набор урлов – в результате кропотливой работы с поисковиками, Yandex.Wordstat и другими инструментами.

Получив таким образом более тысячи сегментов, мы поняли, что этот процесс нужно максимально автоматизировать и упростить, при этом иметь возможность мониторинга качества алгоритмов и предоставить аналитикам удобный интерфейс для работы с новым инструментом. Под катом я расскажу, как мы решаем эти задачи.

Читать дальше →

+36

ser0t0nin 11 янв 2016 в 16:35

Рекурентная нейронная сеть в 10 строчек кода оценила отзывы зрителей нового эпизода “Звездных войн”

11 мин

159K

Python*Машинное обучение*Блог компании DCA (Data-Centric Alliance)

Hello, Habr! Недавно мы получили от “Известий” заказ на проведение исследования общественного мнения по поводу фильма «Звёздные войны: Пробуждение Силы», премьера которого состоялась 17 декабря. Для этого мы решили провести анализ тональности российского сегмента Twitter по нескольким релевантным хэштегам. Результата от нас ждали всего через 3 дня (и это в самом конце года!), поэтому нам нужен был очень быстрый способ. В интернете мы нашли несколько подобных онлайн-сервисов (среди которых sentiment140 и tweet_viz), но оказалось, что они не работают с русским языком и по каким-то причинам анализируют только маленький процент твитов. Нам помог бы сервис AlchemyAPI, но ограничение в 1000 запросов в сутки нас также не устраивало. Тогда мы решили сделать свой анализатор тональности с блэк-джеком и всем остальным, создав простенькую рекурентную нейронную сеть с памятью. Результаты нашего исследования были использованы в статье “Известий”, опубликованной 3 января.

В этой статье я немного расскажу о такого рода сетях и познакомлю с парой классных инструментов для домашних экспериментов, которые позволят строить нейронные сети любой сложности в несколько строк кода даже школьникам. Добро пожаловать под кат.

Читать дальше →

+68

chubakur 23 сен 2015 в 13:39

Распознавание речи с помощью CMU Sphinx

4 мин

83K

Звук

Из песочницы

CMU Sphinx сейчас является крупнейшим проектом по распознаванию человеческой речи. В инструментарий входят следующие программы и библиотеки:

Pocketsphinx — небольшая программа, которая принимает на вход произвольные акустические модели, грамматики и словари, а также звуковой поток(либо звуковой файл, либо сам берет поток с микрофона). На выходе получается распознанный текст. Написана на C, работает быстро.
Sphinxbase — библиотека необходимая для работы Pocketsphinx
Sphinx4 — гибкая библиотека для распознавания, написана на Java.
Sphinxtrain — программа для обучения акустических моделей.

Для работы со CMU Sphinx важно запомнить несколько определений и понять их отличия.

Акустическая модель — отвечает за сопоставление звуку произнесенной фонемы. Акустическую модель для русского языка можно скачать на сайте проекта. Русская акустическая и языковая модели. А также словарь.
Словарь — это файл, в котором написаны сопоставлены лексемы и фонемы (слово и его транскрипция). Например, калькулятор (k ay ll k u ll ja t ay r). Он необходим для преобразования фонем, распознанных акустической моделью в лексемы.
Грамматика — это формальные правила, которые описывают простые правила построения предложений. Лексемы, полученные на предыдущем шаге пытаются сопоставиться с грамматикой и если удачно, то выводится результат.
Языковая модель — это статистическая модель языка. Она описывает вероятности слов и их комбинаций. Таким образом распознавание лексем — это максимизация правдоподобности распознанной фразы.

Чем сложнее язык, чем обширней правила и размер словаря, тем хуже точность распознавания. Поэтому, для минимизации ошибки, имеет смысл создания упрощенных правил, которые будут описывать конкретную задачу.

Читать дальше →

+18

olartamonov 24 дек 2014 в 13:21

Black Swift: зачем мы его сделали

7 мин

126K

Блог компании Black Swift

Как уважаемые хабровчане знают, вот уже почти год мы разрабатываем маленький компьютер (примерно с SD-карточку), работающий под OpenWRT, со встроенным Wi-Fi, USB, Ethernet, азартными играми и доступными женщинами. Дмитрий dzhe уже несколько раз писал про него — и, в общем, с каждым разом собирал в комментариях один и тот же вопрос: а зачем вы вообще его делаете? Ну ведь есть же Raspberry Pi, стоит он столько же, есть VoCore, Carambola, Edison, в конце концов, — зачем нужен ещё один «нанокомпьютер»?

Пожалуй, надо наконец на этот вопрос ответить — заодно отметив этим ответом появление у нас своего корпоративного блога (спасибо, Хабр!), а также запуск отдельного веб-сайта, посвященного только этому проекту.

Если коротко: хотя изначально проект начинался как «а не сделать ли нам нанокомпьютер как у китайцев, но для себя и подешевле?», мотивация довольно быстро сместилась — мы поняли, что можем сделать его если не дешевле, то лучше и удобнее, и не только для себя.

Читать дальше →

+118

228

Milfgard 24 дек 2014 в 15:10

Как нормальные пацаны заходят в Мегу: 7 магазинов за месяц

6 мин

125K

Блог компании Мосигра

^{Мы в Меге Химки, фото одного из наших тайных покупателей на независимой проверке}

Привет!
Тут рассказывали, что Мега — это невозможно. Скажем так, наш опыт показывает немного обратное. И, чтобы не плодить иллюзии, расскажу чуть подробнее.

Во-первых, надо понимать, что Мега — это настоящий Клондайк. Если знать и уметь. Причина очень простая — реально много людей (не каждый торговый центр так может), все они ориентированы на шоппинг и очень платёжеспособны, плюс очень правильная и отточенная инфраструктура, порядки. Что, собственно, из плюсов может становиться минусами, если вы не развились до нужного уровня.

У нас с весны открыт магазин в Химках, полтора года работает магазин в Нижнем Новгороде, был магазин в Меге Уфы. В декабре мы открыли ещё 7 магазинов в Мегах.

Читать дальше →

+196

148

VladGorbatiuk 10 дек 2014 в 15:22

Параллельное программирование с CUDA. Часть 1: Введение

11 мин

127K

GPGPU*Блог компании EPAMПараллельное программирование*

Туториал

Еще одна статья о CUDA — зачем?

На Хабре было уже немало хороших статей по CUDA — раз, два и другие. Однако, поиск комбинации «CUDA scan» выдал всего 2 статьи никак не связанные с, собственно, алгоритмом scan на GPU — а это один из самых базовых алгоритмов. Поэтому, вдохновившись только что просмотренным курсом на Udacity — Intro to Parallel Programming, я и решился написать более полную серию статей о CUDA. Сразу скажу, что серия будет основываться именно на этом курсе, и если у вас есть время — намного полезнее будет пройти его.

Читать дальше →

+23

filldens 24 ноя 2014 в 14:06

Интерактивное голосовое редактирование текста с помощью новых речевых технологий от Яндекса

11 мин

96K

Блог компании ЯндексAPI*Яндекс API*

Сегодня наше приложение Диктовка для интерактивного написания и редактирования текста голосом появилось в AppStore и Google Play. Его главная задача — продемонстрировать часть новых возможностей комплекса речевых технологий Яндекса. Именно о том, чем интересны и уникальны наши технологии распознавания и синтеза речи, я хочу рассказать в этом посте.

Пара слов, чтобы вы понимали, о чём пойдёт речь. Яндекс уже давно предоставляет бесплатное мобильное API, которое можно использовать, например, для распознавания адресов и голосовых запросов к поиску. За этот год мы смогли довести его качество почти до того же уровня, на котором такие запросы и реплики понимают сами люди. И теперь мы делаем следующий шаг — модель для распознавания свободной речи на любую тему.

Кроме этого, наш синтез речи поддерживает эмоции в голосе. И, насколько нам известно, это пока первый коммерчески доступный синтез речи с такой возможностью.

Обо всём этом, а также о некоторых других возможностях SpeechKit: об активации голосом, автоматической расстановке пунктуационных знаков и распознавании смысловых объектов в тексте — читайте ниже.

Читать дальше →

+110

104

MaryaA 3 фев 2012 в 12:33

«One Last Thing» — документальный фильм о Стиве Джобсе (2011 год), профессиональный русский перевод

1 мин

13K

IT-компании

«Одна последняя вещь» (One Last Thing) — документальный фильм о Стиве Джобсе, выпущенный в 2011 году. В фильм включено неизвестное интервью Стива Джобса, данное в 1994 году, а также интервью со Стивом Возняком, Рональдом Уэйном, Дином Хови, Россом Перо. Перевод на русский язык — канал GTV.

Читать дальше →

+34

alexn 10 ноя 2011 в 19:38

Маверики в деле

3 мин

766

Чулан

Don't worry about what anybody else is going to do… The best way to predict the future is to invent it.

Эта книга — воплощение вдохновения.

Она дает «крылья» или мощнейший «пинок под зад», кому как больше нравится.

Авторы исследовали и выделили общие черты трех дюжин компаний, которые благодаря своей оригинальности и креативности разделили всю отрасль на две половины: себя и всех остальных.

Читать дальше →

ddespot 11 авг 2011 в 16:15

3 в 1: Обсуждения, задачи, документация

4 мин

4.9K

IT-компании

В нашей команде работает более 30 человек. Мы разрабатываем масштабируемые решения для web. Живем в Томске, Санкт-Петербурге и в Москве. Для организации совместной работы над задачами мы использовали task-трекер. Во время проектов создавались ценные наработки и нужно было организовать работу со знаниями. Мы пробовали различные wiki-системы. Оказалось, что большая часть наших знаний создается при решении текущих задач. Мы сталкивались с проблемами:

Заносить и вести все задачи в task-трекере неудобно, и поэтому сотрудники все время переходят на общение через мессенджеры.
Много знаний оседает в e-mail и месенджерах. Перенос знаний из переписки в task-трекер и wiki отнимает много сил и времени.
Если при планировании проекта в wiki была записана вся концепция проекта, то с каждым днем различий между информацией в wiki и реальным положением дел становится все больше, и поддержка базы знаний становится неоправданно трудоемкой.

Решая эти проблемы, мы разработали собственную методологию и среду совместной работы. Так родился новый проект. В этой статье хотим рассказать о нем. Для начала посмотрим на то, как организована совместная работа в команде.

Читать дальше →

+33

freetonik 10 авг 2011 в 10:35

Ричард Фейнман: удовольствие делать открытия

1 мин

11K

Интервью

Первая часть программы Horizon (BBC, 1981) с Ричардом Фейнманом. О красоте, об отце, о названиях и именах, об алгебре, о наблюдениях и униформе. Это интервью во многом пересекается с книгой "Вы, конечно, шутите, мистер Фейнман", поэтому по большей части монолог касается жизни ученого, его взгляде на жизнь и тому, как такой взгляд развился и кто на него повлиял.

Читать дальше →

+163

grevus 12 июн 2011 в 22:33

Работа и жизнь в Дубае. Мой опыт

3 мин

9.4K

IT-эмиграция

В процессе общения в личке с Londoner после его поста, а также вопросов, которые начали задавать после моего комментария появилось желание рассказать о том, как мне живется и работается в Дубае (ОАЭ) и ответить на все поставленные вопросы.

Готовы ли Вы рассматривать ОАЭ как страну для постоянного проживания? Уж очень много восточной специфики, или я не прав?

Что касается Дубая в частности и ОАЭ в целом, то да… Я рассматриваю этот город как место постоянного проживания) Собственно тут, я уже проживаю год (без малого). И собираюсь оставаться как можно дольше.

Дальше больше...

+112

174

2 3 ...

6 7