Екатерина Крылова @krylovoi

Системный аналитик в ООО «ЦРТ»

Profile Publications 4Comments 5Bookmarks 35

kalisto21 Jul 25 2018 at 11:58

Введение в задачу распознавания эмоций

6 min

22K

Algorithms*Центр речевых технологий (ЦРТ) corporate blogMachine learning*

From sandbox

Распознавание эмоций – горячая тема в сфере искусственного интеллекта. К наиболее интересным областям применения подобных технологий можно отнести: распознавание состояния водителя, маркетинговые исследования, системы видеоаналитики для умных городов, человеко-машинное взаимодействие, мониторинг учащихся, проходящих online-курсы, носимые устройства и др.

В этом году компания ЦРТ посвятила этой теме свою летнюю школу по машинному обучению. В этой статье я постараюсь дать краткий экскурс в проблему распознавания эмоционального состояния человека и расскажу и подходах к ее решению.

Читать дальше →

WesternDigital Jul 29 2020 at 23:05

Сжатие видео на пальцах: как работают современные кодеки?

13 min

30K

Working with video*Data storage*Data compression*Western Digital corporate blogData storages*

Затраты на хранение данных зачастую становятся основным пунктом расходов при создании системы видеонаблюдения. Впрочем, они были бы несравнимо больше, если бы в мире не существовало алгоритмов, способных сжимать видеосигнал. О том, насколько эффективны современные кодеки, и какие принципы лежат в основе их работы, мы и поговорим в сегодняшнем материале.

Читать дальше →

+16

NewTechAudit Feb 25 2022 at 13:29

Распознавание лиц на RASPBERRY PI

7 min

13K

Python*Programming*Machine learning*Natural Language Processing*

Биометрия везде. Современные мегаполисы в России и мире окутаны сетями камер, подключенными к различным системам распознавания лиц. Насколько это правильно с точки зрения этики — каждый решает сам, но факт в том, что такие методы не только помогают раскрывать преступления, но и предотвращать их совершение.

С каждым годом расширяется область применения таких систем. Например, пользователи могут приобрести у Google систему Nest — Nest Cam IQ Indoor, стоимостью 349 долларов с интеграцией в умный дом и возможностью распознавания лиц по подписке (за 10 долларов в месяц). И отечественных аналогов для частного пользования немало. Различные СКУД (системы контроля и управления доступом) от Ростелекома, HikVision, VisionLabs и других фирм. Описание зачастую мутное, опыт работы в реальных условиях можно найти на YouTube по запросу «Умный домофон не пускает мужчину домой».

TahionSPb Aug 31 2021 at 10:41

Современные системы видеонаблюдения — от концепций до воплощения. Часть 2

17 min

9.4K

Video equipment

Добрый день, уважаемые коллеги.

В части 1 мы начали краткий обзор вариантов построения современных систем видеонаблюдения, место серверов и регистраторов в них.

По отзывам мы поняли, что тема актуальная. Развитие идет дальше, и сегодня лидеры в области ПО для видеонаблюдения сами обсуждают преимущества и недостатки систем на софте (на базе серверов) и систем с регистраторами. В итоге понимают, что надежность регистраторов выше, но серверные системы более гибкие и позволяют решать более сложные задачи. Сервера и регистраторы уже имеют ПО на основе нейросетей, но это ПО требует обучения на конкретной местности с ветром, растительностью и облаками. А это «ахиллесова пята» нейросетей, поскольку обучение производители доверяют только своим за деньги сертифицированным специалистам.

Вероятно, а так уже было с IP-видеосистемами (видеокамерами, регистраторами и оптикой для них), скоро цены на нейромодули упадут, и с адаптацией на конкретном объекте пакетных решений смогут справляться квалифицированные инсталляторы с техническим образованием. Заграница в лице Китая нам поможет.

В результате ваших отзывов стало понятно, что много вопросов по конкретным моделям серверов и регистраторов и систем из них построенным. Но конечно, производить обзор всего спектра этого оборудования невозможно. Проще зайти на сайт производителей, упомянутых мной в ответах на вопросы. Ссылки оставлять не буду, запрещено правилами.

В ходе вопросов стало также понятно, что есть интерес к ночному режиму работы видеосистемы. Поле это не освоенное, на нем существует масса штампов, заблуждений и нерешенных проблем. Эту тему мы сегодня поднимать не будем, а оставим для следующей части нашего эссе.

Очень много интереса к бытовым видеосистемам, и это направление, благодаря высокому техническому уровню пользователей и мобильности клиент-устройств, стало драйвером развития видеонаблюдения. Но и здесь есть свои концепции, специфика и тонкости, о которых стоит говорить.

Сегодня мы попробуем перейти к конкретике распределенных систем видеонаблюдения, о которых упоминали в первой части изложения, приведем несколько примеров.

Итак, вспомним концовку 1 части.

Локальные сервера служат для выполнения задач по аналитике непосредственно на объекте в зоне размещения групп видеокамер.

Почему на объекте? Для того, чтобы снизить нагрузку на тракт передачи данных (СПД), особенно если он беспроводной.

В статьях мы рассмотрим подробно такие сервера, обсудим:

- тонкости их подбора;

- условия эксплуатации и монтажа;

- особенности настройки;

- их недостатки;

- варианты их проводного и беспроводного подключения по Wi-Fi и GSM.

Начнем с последнего пункта, ибо он определяет конструкцию и состав распределенных узлов.

AlexanderKozlov Dec 25 2013 at 13:16

Raspberry Pi: Кодируем H.264 видео в реальном времени

7 min

38K

Working with video*Intel corporate blog

В одном из проектов компании Itseez, связанных с компьютерным зрением, мы используем Raspberry Pi для обработки видео потока с веб-камеры, и недавно столкнулись с проблемой записи видео на флеш-карту. Трудность состояла в том, что ресурсы ЦП съедались другими более важными задачами, однако сохранять видео все же было нужно. Причем предпочтений, каким кодеком сжимать и какой формат использовать, не было, лишь бы это никак не сказывалось на fps (количестве кадров в секунду). Перепробовав большое число программных кодеков от RAW до H.264 (использовалась обертка OpenCV над FFmpeg), пришли к выводу, что ничего из этого не выйдет, т.к. при высокой нагрузке fps проседал с 20 до 5 кадров в секунду, при том что картинка – черно-белая с разрешением 320x240. Немного погуглив, выяснили, что в процессоре Raspberry Pi есть аппаратный кодер с поддержкой стандарта H.264 (насколько мне известно, лицензия приобретена только для него). Плюсом ко всему было то, что взаимодействие с кодером реализовано по стандарту OpenMAX, поэтому было решено взяться за написание кода с использованием OpenMAX, и посмотреть, что из этого получится. Получилось, кстати, очень даже недурно!

Читать дальше →

+37

rimecode Feb 16 2022 at 20:43

Тестируем многопоточную раздачу видео на игровых GPU

6 min

Open source*Working with video*HOSTKEY corporate blogVideo cardsVideo conferencing

При работе с потоковым видео качество и скорость воспроизведения играют ключевую роль. Можно ли настроить многопоточную трансляцию без покупки дорогостоящего «железа»? Попробуем разобраться.

Проблема. Качественная трансляция видео обычно предполагает серьезные издержки: нужно выделить помещение и создать в нем инженерную инфраструктуру, закупить оборудование и нанять сотрудников для его обслуживания, арендовать каналы передачи данных и провести другие необходимые мероприятия. В зависимости от масштаба проекта только капитальные вложения могут потребовать значительных бюджетов.

Глянуть решение

dzigoro Jan 20 2021 at 09:46

5 диаграмм, необходимых для документирования архитектуры решений

8 min

71K

EPAM corporate blogTechnical Writing*

Translation

Процесс документирования архитектуры программного обеспечения может показаться пугающим. Но на самом деле достаточно всего 5 диаграмм, чтобы объяснить структуру вашей системы практически любому.

+26

habr_career Jun 26 2020 at 12:00

Бесплатные образовательные курсы: тестирование

5 min

284K

Web services testing*Хабр Карьера corporate blogIT career

Ошибки и баги могут возникнуть в любых программах, поэтому тестировщиков нанимают многие крупные компании, которые разрабатывают программное обеспечение. А еще — небольшие фирмы, которые предоставляют услуги тестирования на аутсорс. Сегодня мы публикуем подборку из 14 бесплатных курсов по тестированию из нашего раздела Образование. Да, они, скорее, помогут вам получить базовые знания или освежить то, что вы уже и так знали, чем прокачаться до уровня синьора или лида. Но это не умаляет их полезности! Если вы видели что-то интересное, чего нет в этом выпуске — делитесь ссылками в комментариях.

Читать дальше →

+11

akirill0v Oct 4 2022 at 16:02

Покажи мне свой Git, и я скажу, кто ты

15 min

37K

Git*Конференции Олега Бунина (Онтико) corporate blogGitHub*Singula Team corporate blog

Можно ли с помощью GitHub анализировать работу, не заглядывая в монитор сотрудника — без скриншотов и тайм-трекеров?

Я Александр Кириллов, технический директор компании Evrone. Больше 20 лет я посвятил разработке. В этой статье поделюсь с вами опытом, который собрал за время работы с распределенными командами. Расскажу о том, как, не нарушая приватность разработчиков, следить за качеством работы на проектах и отслеживать нежелательные паттерны с помощью метрик в Jira и Git.

+53

avecoder Jun 29 2020 at 11:38

Что находится между идеей и кодом? Обзор 14 диаграмм UML

8 min

170K

Website development*System Analysis and Design*UML Design*Development for IOT*Microservices*

Аве Кодер!

Тебе пришла крутая идея продукта, но ты не хочешь увязнуть в коде и потерять целостную картинку из-за мелких деталей? Ты вот-вот присядешь за то, что крякнул корпоративный сервер и тебе нужно набить что-то крутое и айтишное?

Этот цикл статей будет посвящен полезному, но порой ускользающему от молодой поросли знанию — диаграммам UML. И начну я его с обзора существующих диаграмм, поговорим немного об истории и зачем диаграмм должно быть так много.

+12

Alina404 Nov 25 2021 at 10:55

Опыт составления HLD-документации по нотации C4

7 min

19K

UML Design*Microservices*Technical Writing*Quadcode corporate blog

Technotext 2021

Привет! Меня зовут Алина, я работаю техническим писателем в компании Quadcode. В этой статье хочу поделиться опытом верхнеуровневого описания архитектуры системы с использованием структуры C4. Небольшая оговорка: предпринятые шаги включают в себя определенные отходы от канонической нотации в угоду удобству и особенностям системы.

Для справки:

HLD (high-level design) – верхнеуровневое описание архитектуры системы, где представлены основные компоненты и их взаимодействия.

LLD (low-level design) – низкоуровневое детальное описание каждого из компонентов системы.

MichaelEk Jun 23 2022 at 10:59

Яндекс выложил YaLM 100B — сейчас это крупнейшая GPT-подобная нейросеть в свободном доступе. Вот как удалось её обучить

10 min

117K

Open source*Яндекс corporate blogAlgorithms*Machine learning*Natural Language Processing*

Technotext 2022

^{Больше примеров — в конце поста}

В последние годы большие языковые модели на архитектуре трансформеров стали вершиной развития нейросетей в задачах NLP. С каждым месяцем они становятся всё больше и сложнее. Чтобы обучить подобные модели, уже сейчас требуются миллионы долларов, лучшие специалисты и годы разработки. В результате доступ к современным технологиям остался лишь у крупнейших IT-компаний. При этом у исследователей и разработчиков со всего мира есть потребность в доступе к таким решениям. Без новых исследований развитие технологий неизбежно снизит темпы. Единственный способ избежать этого — делиться с сообществом своими наработками.

Год назад мы впервые рассказали Хабру о семействе языковых моделей YaLM и их применении в Алисе и Поиске. Сегодня мы выложили в свободный доступ нашу самую большую модель YaLM на 100 млрд параметров. Она обучалась 65 дней на 1,7 ТБ текстов из интернета, книг и множества других источников с помощью 800 видеокарт A100. Модель и дополнительные материалы опубликованы на Гитхабе под лицензией Apache 2.0, которая допускает применение как в исследовательских, так и в коммерческих проектах. Сейчас это самая большая в мире GPT-подобная нейросеть в свободном доступе как для английского, так и для русского языков.

В этой статье мы поделимся не только моделью, но и нашим опытом её обучения. Может показаться, что если у вас уже есть суперкомпьютер, то с обучением больших моделей никаких проблем не возникнет. К сожалению, это заблуждение. Под катом мы расскажем о том, как смогли обучить языковую модель такого размера. Вы узнаете, как удалось добиться стабильности обучения и при этом ускорить его в два раза. Кстати, многое из того, что будет описано ниже, может быть полезно при обучении нейросетей любого размера.

Читать дальше →

+164

139

JamaGava Oct 8 2019 at 11:55

Нескучный туториал по NumPy

19 min

221K

Python*Programming*Perfect code*Algorithms*

Tutorial

Меня зовут Вячеслав, я хронический математик и уже несколько лет не использую циклы при работе с массивами…

Ровно с тех пор, как открыл для себя векторные операции в NumPy. Я хочу познакомить вас с функциями NumPy, которые чаще всего использую для обработки массивов данных и изображений. В конце статьи я покажу, как можно использовать инструментарий NumPy, чтобы выполнить свертку изображений без итераций (= очень быстро).

Не забываем про

import numpy as np

и поехали!

Читать дальше →

+26

ADSoroka Jun 3 2022 at 14:27

Как мы подходим к поддержке ML-моделей в синтезе речи

10 min

2.6K

TINKOFF corporate blogMachine learning*

Всем привет! Меня зовут Александра Сорока, я занимаюсь синтезом речи в Тинькофф. А это — мой текст о том, зачем вообще думать о долгосрочной поддержке кода и ML-моделей. Я расскажу, почему мы отказались от опенсорсных решений, как работаем с датасетами и разными версиями моделей и как замеряем их качество. Статья может оказаться полезной для всех, кто хочет знать, как ничего не поломать.

sergey_serov Apr 21 2022 at 14:01

Как мы слушаем и разбираем каждый звонок в банк

9 min

8.1K

Project management*SoundNatural Language Processing*Хоум Банк corporate blog

Сначала DSS LAB делает голос-текст, потом LSTM-классификаторы, сущности Spacy + Yargy (Natasha), лемматизация Pymorphy2, правки Fasttext и Word2Vec, 3 разных суммаризатора и наши решения. Мы можем анализировать ваш голос не только для того, чтобы понимать, о чём ведётся диалог, но и для того, чтобы искать места улучшений банковских продуктов после диалога.

Например, по распознаванию некоторых ключевых слов в речи вроде «аккредитив» или «эскроу» оператору показывается справка, по названиям депозитов — их точные тарифы и так далее. Нажимать при этом ничего не надо. Возможность сейчас обкатывается в бете.

Пример:

На входе: «…почему мне откапывает банкомат с переводом в другой банк».
Коррекция: «почему мне отказывает банкомат с переводом в другой банк».
Выделенное ключевое сообщение: «отказывает банкомат».
Действие: оператору предлагается маршрутизация звонка, звонок классифицируется для статистики.

Само распознавание устроено следующим образом:

Голос раскладывается на фонемы. Фонемы собираются в слова тем же решением.
Из собираемых данных удаляются различные клиентские данные: номера карт, кодовые слова и так далее.
Затем полученный поток слов снабжается пунктуацией (точками и запятыми) и заглавными буквами: это нужно для нейросетей, очень чувствительных к такому. Исправляются опечатки, корректируются термины (география).
И на выходе получаются текстовые диалоги, как в чате: их анализирует уже нейросеть, пытающаяся привязать смысл в реальном времени.
После окончания звонка тексты также анализируются нейросетями, отвечающими за сбор разных метрик по голосовой и чат-поддержке.

Давайте покажу реальные (обезличенные) примеры диалогов, чтобы было понятнее.

Читать дальше →

+20

Leo_Gan Aug 5 2015 at 02:18

RPC, Messaging, REST: Терминология

4 min

85K

Programming*

RPC, Messaging, REST: Терминология

Цель данной статьи — обсудить терминологию. Статья — не о том, как и для чего, а только исключительно об использовании терминологии. Статья отражает мнение автора и не претендует на научность.

RPC, Messaging, REST- Terminology - RPC, Messaging, REST- Терминология

Вступление

Если вы работаете в области программирования распределенных систем или в интеграции систем, то большая часть изложенного здесь вам не в новинку.

Проблема возникает, когда встречаются люди, использующие разные технологии, и когда эти люди начинают технические разговоры. При этом часто возникает взаимное недопонимание, обусловленное терминологией. Я здесь попытаюсь свести воедино терминологии, используемые в разных контекстах.

Читать дальше →

AlexanderByndyu Apr 13 2020 at 12:08

От микросервисного монолита к оркестратору бизнес-сервисов

6 min

38K

System Analysis and Design*Microservices*

Когда компании решают разделить монолит на микросервисы, в большинстве случаев они последовательно проходят четыре этапа: монолит, микросервисный монолит, микросервисы, оркестратор бизнес-сервисов.

Если вы определите, на каком из этапов находитесь сейчас, это поможет вам понять плюсы и минусы текущего этапа, оценить стоит ли идти на следующий этап и, если стоит, увидеть шаги необходимые для перехода.

Читать дальше →

+24

progchip666 Dec 9 2016 at 20:15

Основные параметры усилителей низкой частоты и акустики. Что нужно знать, чтобы не попасться на удочку маркетологов

13 min

96K

PhysicsSoundElectronics for beginners

Благодаря торговым сетям и интернет магазинам разнообразие предлагаемой к продаже аудиоаппаратуры зашкаливает за все разумные пределы. Каким образом выбрать аппарат, удовлетворяющий вашим потребностям к качеству, существенно не переплатив?

Если вы не аудиофил и подбор аппаратуры не является для вас смыслом жизни, то самый простой путь — уверенно ориентироваться в технических характеристиках звукоусилительной аппаратуры и научиться извлекать полезную информацию между строк паспортов и инструкций, критически относясь к щедрым обещаниям. Если вы не ощущаете разницы между dB и dBm, номинальную мощность не отличаете от PMPO и желаете наконец узнать, что такое THD, также сможете найти интересное под катом.

Краткое содержание статьи

Коэффициент усиления. Зачем нам логарифмы и что такое децибелы?
Громкость звука. Чем отличаются dB от dBm?
Разделяй и властвуй — раскладываем сигнал в спектр.
Линейные искажения и полоса пропускания.
Нелинейные искажения. КНИ, КГИ, THD.
Амплитудная характеристика. Совсем коротко о шумах и помехах.
Стандарты выходной мощности УНЧ и акустики.
Практика — лучший критерий истины. Разборки с аудиоцентром.
Чайник дёгтя в банке мёда.

Я надеюсь что материалы данной статьи будут полезны для понимания следующей, которая имеет намного более сложную тему — «Перекрёстные искажения и обратная связь, как один из их источников».

Нашли что-то интересное в содержании? Добро пожаловать под кат

+54

Atmyre Nov 26 2021 at 12:21

Inductive bias и нейронные сети

17 min

17K

Image processing*Machine learning*Artificial Intelligence

From sandbox

В этой статье я расскажу, что такое inductive bias, зачем он нужен и где встречается в машинном обучении. Спойлер: везде. Любая нейросеть имеет inductive bias (даже та, что в человеческом мозге, хе-хе)

Также вы узнаете:

- почему inductive bias — это очень хорошо

- способы внедрить inductive bias в модели машинного обучения

- какой inductive bias в сверточных нейросетях и как успех архитектуры Image Transformer связан с inductive bias

Ну что, поехали:

+41