Tech Lead using Angular & .net
Golos — самый большой русскоязычный речевой датасет, размеченный вручную, теперь в открытом доступе

Меня зовут Саша, в SberDevices я занимаюсь системой распознавания речи и тем, как данные могут сделать её лучше. В этой статье я расскажу о новом речевом датасете Golos, который состоит из аудиофайлов и соответствующих транскрипций. Общая длительность записей составляет примерно 1240 часов, частота дискретизации – 16кГц. На текущий момент это самый большой корпус аудиозаписей на русском языке, размеченный вручную. Мы выпустили корпус под лицензией, близкой к CC Attribution ShareAlike, что позволяет его использовать как для научных исследований, так и в коммерческих целях. Я расскажу о том, из чего состоит датасет, каким образом он был собран и каких результатов позволяет достичь.
Ультимативное сравнение систем распознавания речи: Ashmanov, Google, Sber, Silero, Tinkoff, Yandex
Какое-то время назад мы писали цикл статей про то, как правильно измерять качество систем распознавания речи, и собственно снимали метрики с доступных решений (цикл статей — 1, 2, 3) (на тот момент и коммерческих и некоммерческих решений). На Хабре была выжимка из этого цикла в рамках этой статьи, но до масштабного обновления исследования, достойного публикации на Хабре, руки никак не доходили (это требует как минимум большого количества усилий и подготовки).
Прошло некоторое время и пора обновить наше исследование, сделав его по-настоящему ультимативным. По сравнению с прошлыми исследованиями изменилось или добавилось следующее:
- Добавилось много валидационных сетов из разных реальных доменов;
- На рынок вышел Сбер, в первую очередь интересно протестировать именно его;
- Для чистоты эксперимента, мы не предупреждали разработчиков систем о доменах и факте проведения тестов;
- Мы также попробовали немного протестировать пропускную способность сервисов (понятно, что мы не знаем какое железо и ограничения стоят в облаке);
- Мы рассматриваем только коммерческие системы, к которым у нас получилось получить доступ и которые показали хоть какой-то намек на "всеядность", работу с холодного старта и "энтерпрайзность";
Позиция науки: что такое регрессивная гипнотерапия и как гипноз помогает путешествовать в прошлое

Если взять за основу работы школы Павлова, то в гипнозе как в редком, и отсюда возможно интересном феномене, мало чего удивительного. Обычная ультра парадоксальная стадия, которая вызывает состояние "внушенного сна наяву". Поэтому будем держаться классической теории советских клиницистов и разберем по полочкам внутреннюю кухню гипнотерапии и отдельно стадии гипноза. Для желающих углубиться в предмет есть две фундаментальные монография Платонова К. И. "Слово как физиологический и лечебный фактор" и книга Лифшица С.Я. "Гипноанализ инфантильных травм у истериков".
Роботизация в сельском хозяйстве. Будущее агропроизводства
Эдуард родом из сельской местности. Всю жизнь был связан с сельским хозяйством. Закончил Московский государственный агро-инженерный университет имени Горячкина. После учебы работал в сфере сельхозтехники и точного земледелия. Сейчас занимается внедрением роботизированной техники в Cognitive Pilot. Активно пишет на Хабре в блоге своей компании об эксплуатации и технологиях сельхозтехники. Его статьи стабильно набирают высокие рейтинги и входят в топ статей за год на Хабре.
Делимся с вами расшифровкой эфира и записью.
Как быстро и удобно документировать Angular проект с помощью модуля AddOnDoc из TaigaUI

Не так давно вышла новая библиотека компонентов Taiga UI. Как говорят сами создатели Александр Инкин и Роман Седов, это конструктор Lego. И действительно: в нём есть много полезных модулей, которые можно использовать в своём проекте. В этой статье мы рассмотрим модуль AddOnDoc.
Если нарисуем такие графы, сможем навсегда изменить компьютеры

Инженеры могли бы использовать этот прорыв в теории графов для разработки невероятно эффективных квантовых компьютерных микросхем.
Доцент кафедры информатики в Копенгагенском университете Джейкоб Холм просматривал доказательства из научной статьи, опубликованной в Интернете в октябре 2019 года им и его коллегой Евой Ротенберг (доцентом кафедры прикладной математики и информатики Датского технического университета), и обнаружил, что их результаты невольно дали решение многовековой проблемы графов.
Open-Closed Principle в Angular

Всем привет! Меня зовут Вова, я фронтендер в Тинькофф. Сейчас перед нашей командой стоит задача редизайна функциональности на пересечении нескольких продуктов. Данная ситуация заставила нас задуматься во-первых о DDD, а во-вторых о гибкости наших решений, применяемых при разработке, и достичь этого нам помогли принципы SOLID, а точнее OCP и Dependency Inversion (не путать с Dependency Injection), о чем и хочется дальше поговорить.
ТайпСкрип: Ох уж эта весёлая система типов
Здравствуйте, меня зовут Дмитрий Карловский и недавно я, вместе с Артуром Мукминовым, проводил воркшоп, где показывал как разрабатывать сложные типофункции через тестирование. Это 2 часа сурового программирования на типах. Так что в качестве тизера, ловите разбор курьёзов тайпскриптовой системы типов.
Дайджест свежих материалов из мира фронтенда за последнюю неделю №439 (26 — 31 октября 2020)
Чистим код в Angular. Готовим ESLint, codelyzer, stylelint, husky, lint-staged и Prettier
Если вам не приходилось работать в команде, то, возможно, вы еще не используете эти вещи, а кто-то даже не знает про них. Работая один, вы сами себе хозяин.
Как только начали работать в команде — ситуация резко меняется. Если нет договоренностей, то каждый начинает писать код в таком стиле, в каком умеет. И даже если вы все же собрались и обсудили на словах codestyle на проекте и даже записали где-то, это, скорее всего, не поможет решить проблему, и вот почему.
Скорочтение. Как читать в восемь раз быстрее, если тебя преследуют демоны

Решив, что в этой проблеме не одинок — я начал искать ответ в книгах. Начитавшись умных книжек и статей, я составил список из 100 книг к прочтению, которые выдернут меня из когтей демонов.
Моего терпения хватило на шесть книг, после этого я забросил свой список. Ведь это занимало так много времени, а мне его категорически не хватало. Хотя я не знал на что его тратить.
Мой ридлист провалялся нетронутым месяц, потом в какой-то из статей я наткнулся на рекомендуемые к прочтению книги и среди «100 книг которые должен прочесть каждый» было «Скорочтение» Питера Кампа.
Изучив метод предлагаемый автором мне удалось повысить скорость чтения. С автором я согласен не во всем, но некоторые способы были полезны. Об основных методах и будет эта статья.
Кому нужен этот HTML: «Как я за 2 месяца запилил платежный сервис — и отправил на свалку»
В 2011 году мы начинали именно с html-версии, которая работала на Android. Готовились портировать ее на другие платформы, несмотря на трудности, с которыми пришлось столкнуться. Но в итоге через два года свернули этот проект и заменили проект на нативные приложения.

В этой заметке ведущий разработчик UBANK Александр Путилин постарается рассказать о нашем опыте создания кросс-платформенного приложения, а также поделится кое-какими идеями о том, зачем все же нужен HTML5 и как его можно победить. Заинтересованные в практических вопросах приглашаются в комментарии.
Information
- Rating
- Does not participate
- Location
- Москва, Москва и Московская обл., Россия
- Date of birth
- Registered
- Activity