Pull to refresh
16
-1
Юрий @frazer

Программист

Send message

Open Source распознавание речи SOVA

Reading time 16 min
Views 28K
Мы в Наносемантике занимаемся виртуальными ассистентами (чат-ботами и голосовыми помощниками) для компаний с большими колл-центрами. Раньше мы использовали распознавание и синтез речи других компаний, а 1.5 года назад решили, что хотим быть самодостаточным вендором.



Если интересно, зачем нам это, что у нас получилось, а также для чего нам выкладывать ASR & TTS в Open Source – добро пожаловать под кат.
Total votes 28: ↑26 and ↓2 +24
Comments 32

ZeroMQ: сокеты по-новому

Reading time 7 min
Views 79K
В любом среднем или крупном приложении, будь оно desktop или web, для бизнеса или для личного пользования, программисту необходимо решить важную архитектурную задачу — как будут общаться между собой потоки, процессы, модули, ноды, кластера, и прочие части эко-системы его приложения.

Многие разработчики решают идти по пути наименьшего сопротивления, возложив эту задачу, например, на СУБД. Скажем, один процесс положил данные в БД, второй прочитал, обработал — положил еще и так далее.
Про обмен через файлы в наши годы уже стыдно говорить, но и такое случается.
Другие же программисты пытаются создать какое-то свое, специализированное решение и, как правило, выбирают сокеты.

Задача проектирования и разработки архитектуры приложения крайне интересная, но это отдельная тема. В данном посте хотел бы поделиться своим первым впечатлением от знакомства с библиотекой ZeroMQ.

ZeroMQ предлагает разработчику некий высокий уровень абстракции при работе с «сокетами». Библиотека берет на себя часть забот по буферизации данных, обслуживанию очередей, установлению и восстановлению соединений, и прочие вещи. Вместо того, чтобы заниматься такими глупостями, вы можете сосредоточиться на главном — архитектуре и логике приложения.

Однако, в этом мире бесплатный сыр только в мышеловке. Поэтому я постарался по мере сил и опыта выяснить, чем придется поплатиться за удобство, какие я нашел плюсы и минусы при применении данной библиотеки.
Читать дальше →
Total votes 15: ↑13 and ↓2 +11
Comments 17

Почему компания «Интел» делает ставку в разработке чипов на гений Джима Келлера?

Reading time 17 min
Views 28K
Предлагаю вниманию публики Хабра перевод (с сокращениями) интервью Джима Келлера журналу «Fortune», опубликованное 18 мая 2020 года. Келлер — легендарная личность среди разработчиков микропроцессорной электроники.

Не слишком вдаваясь в технические подробности, автор интервью рассказывает о Келлере как о незаурядной личности и талантливом инженере, а также дает читателю возможность взглянуть изнутри на «кухню» проектирования микропроцессорных систем.


Келлер выступает с докладом о законе Мура на закрытом мероприятии Intel Silicon100 в июне 2019 года.

Джим Келлер мало известен вне IT-индустрии, однако для посвященных он столь же легендарная личность, как Фрэнк Ллойд Райт в мире архитектуры или Фил Джексон – в баскетболе.

Келлер начал карьеру в компании DEC в 80-х, и с тем пор отличился успехами на каждом новом месте работы. Его разработки помогли компании AMD из аутсайдера превратиться в уважаемого конкурентами соперника. А кто стоял за созданием микропроцессора автопилота Tesla, который в состоянии распознавать красный сигнал светофора и знаки «СТОП»? Тоже Келлер.
Читать дальше →
Total votes 41: ↑40 and ↓1 +39
Comments 35

Исправляем опечатки с учётом контекста

Reading time 10 min
Views 25K

Недавно мне понадобилась библиотека для исправления опечаток. Большинство открытых спелл-чекеров (к примеру hunspell) не учитывают контекст, а без него сложно получить хорошую точность. Я взял за основу спеллчекер Питера Норвига, прикрутил к нему языковую модель (на базе N-грамм), ускорил его (используя подход SymSpell), поборол сильное потребление памяти (через bloom filter и perfect hash) а затем оформил всё это в виде библиотеки на C++ со swig биндингами для других языков.

Читать дальше →
Total votes 23: ↑21 and ↓2 +19
Comments 2

Information

Rating
Does not participate
Location
Москва, Москва и Московская обл., Россия
Date of birth
Registered
Activity