Комментарии / Профиль AlexandreFrolov / Хабр

Александр Фролов@AlexandreFrolov

Генеральный директор

Подписчики

ПрофильСтатьи12ПостыНовости1Комментарии1.2K

От люксметра из детского конструктора до ФЭУ на 3 кВ: всё о приборах для работы со светом

Да, диод Д2, "очищенный" Д9 и транзистор МП42 или аналогичный со спиленным напротив эмиттера корпусом можно использовать в качестве фотодиода.

Но насколько я помню, внешне фотодиод, установленный на крыше модели автобуса под небольшим углом, был больше всего похож на ФД-265А или скорее на ФД-265 без линзы https://ru.pc-history.com/fotodiod-fd-265a.html. Они и сейчас есть в продаже.

Свой ИИ без облаков: практический гайд по llama.cpp + Qwen

AlexandreFrolov 4 апр в 06:36

Так то да, лучше. Но когда облачные недоступны, остаются только локальные модели. И ещё вопрос цены токенов и доступных способов их оплаты тоже приходится принимать во внимание

Свой ИИ без облаков: практический гайд по llama.cpp + Qwen

AlexandreFrolov 3 апр в 13:16

Нельзя объять необъятное) Но тема с многими GPU да, интересная.

Свой ИИ без облаков: практический гайд по llama.cpp + Qwen

AlexandreFrolov 3 апр в 13:14

Решают, да. Но данные приходится отдавать этим сервисам. А при локальной установке все остаётся в вашем контуре.

Глава «Ростелекома»: «Telegram умрет в ближайшие дни, MAX растет, поэтому все хорошо»

AlexandreFrolov 30 мар в 05:16

Где-то прочитал: Привести лошадь на водопой может и один человек. Но и сто не заставят ее пить.

У нас есть почта дома: настраиваем почтовый сервер Mailu в Kubernetes

AlexandreFrolov 18 мар в 07:37

Zimbra на своей виртуалке -- относительно простое и надежное решение.

Как юридическому лицу платить самозанятому

AlexandreFrolov 25 фев в 07:55

А есть ли подобные риски при работе с ИП?

Распознавание речи и голосовое управление на Repka Pi 4, автономная работа, real-time, нейросеть Vosk на базе Kaldi

AlexandreFrolov 19 фев в 03:04

Здравствуйте! Благодарю за сообщение!
Добавил в репозиторий
https://github.com/AlexandreFrolov/asr-repka-pi-public/blob/main/vosk-cpp/libvosk/vosk_api.h

Почему я отказался от облачных ASR и собрал инструмент для распознавания речи сам

AlexandreFrolov 5 фев в 10:21

Нет, 60 Мбайт конечно. Но если нарезать, то уже все равно какой объем

Почему я отказался от облачных ASR и собрал инструмент для распознавания речи сам

AlexandreFrolov 5 фев в 07:50

Я сейчас пробую MP3-файл на 60 Гбайт, получается долго на Tesla-T4

Почему я отказался от облачных ASR и собрал инструмент для распознавания речи сам

AlexandreFrolov 5 фев в 04:55

Насколько я понял, у них есть премиальные модели, которые нельзя скачать, а можно лишь использовать через платный сервис.

Почему я отказался от облачных ASR и собрал инструмент для распознавания речи сам

AlexandreFrolov 5 фев в 03:21

Супер! А пробовали ли вы делать диаризацию очень больших звуковых файлов, которые приходится разрезать на части с перекрытием, чтобы распознавание не выполнялось слишком долго, но чтобы спикеры не перепутывались?

Почему я отказался от облачных ASR и собрал инструмент для распознавания речи сам

AlexandreFrolov 5 фев в 03:17

Многие работают на ноутбуках с Windows, поэтому решил рассказать и о том, как распознавать звук прямо на ноутбуке или как сделать клиент распознавания сервера для этой ОС.

Почему я отказался от облачных ASR и собрал инструмент для распознавания речи сам

AlexandreFrolov 5 фев в 03:15

Уже получал претензии что в своих статьях опускал историю развития предмета, о котором рассказывал. Думаю анатомия уха и история будет интересна тем, кто ещё совсем не разбирался в теме.

Почему я отказался от облачных ASR и собрал инструмент для распознавания речи сам

AlexandreFrolov 5 фев в 03:13

Лицензия на код pyannote и модель pyannote/speaker-diarization-3.1 - это MIT, так что платить не надо. А так да, лицензии всегда нужно проверять для коммерческих проектов.

Другое дело, что для начальной загрузки модели перед её использованием нужно зарегистрироваться и получить токен на Hugging Face.

Как прикрутить нейросеть к SDR: распознавание речи в GNU Radio

AlexandreFrolov 23 янв в 13:02

Думаю что можно, но сам не пробовал

Как прикрутить нейросеть к SDR: распознавание речи в GNU Radio

AlexandreFrolov 23 янв в 06:19

Да, в следующей статье, которая готовится к выходу, я рассказал как можно распознавать речь с выполнением диаризации из звуковых файлов, а также в потоке с микрофона (без диаризации, правда), чисто на Python, на своих серверах или компьютерах, с GPU или без GPU. Что же касается GnuRadio, то это приложение сильно облегчает интеграцию с SDR, если, конечно, она нужна.

Как прикрутить нейросеть к SDR: распознавание речи в GNU Radio

AlexandreFrolov 23 янв в 06:11

Да, причем это можно делать даже на своём или арендованном сервере с GPU. Тема очень интересная, буду работать в этом направлении дальше.

Как прикрутить нейросеть к SDR: распознавание речи в GNU Radio

AlexandreFrolov 22 янв в 10:40

В следующей статье я рассказал как это сделать на базе Whisper и PyAnnote. Статья уже написана и готовится к выходу!

Microsoft назвала внедрение SQL Server в Linux «феноменальным» и прекратила поддержку дистрибутива SUSE

AlexandreFrolov 8 дек 2025 в 05:49

Вы же понимаете, что это совершенно недостаточный уровень для проведения проверок критичных информационных систем.

-1

2 3 ...

61 62