Обновить
45
0
Александр Фролов@AlexandreFrolov

Генеральный директор

Отправить сообщение

А есть ли подобные риски при работе с ИП?

Нет, 60 Мбайт конечно. Но если нарезать, то уже все равно какой объем

Я сейчас пробую MP3-файл на 60 Гбайт, получается долго на Tesla-T4

Насколько я понял, у них есть премиальные модели, которые нельзя скачать, а можно лишь использовать через платный сервис.

Супер! А пробовали ли вы делать диаризацию очень больших звуковых файлов, которые приходится разрезать на части с перекрытием, чтобы распознавание не выполнялось слишком долго, но чтобы спикеры не перепутывались?

Многие работают на ноутбуках с Windows, поэтому решил рассказать и о том, как распознавать звук прямо на ноутбуке или как сделать клиент распознавания сервера для этой ОС.

Уже получал претензии что в своих статьях опускал историю развития предмета, о котором рассказывал. Думаю анатомия уха и история будет интересна тем, кто ещё совсем не разбирался в теме.

Лицензия на код pyannote и модель pyannote/speaker-diarization-3.1 - это MIT, так что платить не надо. А так да, лицензии всегда нужно проверять для коммерческих проектов.

Другое дело, что для начальной загрузки модели перед её использованием нужно зарегистрироваться и получить токен на Hugging Face.

Думаю что можно, но сам не пробовал

Да, в следующей статье, которая готовится к выходу, я рассказал как можно распознавать речь с выполнением диаризации из звуковых файлов, а также в потоке с микрофона (без диаризации, правда), чисто на Python, на своих серверах или компьютерах, с GPU или без GPU. Что же касается GnuRadio, то это приложение сильно облегчает интеграцию с SDR, если, конечно, она нужна.

Да, причем это можно делать даже на своём или арендованном сервере с GPU. Тема очень интересная, буду работать в этом направлении дальше.

В следующей статье я рассказал как это сделать на базе Whisper и PyAnnote. Статья уже написана и готовится к выходу!

Вы же понимаете, что это совершенно недостаточный уровень для проведения проверок критичных информационных систем.

Настоящее исследование безопасности предполагает в том числе тщательный и весьма дорогостоящий анализ ПО на уровне его исходного кода, а не только анализ как черного ящика.

Даже если сеть не имеет выхода в интернет, кто знает, может там есть закладки, которые, например, уничтожат всю информацию через определенное время или что хуже, начнут незаметно ее искажать. Или там есть бекдоры, которыми можно воспользоваться изнутри сети в обход настроенной системы разграничения доступа.

Т.е. признать то безопасной можно, но так ли это на самом деле? И смотря для какой модели угроз. Вот, например, защита от системного администратора, у которого есть доступ ко всему, на мой взгляд не очень тривиальна.

Ну вот, вопрос про ответственность кому-то не понравился, поставили минус, но без комментария)

А ведь на самом деле интересно, как это и почему для критически важных систем были выбраны полностью закрытые решения от Microsoft, которые фактически привязывают все к одному вендору из другой страны. Да, я знаю про частичное раскрытие кода Microsoft, но это только частичное.

При этом такой выбор не дает возможности ни полного анализа безопасности на уровне исследования кода от Microsoft, ни возможности быстрого перехода к другому вендору без переписывания значительной части ПО.

А как насчет ответственности за выбор для критичных приложений таких закрытых систем, которые даже теоретически невозможно исследовать на предмет наличия всякого рода закладок и вредоносного кода, так как нет полных исходников?

Что если поддержка закрытых систем или даже сама возможность их использования может вдруг исчезнуть по тем или иным причинам?

Полагаю, как раз поэтому сейчас и переводят критические системы на открытый софт типа PostgreSQL. И даже обычные компы, где раньше стояла ОС Windows, переводят на локализовнные версии Linux. И конечно, для локализованных версий ОС и БД с открытыми текстами имеется поддержка со стороны тех или иных компаний.

Вообще всякие там социальные сети и прочие подобные системы не делают на решениях Microsoft. Там как раз открытые решения применяются, просто созданные для безумных объемов данных с шардированием, всякие там балансировщики нагрузок, масштабирование на сотни и тысячи серверов, куберы и т.п.

Т.е. на вырост можно выбрать и открытые решения. Но в корпоративном секторе, конечно, свои особенности.

Тут даже дело не в том, чтобы не пользоваться передовыми технологиями, а в том, чтобы уже на этапе до создания системы сделать такой выбор, чтобы и не платить лишнего, и чтобы было куда мигрировать, если такое потребуется.

Для тех кто уже на MS SQL все понятно - если нужна миграция по тем или иным причинам, можно начинать уже прямо сейчас, так как это будет трудно и дорого.

А кто выбирает БМВ для перевозки дров вместо трактора потому что БМВ более передовой по технологиям - ну что ж, если есть лишние деньги почему бы и нет. Кстати эта транспортная компания, про которую я писал выше, выбрала БМВ не просто так, а для рекламы. Так что у каждого выбора есть свои мотивы!

Да, но пересесть, скажем, с MySQL на MariaDB или на Percona Database, и даже на PostgreSQL все же намного легче, чем с MS SQL на что-то еще. Сам пробовал)

1
23 ...

Информация

В рейтинге
6 093-й
Откуда
Москва и Московская обл., Россия
Дата рождения
Зарегистрирован
Активность