cd /tmp
brew install gh
gh repo clone ggerganov/whisper.cpp
cd whisper.cpp
bash ./models/download-ggml-model.sh base
bash ./models/download-ggml-model.sh medium
make
Скачаем с Ютуба ролик в качестве примера для распознавания русской речи. Для этого берём короткий ролик Шульман на пару минут, id = f0RCGMCphUM , и выцепляем из него аудиодорожку в формате WAV:
main: processing 'test_16bit.wav' (1990600 samples, 124.4 sec), 4 threads, 1 processors, lang = ru, task = transcribe, timestamps = 1 ...
[00:00:00.000 --> 00:00:03.440] приправим нашу беседу, цитата Бродского.
[00:00:03.440 --> 00:00:05.440] Вот что он писал.
[00:00:05.440 --> 00:00:08.400] Вот смотрите, кот.
[00:00:08.400 --> 00:00:12.720] Коту совершенно наплевать, существует ли общество память
[00:00:12.720 --> 00:00:15.480] или отдел идеологии при ЦК.
[00:00:15.480 --> 00:00:19.160] Также, впрочем, ему безразличный президент США,
[00:00:19.160 --> 00:00:20.520] его наличие или отсутствие.
[00:00:20.520 --> 00:00:23.800] А чем я хуже этого кота?
[00:00:23.800 --> 00:00:28.120] Вот как вы думаете, если бы сделать так,
Можно добавить опцию --print-colors - тогда будет подсвечено, в каких словах нейросетка не уверена. Oпция --max-len N увеличивает длину отдельных строчек до N символов. А --translate сразу переведёт русский текст на английский.
Автоматический перевод, кстати, огонь:
[00:00:00.000 --> 00:00:03.440] Let's add to our conversation a quote from Brodsky.
[00:00:03.440 --> 00:00:05.360] Here's what he wrote.
[00:00:05.360 --> 00:00:08.360] Look, a cat.
[00:00:08.360 --> 00:00:12.720] A cat doesn't give a damn if there's a memory society
[00:00:12.720 --> 00:00:15.480] or a branch of the CPSU ideology.
[00:00:15.480 --> 00:00:19.120] Also, however, he doesn't care about the president, the USA
[00:00:19.120 --> 00:00:20.480] , his presence or absence.
[00:00:20.480 --> 00:00:23.800] And what makes me worse than this cat?
У меня старый макбук (Core i7, 16Gb) - даже не начал вентиляторами шуметь. Отжирает где-то четыре гига памяти.
Привет, меня зовут Александр, я провожу UX и SD проекты с 2007 года, перед этим получив высшее по социологии. Когда раньше я читал о своей профессии тексты вида "удалить аппендицит, если у вас нет бюджета, просто - для этого рассмотрим разные консервные ножи.." - у меня тянулась рука к пистолету. Но сейчас я расслабился, когда понял, что безработица мне не грозит...
Автору: я понимаю, что вы писатель, а не читатель, но если вы всё же прочтёте одну, хотя бы одну книжку по service design и user experience, будет уже гораздо лучше. Поверьте, вы не первооткрыватель, социология существует сто лет, эргономика и UX - пятьдесят.
Присоединяюсь к аргументам в пользу self-hosted VPN — оно и надёжнее, и обходится в пару евро. На этом плюсы в статье заканчиваются.
Ну посудите, зачем «все эти навороты в зоопарке», если цена — необходимость устанавливать спец. приложение? Сила того же IKEv2 в том, что его поддержка встроена в ОС — в Windows, в MacOS, в iOS. Пользователь скачал файлик *.mobileconfig, ввёл один раз пароль — и всё заработало (и никаких «установи сертификаты», упаси бог).
Инновации должны быть на сервере — в противостоянии прощупыванию, в выстраивании цепочек серверов, чтобы входной и выходной IP хотя бы отличались, и так далее. Можно тот же ShadowSocks переписать заново начисто, вылечив от детских ошибок, и сделать модулем для StrongSwan. Не надо повышать требования к клиенту — они должны быть минимальными, только тогда VPN останется массовым.
увлечение «Эльбрусами» — это симптом болезни, а не лекарство.
В бизнесе есть разделение на «капитальные затраты» (CAPEX — железки) и «операционные» (OPEX — работы, услуги, зарплаты). Если деньги вваливаются в железки, а обслуживающие их люди получают низкие зарплаты — это симптом того, что с управлением что-то не то (либо некомпетентны, либо набивают карманы, либо и то и другое). Коррупционные схемы легче реализовывать на капитальных затратах — событие разовое, проще скрыть.
Понятный пример — установка металлоискателей на вокзалах или закупка томографов без вложений в ставки и обучение врачей. Деньги освоены, ленточку перерезали, отчитались — но лучше не стало.
Что значит «могут»? Нужно исходить из предпосылки, что «давно смогли».
Для понимания — над планом «Nitro Zeus», который должен был был оставить Иран без энергосетей и прочей инфраструктуры в случае обострения кризиса, трудились тысячи людей. Думаете, они с 2016 года ничем новым не занимались?
The plan, code-named Nitro Zeus, was devised to disable Iran’s air defenses, communications systems and crucial parts of its power grid, and was shelved, at least for the foreseeable future, after the nuclear deal struck between Iran and six other nations last summer was fulfilled.
Nitro Zeus was part of an effort to assure President Obama that he had alternatives, short of a full-scale war, if Iran lashed out at the United States or its allies in the region. At its height, officials say, the planning for Nitro Zeus involved thousands of American military and intelligence personnel, spending tens of millions of dollars and placing electronic implants in Iranian computer networks to “prepare the battlefield,” in the parlance of the Pentagon.
Автор для иллюстрации серьёзности проблемы использует не те картинки. Дайте я помогу.
Вот на Евгения Игоревича смотрит генерал Пол Накасоне, командующий United States Cyber Command. Интересующимся этой личностью предлагаю погуглить «Иран + Nitro Zeus».
Согласно принятому американским конгрессом H.R.5515 — National Defense Authorization Act for Fiscal Year 2019 его ведомство активно поощряется делать закладки («implants») в гражданских сетях («grid» — электросети, транспорт) вероятных противников с целью «deter, safeguard or defend against attacks or malicious cyberactivities against the United States.»
Статья в New York Times утверждает, что американцы перестали полагаться на уговоры и увещевания, и теперь целенаправленно в рамках гос. программы ставят закладки в ключевые элементы российской инфраструктуры. С 2020 года, согласно National Security Presidential Memoranda 13 генералу за такими действиями не надо бегать на утверждение к президенту.
Цитата:
The critical question — impossible to know without access to the classified details of the operation — is how deep into the Russian grid the United States has bored. Only then will it be clear whether it would be possible to plunge Russia into darkness or cripple its military — a question that may not be answerable until the code is activated.
Описанные автором дыры наводят на мысль, что их можно использовать для системного нарушения движения поездов. Если их нашёл автор, то подчинённые генерала — и подавно. Описанный автором риск порчи камер — это цветочки. Если после очередной шалости вроде взлома SolarWind американцы решат ответить ударом по РЖД — поезда по стране будут ходить по маршрутам, рассчитанным в тетрадке, а стрелки будут переключаться месяцы вручную, пока всё будет востанавливаться. По каскаду это приведёт к сбоям в отраслях, зависящих от ж.д. поставок — сначала мазута и нефти, потом остальных.
Ваш «ИТ-кластер» — это стыд и позор. Имел «счастье» подключать видеонаблюдение Ростелекома, эпопея тянется две недели.
Приходят монтажники, протягивают Ethernet. Договор активировать не могут, т.к. у РТК в этот день ломается маршрутизация. Сайт rt.ru и onlime.ru можно открыть только через VPN в Германии, из России он не открывается. Телефон 8-800 не отвечает — соединение просто не устанавливается.
Когда спустя пару часов всё стало подниматься, и личные кабинеты стали открываться, попытка активации камеры завершалась такой вот высокоинформативной ошибкой:
Камера сканирует QR-код, на мгновение появляется в ЛК и пропадает. И всё, хоть ты тресни.
А дальше — две недели ада с дозвоном в абонентскую службу, закрытием тикетов с формулировкой «вы пришлите скриншотов пошагово» (уже прислал, Ростелеком их продолбал). Работа IVR — это треш (меня два раза робот спрашивает, из Москвы ли я, или из Подмосковья, я 10 минут выслушиваю про то, как WiFi плохо работает через стены).
Плата за камеру и за услугу при этом, конечно же, списывается исправно.
В процессе очень хотелось позвонить Диане Самошкиной и рассказать об этом дивном опыте в красках, но сдержался — видимо, зря.
В смысле не обязан? Он гражданин страны, на его налоги содержится профильное ведомство, отвечающее и за сертификацию абонентского оборудования, и за надзор над операторами передвижной связи, и за систему-112. Гражданский долг, как это пафосно не звучит, пнуть «слуг народа», чтобы отработали — а не «патчить один юзкейс».
так каждый может проверить свою симку в своем телефоне заранее
Не может, не обольщайтесь. Даже на сети одного оператора может быть зоопарк решений разных вендоров от Хуавея до Эриксона; экстренные вызовы обслуживаются любым, а не только вашим домашним оператором. Комбинаций может быть сотни.
Так что надо пинать регулятора, чтобы тот пинал сертифицирующий центр и операторов — только так проблема имеет шанс быть решённой для всех.
Вы спорите с человеком, у которого первая запись в трудовой книжке — «КБ Импульс», где-то в серёдке — «Соник Дуо». Я разбираюсь в вопросе.
«Лечить» одного-единственного оператора про одно-единственное глючное абонентское устройство — гиблое занятие. Хотя бы по той причине, что ваш терминал при наборе 112 плюёт на то, какая у него SIM-карта стоит (и стоит ли вообще) и отправляет вызов на ту БС, сигнал от которой в данной точке мощнее — даже если у вашего оператора нет роумингового соглашения с её владельцем.
Нужно эскалировать вопрос отраслевому регулятору, он переварит и пнёт операторов, которым в данном случае придётся провести тесты и донастроить роутинг звонков.
В стране по определению не должно быть сертифицированных аппаратов, не поддерживающих «Систему-112». Того, кто выдал сертификат аппарату для продажи в Таможенном союзе надо долго и тщательно пороть. Автор остановился на полумере, которая вам и мне может не помочь.
Он действительно не решил проблему, а просто её описал. Жалоба регулятору — это единственный способ сделать так, чтобы аппараты этого производителя с подобным багом больше не получали сертификатов соответствия.
Когда вы размещали здесь топик, система должна была вам напомнить, что «Хабр — не жалобная книга».
Правильный алгоритм действий —
1. Жалоба в Минкомсвязи на оператора, с SIM которого не проходит вызов 112.
2. Отдельная жалоба в Минкомсвязи на испытательную лабораторию, выдавшую сертификат соответствия (указана в инструкции к телефону).
Я долго выспрашивал, надо ли кому-нибудь «кишки» в виде антикварных транзисторов — оказалось, что нет. Эти приёмники продают на eBay за пару десятков евро — с кончиной ДВ-вещания эти аппараты представляют только декоративный интерес. Декор сохраню полностью, на кнопки выбора диапазонов повешу spotify-станции. Из внешних отличий — только современный провод питания будет заходить в родной разъём.
Ваш покорный вчера взял приёмник Philips 1962 года выпуска, выкинул из него кишки, поставил Raspberry Pi Zero вместе с аудио-HAT от SeedStudio и настроил Spotify с помощью Mopidy. Осталось завести кнопки радиоприёмника и переменный резистор регулировки громкости через восьмиканальный ADC по I2C, чтобы можно было выбирать «станцию», да Google Assistant прикрутить.
Бюджет — что-то типа $20 и час времени, большая часть из которого ушла на разглядывание схемотехники полувековой давности.
Мы разрабатываем робот для сбора мячей для гольфа.
Лучший робот для сбора мячей — это 4 куска полипропиленовой трубы и мальчонка при них:
Обходится дешевле робота, пользу на рэйндже приносит, в свободное время учится у pro и вырастает в спортсмена. Так же в теннисе — девочки и мальчики, бегающие на турнирах за мячами — это ученики спорт.школ, им надо где-то смотреть, как играют профессионалы, не имея денег на билет в первый ряд.
Вышел вариант Whisper, не требующий GPU - https://twitter.com/jd7h/status/1601535920875966464
Скачаем с Ютуба ролик в качестве примера для распознавания русской речи. Для этого берём короткий ролик Шульман на пару минут, id = f0RCGMCphUM , и выцепляем из него аудиодорожку в формате WAV:
Конвертируем аудиофайл в формат 16 bit WAV:
Запускаем распознавание полученного файла test_16bit.wav (используем модель medium, если охота - можно base, она попроще)
Оно задумывается и начинает выплёвывать:
Можно добавить опцию
--print-colors
- тогда будет подсвечено, в каких словах нейросетка не уверена. Oпция--max-len N
увеличивает длину отдельных строчек доN
символов. А--translate
сразу переведёт русский текст на английский.Автоматический перевод, кстати, огонь:
У меня старый макбук (Core i7, 16Gb) - даже не начал вентиляторами шуметь. Отжирает где-то четыре гига памяти.
Привет, меня зовут Александр, я провожу UX и SD проекты с 2007 года, перед этим получив высшее по социологии. Когда раньше я читал о своей профессии тексты вида "удалить аппендицит, если у вас нет бюджета, просто - для этого рассмотрим разные консервные ножи.." - у меня тянулась рука к пистолету. Но сейчас я расслабился, когда понял, что безработица мне не грозит...
Автору: я понимаю, что вы писатель, а не читатель, но если вы всё же прочтёте одну, хотя бы одну книжку по service design и user experience, будет уже гораздо лучше. Поверьте, вы не первооткрыватель, социология существует сто лет, эргономика и UX - пятьдесят.
Ну посудите, зачем «все эти навороты в зоопарке», если цена — необходимость устанавливать спец. приложение? Сила того же IKEv2 в том, что его поддержка встроена в ОС — в Windows, в MacOS, в iOS. Пользователь скачал файлик *.mobileconfig, ввёл один раз пароль — и всё заработало (и никаких «установи сертификаты», упаси бог).
Инновации должны быть на сервере — в противостоянии прощупыванию, в выстраивании цепочек серверов, чтобы входной и выходной IP хотя бы отличались, и так далее. Можно тот же ShadowSocks переписать заново начисто, вылечив от детских ошибок, и сделать модулем для StrongSwan. Не надо повышать требования к клиенту — они должны быть минимальными, только тогда VPN останется массовым.
В бизнесе есть разделение на «капитальные затраты» (CAPEX — железки) и «операционные» (OPEX — работы, услуги, зарплаты). Если деньги вваливаются в железки, а обслуживающие их люди получают низкие зарплаты — это симптом того, что с управлением что-то не то (либо некомпетентны, либо набивают карманы, либо и то и другое). Коррупционные схемы легче реализовывать на капитальных затратах — событие разовое, проще скрыть.
Понятный пример — установка металлоискателей на вокзалах или закупка томографов без вложений в ставки и обучение врачей. Деньги освоены, ленточку перерезали, отчитались — но лучше не стало.
Для понимания — над планом «Nitro Zeus», который должен был был оставить Иран без энергосетей и прочей инфраструктуры в случае обострения кризиса, трудились тысячи людей. Думаете, они с 2016 года ничем новым не занимались?
Вот на Евгения Игоревича смотрит генерал Пол Накасоне, командующий United States Cyber Command. Интересующимся этой личностью предлагаю погуглить «Иран + Nitro Zeus».
Согласно принятому американским конгрессом H.R.5515 — National Defense Authorization Act for Fiscal Year 2019 его ведомство активно поощряется делать закладки («implants») в гражданских сетях («grid» — электросети, транспорт) вероятных противников с целью «deter, safeguard or defend against attacks or malicious cyberactivities against the United States.»
Статья в New York Times утверждает, что американцы перестали полагаться на уговоры и увещевания, и теперь целенаправленно в рамках гос. программы ставят закладки в ключевые элементы российской инфраструктуры. С 2020 года, согласно National Security Presidential Memoranda 13 генералу за такими действиями не надо бегать на утверждение к президенту.
Цитата:
Описанные автором дыры наводят на мысль, что их можно использовать для системного нарушения движения поездов. Если их нашёл автор, то подчинённые генерала — и подавно. Описанный автором риск порчи камер — это цветочки. Если после очередной шалости вроде взлома SolarWind американцы решат ответить ударом по РЖД — поезда по стране будут ходить по маршрутам, рассчитанным в тетрадке, а стрелки будут переключаться месяцы вручную, пока всё будет востанавливаться. По каскаду это приведёт к сбоям в отраслях, зависящих от ж.д. поставок — сначала мазута и нефти, потом остальных.
Приходят монтажники, протягивают Ethernet. Договор активировать не могут, т.к. у РТК в этот день ломается маршрутизация. Сайт rt.ru и onlime.ru можно открыть только через VPN в Германии, из России он не открывается. Телефон 8-800 не отвечает — соединение просто не устанавливается.
Когда спустя пару часов всё стало подниматься, и личные кабинеты стали открываться, попытка активации камеры завершалась такой вот высокоинформативной ошибкой:
Камера сканирует QR-код, на мгновение появляется в ЛК и пропадает. И всё, хоть ты тресни.
А дальше — две недели ада с дозвоном в абонентскую службу, закрытием тикетов с формулировкой «вы пришлите скриншотов пошагово» (уже прислал, Ростелеком их продолбал). Работа IVR — это треш (меня два раза робот спрашивает, из Москвы ли я, или из Подмосковья, я 10 минут выслушиваю про то, как WiFi плохо работает через стены).
Плата за камеру и за услугу при этом, конечно же, списывается исправно.
В процессе очень хотелось позвонить Диане Самошкиной и рассказать об этом дивном опыте в красках, но сдержался — видимо, зря.
P.S. Тикеты INC000012540123 и INC000012568045
Не может, не обольщайтесь. Даже на сети одного оператора может быть зоопарк решений разных вендоров от Хуавея до Эриксона; экстренные вызовы обслуживаются любым, а не только вашим домашним оператором. Комбинаций может быть сотни.
Так что надо пинать регулятора, чтобы тот пинал сертифицирующий центр и операторов — только так проблема имеет шанс быть решённой для всех.
«Лечить» одного-единственного оператора про одно-единственное глючное абонентское устройство — гиблое занятие. Хотя бы по той причине, что ваш терминал при наборе 112 плюёт на то, какая у него SIM-карта стоит (и стоит ли вообще) и отправляет вызов на ту БС, сигнал от которой в данной точке мощнее — даже если у вашего оператора нет роумингового соглашения с её владельцем.
Нужно эскалировать вопрос отраслевому регулятору, он переварит и пнёт операторов, которым в данном случае придётся провести тесты и донастроить роутинг звонков.
Правильный алгоритм действий —
1. Жалоба в Минкомсвязи на оператора, с SIM которого не проходит вызов 112.
2. Отдельная жалоба в Минкомсвязи на испытательную лабораторию, выдавшую сертификат соответствия (указана в инструкции к телефону).
Попкорн — по вкусу.
Ваш покорный вчера взял приёмник Philips 1962 года выпуска, выкинул из него кишки, поставил Raspberry Pi Zero вместе с аудио-HAT от SeedStudio и настроил Spotify с помощью Mopidy. Осталось завести кнопки радиоприёмника и переменный резистор регулировки громкости через восьмиканальный ADC по I2C, чтобы можно было выбирать «станцию», да Google Assistant прикрутить.
Бюджет — что-то типа $20 и час времени, большая часть из которого ушла на разглядывание схемотехники полувековой давности.
Обходится дешевле робота, пользу на рэйндже приносит, в свободное время учится у pro и вырастает в спортсмена. Так же в теннисе — девочки и мальчики, бегающие на турнирах за мячами — это ученики спорт.школ, им надо где-то смотреть, как играют профессионалы, не имея денег на билет в первый ряд.
Не надо всё подряд автоматизировать.