@alizar16 янв 2017 в 18:28

Новый кодек Codec2 700C сжимает речь до 700 бит/c

4 мин

32K

СофтЗвукСотовая связь

+42

Комментарии 76

@evnuh 16 янв 2017 в 19:14

всякие ссылки поломаны, проверьте ещё раз каждую

@unxed 16 янв 2017 в 19:23

преимущественно ссылки «слушать»

@FisHlaBsoMAN 18 янв 2017 в 09:57

Можно поискать самому http://www.rowetel.com/downloads/codec2/

@pfactum 16 янв 2017 в 19:22

Хорошо. Но есть куда стремиться.

@smartly 16 янв 2017 в 19:30

>Например, при цифровой передаче звука с Марса.

Предлагаю передавать сообщения текстом.

НЛО прилетело и опубликовало эту надпись здесь

@smartly 16 янв 2017 в 19:37

Описаный в статье кодек не годится для записи звуков атмосферы марса.

@lucius 17 янв 2017 в 14:09

В звуках атмосферы Марса присутствует речь?)

@dron_k 16 янв 2017 в 20:52

Могут быть ситуации в рамках каких либо оперативных процедур,
когда набирать текст неудобно или нет времени…
Распознавание же речи пока не может быть использовано в критических отраслях изза вероятности ошибок.

@rusec 16 янв 2017 в 21:50

радиосигнал до Марса идёт несколько минут в одну сторону. Какая уж тут оперативность.

@TheShock 16 янв 2017 в 23:43

Ремонт прибора, когда руки заняты.

@Hellsy22 17 янв 2017 в 01:07

Чуть больше, чем несколько минут.
Мне тоже показался пассаж про Марс странным — оттуда картинки в высоком качестве передают с приличной скоростью.

@rusec 17 янв 2017 в 01:12

ну да. Если я правильно делю 56-400 000 000 км на скорость света, то от 3 до 22, в зависимости от взаимного расположения планет. А что Вас удивляет? Скорость света конечна, даже до геостационара задержка чувствуется, пинг через спутник заметно больше чем по подводному кабелю, а Марс намного дальше.

@dron_k 17 янв 2017 в 19:34

>>>радиосигнал до Марса идёт несколько минут в одну сторону. Какая уж тут оперативность.
Голосовое сообщение в любом случае будет отправлено быстрее чем печатаное.

@dron_k 19 мар 2017 в 15:52

* отправлено а не получено.

@eZjik 17 янв 2017 в 20:18

лазером передавать

НЛО прилетело и опубликовало эту надпись здесь

@kryvichh 17 янв 2017 в 12:34

Оптимальный голосовой кодек будет: текст в фонетической транскрипции + параметры отдельных звуков + описание физических особенностей речевого аппарата говорящего (передается в начале передачи один раз).

Правда, такой кодек не закодирует всхлипы, кашель, крик ужаса и т.п.

@Alyoshka1976 16 янв 2017 в 19:45

Этот кодек будет очень востребован в любительской радиосвязи на сверхдлинных волнах (в «диапазоне мечтателей» ниже девяти килогерц).

@unxed 16 янв 2017 в 22:52

А как любители мастерят антенны для сверхдлинных волн?

@ZekaVasch 17 янв 2017 в 06:00

ну один например подключился в лееру ограждения на дороге. Несколько км антенны для приема сигналов с подводных лодок.

На форумах Радиосканер ру поройтесь

@Alyoshka1976 17 янв 2017 в 06:34

Там всё ограничено фантазией :-) Вот, например, воздушный змей тянет вверх провод:

Или просто вертикальный провод, подвешенный к башне, с вот такой эпической удлиняющей катушкой:

Но это всё передающие. Приемные намного проще — я, например, использую вот такую немудреную снасть :-):

@spiritube 16 янв 2017 в 19:45

Например, при цифровой передаче звука с Марса.

И для хранения голосового трафика согласно «Закону Яровой» тоже очень полезен.

@salopot 16 янв 2017 в 21:35

Это еще мелочи, вот если Роскосмос таки решит отправить космонавтов куда-нибудь на марс, то по закону о «Персональных данных» им прийдется все переговоры записать до отлета и хранить в серверах на территории России. Иначе скорость света будет оштрафована…

@darthmaul 17 янв 2017 в 07:46

Лучше пусть вакуум штрафуют. Вроде как отрицательная масса могла бы помочь создать варп двиатель :)

@Nine_tailed 17 янв 2017 в 07:55

Государственной территорией считаются (условно) также морские суда, воздушные и космические корабли, носящие флаг соответствующего государства.

@salopot 17 янв 2017 в 11:13

Вы полагает что гугл может припарковать в Норфолке частный корабль зарегистрированный в Росии и спокойно размещать там персональные данные граждан РФ. Именно это вы увидели в законе?

P.S. Нужно предложить на хабре универсальную кноку чтоб одновремнно понижать и статус комментария и карму. А-то какой-то бедняга заминусовав комент вынужден еще переходить в профиль и третий клик на карме. Как-то не user friendly получается

@Nine_tailed 17 янв 2017 в 11:44

Я не юрист и не могу сказать можно ли так сделать и таким образом обойти данный закон. Вполне может быть там есть специальный пункт для экстерриториальности (именно это вы описали — российское судно в порту иностранного государства).

@kosmos89 17 янв 2017 в 18:06

Интересно, а на МКС есть таможня между национальными сегментами?

@LynXzp 17 янв 2017 в 16:54

А вдруг стеганография? Не хорошо получается. Пусть во flac хранят :)

@ruzzzz 16 янв 2017 в 20:18

Отличная новость!

@Tyrauriel 16 янв 2017 в 21:04

Интересно, почешется Росгидромет, чтобы внедрить этот кодек у себя?
У них есть спутниковые терминалы двусторонней передачи данных, через свои собственные спутники.
Там ограничение до 1200 бит.

@stalinets 16 янв 2017 в 21:46

Интересно было бы увидеть программку для IP-телефонии с этим кодеком, чтобы даже на смартфонах, находящихся в зоне 2G/GPRS была возможна устойчивая голосовая связь по IP.

@arheops 16 янв 2017 в 22:19

https://speex.org/docs/manual/speex-manual/node10.html
250бит крайний кодек.
поддерживается asterisk

@Lertmind 17 янв 2017 в 00:22

Что значит «крайний»? Почему вы указали «250 бит», если при 250 битах передачи голоса не происходит (No transmission (DTX))? Также:

There are 7 different narrowband bit-rates defined for Speex, ranging from 250 bps to 24.6 kbps, although the modes below 5.9 kbps should not be used for speech.

@arheops 16 янв 2017 в 22:30

У кодека для телефонии, кстати, должно быть еще два свойства 1) Слабая заметность потери единичного пакета 2) малый пакет/small latency. Этот кодек, вроде бы, оба свойства не имеет.

@insekt 17 янв 2017 в 04:50

Откуда такие свойства проистекают?

@gxcreator 17 янв 2017 в 05:22

1. Чтобы небольшие потери пакетов не искажали речь
2. Чтобы не было задержки речи собеседника.

@arheops 17 янв 2017 в 05:27

Ни откуда не проистекают. Потому кодеки и дают компрессию меньше, чем mpeg. Они так разрабатывалися. Свойство 2 не нужно только кодекам работающим через спутник, задержка в 100мс(через океан) уже человеком опознается. Ну и даже вайфай иногда выдает за 100мс задержки, что аналогично потере пакета, не говоря уже о сети в общем, в которой потери есть почти всегда.

@ValdikSS 18 янв 2017 в 11:40

GPRS и устойчивая голосовая связь противоречат друг другу. На GPRS пинг временами может быть в секунду и больше, а все популярные VoIP-библиотеки не слишком устойчивы к такому широкому джиттеру.

С EDGE, как правило, можно пользоваться кодеком OPUS с битрейтом в 8-12 кбит/с без особых проблем. Качество речи сносное: https://files.catbox.moe/0wz4a7.opus

@nikolayv81 21 янв 2017 в 18:15

В edge работает скайп с видео! Проверено в деревне при ручном переключении модема в 2g из-за того что в 3g связь нестабильна и постоянные разрывы были. Да качество видео конечно не ахти но понять кто перед экраном можно, если не двигается быстро, а звук абсолютно нормальный для общения.

@Dum_spiro_spero 16 янв 2017 в 21:59

Я кажется чего-то не понимаю. А в чем проблема связи с Марсом? До Марса в среднем 225 млн. км, радиоволна пройдет это расстояние за 12.5 минут. Все равно ж связь по радио, а не модем на 300 бод. Можно произнести монолог и отправить его хоть в hi-res audio.
Или нет?
Погуглил радиомодемы — пишут 25 кГц, 19.2 кбод. Пишут, что скорость передачи почему-то завязана на энергию.
Кто бы на пальцах объяснил?

@arheops 16 янв 2017 в 22:21

Чем больше скорость передачи, тем более критичен сигнал к шумам(падает соотношение сигнал-шум). Тоесть используя низкоскоростной канал, вы можете использовать меньше антенну и/или слабее передатчик. К примеру вместо 30м тарелки и 50кватт передатчика, 5м тарелку и 10кватт передатчик(что уже проще, правда?)

@ZEvS_Cat 16 янв 2017 в 22:29

+1. А еще, чем выше скорость передачи, тем шире полоса частот, необходимая для такой передачи. А чем шире полоса, тем потребуется бОльшая мощность.

@arheops 16 янв 2017 в 22:32

Не совсем так. Полоса может быть и узкая, или 10 узких, просто расширять полосу на данном этапе проще, чем еще поднять мощность. Вообще в идеале надо иметь бесконечное число сверх-узких полосок, но это невозможно по физическим причинам(кроме варианта лазеров, которые именно такие полоски и дают — практически одна частота).

@ZEvS_Cat 16 янв 2017 в 23:09

Вот я и написал, что выгоднее сужать полосу (понижая скорость передачи — объем данных в секунду), чем увеличивать мощность передатчика.

@Alexeyslav 17 янв 2017 в 09:28

Связано это с количеством информации которую переносят радиоволны. Современные системы связи работают практически на пределе теоретических возможностей — около 1 бита на квант. Если бы существовал способ передать сигнал без потерь и рассеивания, то скорости были бы гораздо выше но антенны они такие, даже у направленных антенн сигнал с расстоянием расходится и плотность в точке приёма падает. Да, если бы приёмник мог сконцентрировать всю энергию переданную передатчиком, было бы не так плохо всё, но для этого нужны будут поистине гигантские антенны. А пока, инженеры вынуждены удовлетворяться приёмом только небольшой части энергии отправленного сигнала.
Причем с земли отправить гораздо проще — тут нет особых ограничений на размер антенны и мощность излучения, а на автономном аппарате в глубоком космосе весьма строгие ограничения как на размер антенны так и излучаемую мощность.
А потом ещё соотношение сигнал/шум портит малину, но матемаическими методами вроде бы добиваются определённых успехов, приближаясь к теоретическому пределу возможностей передачи информации. Это, к примеру, позволило на тех же антеннах повысить скорость передачи/расстояние надёжной связи до вояджера. На старых технологиях имели бы на таком расстоянии скорость в несколько бит в секунду.

@ZEvS_Cat 17 янв 2017 в 11:26

> Dum_spiro_spero

В общем, популяризирую, совсем на пальцах.
Проведите, вместе со мной умозрительный эксперимент.
У Вас есть передатчик и приемник. Передатчик мощностью 1 мВт, и приемник (какой-то чувствительности). Допустим, передатчик передает 10 кбит/сек.
Теперь представьте, что необходимо передавать 20 кбит/сек.
Как можно поступить?

Вариант 1. Поставить еще один передатчик, точно такой-же, который будет передавать вторые 10 кбит, на соседней частоте. Тоже 1 миливаттный. И конечно второй приемник.
Да, теперь два одномиливаттных передатчика, излучая 2 миливатта передают 20 кбит/сек, и
два приемника их принимают.

Вариант 2. Расширить полосу передатчика в два раза, и увеличить мощность до двух мВт.
Теперь этот передатчик может также, как и в варианте 1, передавать 20 кбит/сек.

С точки зрения физики, нет никакой разницы между первым и вторым вариантом. Не в энергетическом, не в скоростном плане, просто разная схемотехническая реализация.

@YegorVin 18 янв 2017 в 16:12

«Расширить полосу передатчика»
Что вы подразумеваете под полосой, увеличение частоты несущей?

@ProstoUser 17 янв 2017 в 11:36

Завязка на энергию простая.

Есть несущая частота сигнала и есть модуляция этой несущей частоты. Собственно модуляция и содержит полезную информацию. То есть в зависимости от передаваемой последовательности единиц и нулей изменяются какие-то параметры излучаемой частоты. Обычно, меняют амплитуду, частоту и фазу. Иногда одновременно. На принимающей стороне смотрим, как меняются параметры несущей и восстанавливаем переданную последовательность.

Чем больше изменений в единицу времени, тем больше информации в ту же единицу времени можно передать. Но когда в передатчике мы меняем параметры излучаемого радиосигнала, в приемнике встает проблема отличить изменение параметров сигнала от случайной помехи. Помехи важны не сами по себе, Интересна мощность помех относительно мощности полезного сигнала. Вот тут и появляется соотношение сигнал/шум. Чем больше отношение сигнал/шум, тем меньшее влияние оказывают помехи, тем чаще и тем слабее можно менять исходный сигнал, увеличивая его информационную емкость.

Простейший пример. Пусть мы передаем сигнал амплитудной модуляцией. Мы можем передавать единичку максимальным уровнем, а ноль нулевым. При этом достаточно просто понимать, есть сигнал или нет сигнала. Надежная передача получится в том случае, если уровень шумов будет таким, что не «заглушит» несущую, если она есть и не даст ложного срабатывания ее нет. Для надежного определения факта наличия несущей можно увеличить время ее определения в принятом сигнале. Чем более длинный кусок эфира мы анализируем, тем меньше вероятность ошибки. Если же мы можем различать уровни амплитуды, например, 0, 1/3, 2/3, 1, то за одно изменение синала мы сможем передать уже не один бит, а целых два. Но для этого надо, чтобы уровень шума был меньше, чем в предыдущем случае. Чтобы различать не только факт наличия несущей, но и ее «громкость».

Ну а единственный способ увеличить соотношение сигнал/шум при выбранных параметрах передатчиков, модуляции и антенн — увеличить мощность сигнала.

Вот как-то так. Немного путано, но, надеюсь, понятно.

@ZEvS_Cat 16 янв 2017 в 22:24

Интересно, как получается FFT 512, если на входе только 80 отчетов?

@Halt 17 янв 2017 в 03:28

Zero padding плюс, скорее всего, там скользящее окно, то есть старые данные не выбрасываются а сдвигаются.

@ZEvS_Cat 17 янв 2017 в 09:44

Да, подумал про это. Наверное, исходя из 320 отчетов делается долговременное предсказание.

@Deosis 17 янв 2017 в 05:22

Написано, что используется 320 отсчетов, для БПФ дополняют до степени двойки.
80 — это количество новых отсчетов каждые 10 мс.

@arthi7471 17 янв 2017 в 07:09

«PSK-модем — устройство для относительно нового цифрового вида».

Штаааа? Да PSK сто лет в обед.

@SopaXT 17 янв 2017 в 08:17

Да, но этот модем использует несколько несущих, и был специально разработан для FreeDV.

@Newbilius 17 янв 2017 в 07:26

Ни в 1300, ни в 700C не могу разобрать текст целиком, только отдельные слова выхватываю, и то ненадёжно. А вот Codec2 v0.1 (2550 бит/с) и MELP (2400 бит/с) звучат гораздо разборчивей.

@Nihonjin 17 янв 2017 в 07:40

Вполне разборчиво, если прослушать сообщение 5+ раз, каждый раз проматывая в голове возможные варианты сказанного :D
Вообще, мне думается что англофонам не составит труда понять речь и с первого раза.

@ZEvS_Cat 17 янв 2017 в 09:56

Я даже слушать не стал. Считаю, разборчивость надо оценивать на родном языке.

@hzs 17 янв 2017 в 08:41

Я разницу между 1300 и 700 вообще на слух не различил, и там и там голос вполне отчётливо слышно.
В условиях очень больших расстояний и стоимости оборудования, 700C может быть очень хорошим вариантом.

@vanxant 17 янв 2017 в 09:29

Ну не знаю, в последнем сэмпле голос-то слышно, вот только текст не разобрать) В обоих вариантах.

@hzs 18 янв 2017 в 02:52

Там не особо текст, там приветствие с произношением позывных: Hello CQCQCQ. Calling CQ. This is KA9Q. А дальше действительно неразборчиво, но это скорее всего связано с моим фиговым английским ну и произношение у говорящего явно хромает.
Вероятно пример последних семплов и был добавлен чтобы показать, что качество 700С не хуже и что если на сжатом им файле ничего не разобрать, то и на кодеке с увеличенном вдвое битрейте будет не лучше.

@DjOnline 17 янв 2017 в 10:07

После прекрасного качества голоса в Skype, который звучит даже лучше чем в сотовой связи, здесь что на 1300 что на 700 вообще ничего не разобрать.

@h31 17 янв 2017 в 11:02

Скайп совсем для других целей создавался. У него битрейт в разы выше.

@aram_pakhchanian 17 янв 2017 в 11:42

Все вполне очень отчетливо слышно – примерно как в любительском эфире, откуда часть записей и взята. Качество для целей служебной радиосвязи вполне удовлетворительное.

@Killy 17 янв 2017 в 12:26

Спектр для образца vk5qi.
Вверху 700С, внизу 1300.

(PNG 2.2 МБ)
В 700С лучше видны верхние гармоники. А нижние зачастую хуже видны или немного искажены. (Не хватает оригинала для сравнения.)
Для меня 700С звучит более резко, но менее разборчиво из-за искажений, что согласуется с наблюдением, сделанным при сравнении спектров.

@vit1251 18 янв 2017 в 01:06

Рисовали в MathCad? Подскажите название этого инструмента?

@Killy 18 янв 2017 в 11:57

Это скриншот из ocenaudio всего-навсего.
(Рекомендую в качестве альтернативы для Audacity.)

@Killy 18 янв 2017 в 12:01

Тем, кто со звуком работает, ещё Sonic Visualiser должен быть знаком.

@Alyoshka1976 18 янв 2017 в 13:59

Любителям радиомониторинга такая спектрограмма-«водопад» тоже знакома по работе с такими программами как SDR# и Spectrum Lab.

@kissarat 17 янв 2017 в 13:51

Если записывать голос 50 лет по 8 часов в день то получится 43 Гб

@ZEvS_Cat 18 янв 2017 в 01:10

Вот еще вопрос. 700 бит/с, в «кадре» содержится 10 ms, значит в секунде 100 «кадров».
Что, каждый «кадр» по 7 бит?!?

@amarao 18 янв 2017 в 01:29

У Винжа разбирался такой вариант кодека: старательно тренируемая нейронная сеть (а-ля deepdream) учится «говорить как человек», т.е. получать на вход текст с маркерами эмоций, а выдавать звук. (и обратная задача, но это не важно сейчас).

Соответственно, при передаче по сверхнизкому каналу передаётся текст, если есть полоса — маркеры интонаций, если есть полоса — подстроечные коэфиценты для нейронной сети для передачи голоса.

При этом даже если канал падает до минимально возможного, мы всё ещё слышим речь, но «механическую». Если полоса широкая — нейронная сеть воспроизводит голос неотличимо от оригинала.

@delvin-fil 18 янв 2017 в 01:34

Может я чего-то не понимаю, но как по «ВАВ» судить? А по ссылкам именно wav.

@ValdikSS 18 янв 2017 в 11:46

wav получились путем сжатия исходной записи и разжатия обратно в wav.

@Acuna 18 мар 2017 в 20:05

Я, наверное, что-то не понял, но 700 бит практически нечленоразделен:

http://www.rowetel.com/downloads/codec2/newamp3/ve9qrp_10s_700B.wav

Это они такое хотят внедрять?

Зарегистрируйтесь на Хабре, чтобы оставить комментарий