Comments 36
Система СОРМ существует и всё записывает. Более того, ни один оператор сотовой связи не сможет получить лицензию для работы если он не купит и не установит за свои деньги эту систему. Есть несколько фирм которые это добро продают, пример разработок ПО для СОРМ
http://www.mfisoft.ru/products/sorm
http://www.mfisoft.ru/products/sorm
Разве записывает? Мне казалось оно по аналогии с СОРМ2 может только прослушивать заранее выбранного абонента, но не писать весь трафик и потом постфактум находить записи.
Представьте тот-же СОРМ2 у интернет-провайдера, там гигабиты трафика в секунду, никто не сможет это записать и складировать.
Представьте тот-же СОРМ2 у интернет-провайдера, там гигабиты трафика в секунду, никто не сможет это записать и складировать.
«Птичка на хвосте принесла», имеет место быть кратковременное хранение записи, после распознавания и сличения с ключевыми словами хранить смысла не имеет. Быть может помимо ключевых слов также происходит сличение голосовых маркеров.
У системы СОРМ-1 (оборудование для слежения за телефонной связью) есть два режима: статистический и выборочный. В статистическом (это режим по умолчанию) на шлюз СОРМ направляется только информация о свойствах вызовов — MSISDN исходящий, MSISDN входящий, время начала, время окончания и пр. В выборочном — сливается полностью трафик выбранных абонентов, включая видеозвонки. Вот для включения второго требуется санкция.
Создание систем, пишущих всё и вся, нецелесообразно даже с точки зрения статистики. Собственно, ne_kotin описал реально существующий порядок работы СОРМ
а если еще учесть, что количество потоков, выделенных под СОРМ, ограничено, то это еще надо постараться попасть «под колпак», ибо даже у НИХ ресурсы не безграничны.
Система СОРМ сама по себе ничего не записывет (причины указаны в начале этой статьи). она лишь позволяет встроиться в любой поток и послушать (посмотреть).
Статья осенила меня подозрением о том, что вскорости введут обязательное лицензирование социальных сетей как отдельный вид связи, с включением их в СОРМ (написание API за свой счет и т.п.). Наверное, Батька будет первым…
После этого комментария наверняка введут :)
Зачем, если всё уже есть у провайдеров? А если и обяжут владельцев сайтов писать полные логи «в целях правоприменения», то обяжут всех, от домашней странички «Васи Пупкина» до ВК и Яндекса. Только соцсети не выйдет, они тут же переименуются в «блогоплатформы», «порталы» и т… п.
Вы не представляете насколько ерундовая ерунда 500 Тб в месяц для оператора с 50 млн абонентов, тем более что это все будет однозначно размазано по региональным узлам связи.
Ваша математика меня порадовала: «514 Б = 500 ТБ» :)
habrahabr.ru/blogs/hosting/108452/
500 Tb я думаю найдут куда воткнуть.
500 Tb я думаю найдут куда воткнуть.
500Тб это много? :) Вы ЦОД того же Мегафона видели? Да и остальные цифры достаточно детские.
А можно я тоже посчитаю по вашим же цифрам?
«в среднем потребляют 134 минуты голосового трафика в месяц»
Это получается 8040 секунд.
«голосовой сигнал в сети GSM передается в виде цифрового потока со скоростью 9,6 Кбит/с»
8040 * 9.6 / 8 / 1024 = 9.4 Мб.
Винчестер на 2 Тб — 4 663.70
Умножим на два, для зеркального рейд-массива и посчитаем стоимость 1Мб.
4663.7 * 2 / 2000000 = 0.04 р. То есть — 4 копейки.
Посчитаем общую стоимость
4 * 9.4 = 37.6 коп.
Итак, стоимость хранения ежемесячных переговоров абонента равна 38 копейкам. Предположим, что тариф абонента — 1коп. за секунду, тогда стоимость хранения составит 0.45% от оплаченного абонентом счета.
0.45% Гигантская цифра, не правда ли? ;) Убивает на корню всю рентабельность «полной прослушки»? Не думаю.
P.S. Да, я посчитал только винчестеры. Давайте предположим, что все остальные затраты — на каналы, сервера и стойки оплачиваются из СМС, мобильного интернета, услуг контент-провайдеров, «хамелеонов», «антиаонов», «услуги Гудок» и прочей фигни.
«в среднем потребляют 134 минуты голосового трафика в месяц»
Это получается 8040 секунд.
«голосовой сигнал в сети GSM передается в виде цифрового потока со скоростью 9,6 Кбит/с»
8040 * 9.6 / 8 / 1024 = 9.4 Мб.
Винчестер на 2 Тб — 4 663.70
Умножим на два, для зеркального рейд-массива и посчитаем стоимость 1Мб.
4663.7 * 2 / 2000000 = 0.04 р. То есть — 4 копейки.
Посчитаем общую стоимость
4 * 9.4 = 37.6 коп.
Итак, стоимость хранения ежемесячных переговоров абонента равна 38 копейкам. Предположим, что тариф абонента — 1коп. за секунду, тогда стоимость хранения составит 0.45% от оплаченного абонентом счета.
0.45% Гигантская цифра, не правда ли? ;) Убивает на корню всю рентабельность «полной прослушки»? Не думаю.
P.S. Да, я посчитал только винчестеры. Давайте предположим, что все остальные затраты — на каналы, сервера и стойки оплачиваются из СМС, мобильного интернета, услуг контент-провайдеров, «хамелеонов», «антиаонов», «услуги Гудок» и прочей фигни.
Прошу прощения за оффтоп, но это только у меня в начале и в конце поста 2 и 5 абзацев текста — в битой кодировке??
Не в личку автору потому, что у остальных спрашиваю.
Не в личку автору потому, что у остальных спрашиваю.
Хм… а автор точно — вы?
users.livejournal.com/_adept_/71381.html#cutid1
users.livejournal.com/_adept_/71381.html#cutid1
СОРМ постоянно пишет только сигнальный трафик (СМС и все факты коммутации). Голос пишут только по выбранным номерам и только в рамках оперативно-розыскных мероприятий. Глобальной слежки точно нет, во всяком случае пока… :-)
А разве СОРМ пишет на хранилище оператора? У провайдера, например, сотрудники даже зайти в комнату с СОРМ не могут, логично предположить, что и хранилище у него свое?
Во первых хранить 500ТБ в месяц решаемая задача.
Во вторых существую и развиваются сервисы трансляции голоса в текст — они могут сущщественно сэкономить место и упростить анализ.
В третьих да, сейчас хранение всех данных нецелесообразно, люди слишком дофига болтают, траффик огромен и продолжает расти. Но ФСБ требует полной покорности и преданности в рамках возможного и чуть чуть за их пределами, а такими темпами вы незаметите когда невозможное станет возможным.
Во вторых существую и развиваются сервисы трансляции голоса в текст — они могут сущщественно сэкономить место и упростить анализ.
В третьих да, сейчас хранение всех данных нецелесообразно, люди слишком дофига болтают, траффик огромен и продолжает расти. Но ФСБ требует полной покорности и преданности в рамках возможного и чуть чуть за их пределами, а такими темпами вы незаметите когда невозможное станет возможным.
CopyPaste статьи 4-летней давности?
Воруй статьи @ получай профит.
К чему вообще эта статья?
Университетская задачка на расчет потребности в дисковом пространстве?
Никто никогда не утверждал что пишут всех и всегда. Но при необходимости ФСБ прослушает всех кого требуется, в рамках российского закона «О связи»
Университетская задачка на расчет потребности в дисковом пространстве?
Никто никогда не утверждал что пишут всех и всегда. Но при необходимости ФСБ прослушает всех кого требуется, в рамках российского закона «О связи»
Всегда считал, что писать всех нереально, мысленно сравниваня с архивом netflow небольшого провайдера (пару терабайт в месяц). Думалось, что на голос на несколько порядков больше места надо.
Ан нет, 250 копеечных винтов в месяц на население Украины (в 42U поместиться)
Спасибо за статью, пошел восстанавливать SIP в андрофоне.
Ан нет, 250 копеечных винтов в месяц на население Украины (в 42U поместиться)
Спасибо за статью, пошел восстанавливать SIP в андрофоне.
Если дадут стандартизированные сборщики и API к операторам, то такая система реализуется за пол-года — год силами пары программистов и менеджера проекта.
500Тб — смехотворный объём. С учётом, что это NL-STORAGE (в отличие от метаданных, которые hot) их можно хранить на совсем смешных массивах (например, RAID60 (16) = 12*3Тб=36Тб, полка на 36 дисков плюс система/хотспаря, = 2 массива на полку, то есть 72Тб данных на 4U. Стойка имеет примерно 38 полезных юнитов, то есть всё это хозяйство займёт одну (прописью: ОДНУ) стойку. К этому полагается ещё пара серверов с мета-данными о вызовах, hadoop или что-то им подобное, простенькие выборки — и всё.
Подумайте сами: ютубо-подобные (я уж не про сам ютуб) сайты как-то с диким потоком видео справляются? И с поиском, и с аплоадом, и с структуризацией… А в условиях полного заполнения метаданными от биллингов — будет просто ляпота и изящество.
500Тб — смехотворный объём. С учётом, что это NL-STORAGE (в отличие от метаданных, которые hot) их можно хранить на совсем смешных массивах (например, RAID60 (16) = 12*3Тб=36Тб, полка на 36 дисков плюс система/хотспаря, = 2 массива на полку, то есть 72Тб данных на 4U. Стойка имеет примерно 38 полезных юнитов, то есть всё это хозяйство займёт одну (прописью: ОДНУ) стойку. К этому полагается ещё пара серверов с мета-данными о вызовах, hadoop или что-то им подобное, простенькие выборки — и всё.
Подумайте сами: ютубо-подобные (я уж не про сам ютуб) сайты как-то с диким потоком видео справляются? И с поиском, и с аплоадом, и с структуризацией… А в условиях полного заполнения метаданными от биллингов — будет просто ляпота и изящество.
Автор, поясните, зачем хранить голос в mp3, да еще с битрейтом 8kbps?
Чего ключевых слов никто не написал, по каким запись начинает осуществляться?
Sign up to leave a comment.
О фиксации переговоров абонентов сотовой связи