Pull to refresh

Comments 36

Система СОРМ существует и всё записывает. Более того, ни один оператор сотовой связи не сможет получить лицензию для работы если он не купит и не установит за свои деньги эту систему. Есть несколько фирм которые это добро продают, пример разработок ПО для СОРМ
http://www.mfisoft.ru/products/sorm

Разве записывает? Мне казалось оно по аналогии с СОРМ2 может только прослушивать заранее выбранного абонента, но не писать весь трафик и потом постфактум находить записи.
Представьте тот-же СОРМ2 у интернет-провайдера, там гигабиты трафика в секунду, никто не сможет это записать и складировать.
Интернет провайдеры хранят netfolw
Этого достаточно.
О чем и речь, это всего-лишь статистика, но не содержимое, телефонные операторы тоже статистику хранят.
«Птичка на хвосте принесла», имеет место быть кратковременное хранение записи, после распознавания и сличения с ключевыми словами хранить смысла не имеет. Быть может помимо ключевых слов также происходит сличение голосовых маркеров.
У системы СОРМ-1 (оборудование для слежения за телефонной связью) есть два режима: статистический и выборочный. В статистическом (это режим по умолчанию) на шлюз СОРМ направляется только информация о свойствах вызовов — MSISDN исходящий, MSISDN входящий, время начала, время окончания и пр. В выборочном — сливается полностью трафик выбранных абонентов, включая видеозвонки. Вот для включения второго требуется санкция.
Создание систем, пишущих всё и вся, нецелесообразно даже с точки зрения статистики. Собственно, ne_kotin описал реально существующий порядок работы СОРМ
а если еще учесть, что количество потоков, выделенных под СОРМ, ограничено, то это еще надо постараться попасть «под колпак», ибо даже у НИХ ресурсы не безграничны.
Система СОРМ сама по себе ничего не записывет (причины указаны в начале этой статьи). она лишь позволяет встроиться в любой поток и послушать (посмотреть).
Статья осенила меня подозрением о том, что вскорости введут обязательное лицензирование социальных сетей как отдельный вид связи, с включением их в СОРМ (написание API за свой счет и т.п.). Наверное, Батька будет первым…
После этого комментария наверняка введут :)
Скорее к запрету на сайты знакомств добавят и социальные сети. Это если говорить про Беларусь.
Зачем, если всё уже есть у провайдеров? А если и обяжут владельцев сайтов писать полные логи «в целях правоприменения», то обяжут всех, от домашней странички «Васи Пупкина» до ВК и Яндекса. Только соцсети не выйдет, они тут же переименуются в «блогоплатформы», «порталы» и т… п.
Вы не представляете насколько ерундовая ерунда 500 Тб в месяц для оператора с 50 млн абонентов, тем более что это все будет однозначно размазано по региональным узлам связи.
Ваша математика меня порадовала: «514 Б = 500 ТБ» :)
Кстати, да. В оригинале (в ЖЖ _adept_), ссылка на который приведена ниже, написано 5E14 Б, что уже имеет смысл.
Автор выбросил непонятный символ? :)
Вот как раз про этот ЦОД и говорю ниже.
500Тб это много? :) Вы ЦОД того же Мегафона видели? Да и остальные цифры достаточно детские.
А можно я тоже посчитаю по вашим же цифрам?
«в среднем потребляют 134 минуты голосового трафика в месяц»
Это получается 8040 секунд.

«голосовой сигнал в сети GSM передается в виде цифрового потока со скоростью 9,6 Кбит/с»
8040 * 9.6 / 8 / 1024 = 9.4 Мб.

Винчестер на 2 Тб — 4 663.70
Умножим на два, для зеркального рейд-массива и посчитаем стоимость 1Мб.
4663.7 * 2 / 2000000 = 0.04 р. То есть — 4 копейки.

Посчитаем общую стоимость
4 * 9.4 = 37.6 коп.

Итак, стоимость хранения ежемесячных переговоров абонента равна 38 копейкам. Предположим, что тариф абонента — 1коп. за секунду, тогда стоимость хранения составит 0.45% от оплаченного абонентом счета.

0.45% Гигантская цифра, не правда ли? ;) Убивает на корню всю рентабельность «полной прослушки»? Не думаю.

P.S. Да, я посчитал только винчестеры. Давайте предположим, что все остальные затраты — на каналы, сервера и стойки оплачиваются из СМС, мобильного интернета, услуг контент-провайдеров, «хамелеонов», «антиаонов», «услуги Гудок» и прочей фигни.
Прошу прощения за оффтоп, но это только у меня в начале и в конце поста 2 и 5 абзацев текста — в битой кодировке??
Не в личку автору потому, что у остальных спрашиваю.
Отвечать не надо. Похоже, проблема у меня. Если у кого-то еще текст, взятый в "<i>...<i>", выводится битым, маякните в ЛС. Еще раз извиняюсь за мусор.
СОРМ постоянно пишет только сигнальный трафик (СМС и все факты коммутации). Голос пишут только по выбранным номерам и только в рамках оперативно-розыскных мероприятий. Глобальной слежки точно нет, во всяком случае пока… :-)
А разве СОРМ пишет на хранилище оператора? У провайдера, например, сотрудники даже зайти в комнату с СОРМ не могут, логично предположить, что и хранилище у него свое?
Во первых хранить 500ТБ в месяц решаемая задача.
Во вторых существую и развиваются сервисы трансляции голоса в текст — они могут сущщественно сэкономить место и упростить анализ.
В третьих да, сейчас хранение всех данных нецелесообразно, люди слишком дофига болтают, траффик огромен и продолжает расти. Но ФСБ требует полной покорности и преданности в рамках возможного и чуть чуть за их пределами, а такими темпами вы незаметите когда невозможное станет возможным.
К чему вообще эта статья?
Университетская задачка на расчет потребности в дисковом пространстве?
Никто никогда не утверждал что пишут всех и всегда. Но при необходимости ФСБ прослушает всех кого требуется, в рамках российского закона «О связи»
Всегда считал, что писать всех нереально, мысленно сравниваня с архивом netflow небольшого провайдера (пару терабайт в месяц). Думалось, что на голос на несколько порядков больше места надо.
Ан нет, 250 копеечных винтов в месяц на население Украины (в 42U поместиться)

Спасибо за статью, пошел восстанавливать SIP в андрофоне.
Если дадут стандартизированные сборщики и API к операторам, то такая система реализуется за пол-года — год силами пары программистов и менеджера проекта.

500Тб — смехотворный объём. С учётом, что это NL-STORAGE (в отличие от метаданных, которые hot) их можно хранить на совсем смешных массивах (например, RAID60 (16) = 12*3Тб=36Тб, полка на 36 дисков плюс система/хотспаря, = 2 массива на полку, то есть 72Тб данных на 4U. Стойка имеет примерно 38 полезных юнитов, то есть всё это хозяйство займёт одну (прописью: ОДНУ) стойку. К этому полагается ещё пара серверов с мета-данными о вызовах, hadoop или что-то им подобное, простенькие выборки — и всё.

Подумайте сами: ютубо-подобные (я уж не про сам ютуб) сайты как-то с диким потоком видео справляются? И с поиском, и с аплоадом, и с структуризацией… А в условиях полного заполнения метаданными от биллингов — будет просто ляпота и изящество.
Автор, поясните, зачем хранить голос в mp3, да еще с битрейтом 8kbps?
Чего ключевых слов никто не написал, по каким запись начинает осуществляться?
UFO landed and left these words here
Да. Например, «Сигнатек» делает оборудование СОРМ, которое умеет писать 3G.
Sign up to leave a comment.

Articles