Как стать автором
Поиск
Написать публикацию
Обновить

Комментарии 36

Система СОРМ существует и всё записывает. Более того, ни один оператор сотовой связи не сможет получить лицензию для работы если он не купит и не установит за свои деньги эту систему. Есть несколько фирм которые это добро продают, пример разработок ПО для СОРМ
http://www.mfisoft.ru/products/sorm

Разве записывает? Мне казалось оно по аналогии с СОРМ2 может только прослушивать заранее выбранного абонента, но не писать весь трафик и потом постфактум находить записи.
Представьте тот-же СОРМ2 у интернет-провайдера, там гигабиты трафика в секунду, никто не сможет это записать и складировать.
Интернет провайдеры хранят netfolw
Этого достаточно.
О чем и речь, это всего-лишь статистика, но не содержимое, телефонные операторы тоже статистику хранят.
«Птичка на хвосте принесла», имеет место быть кратковременное хранение записи, после распознавания и сличения с ключевыми словами хранить смысла не имеет. Быть может помимо ключевых слов также происходит сличение голосовых маркеров.
У системы СОРМ-1 (оборудование для слежения за телефонной связью) есть два режима: статистический и выборочный. В статистическом (это режим по умолчанию) на шлюз СОРМ направляется только информация о свойствах вызовов — MSISDN исходящий, MSISDN входящий, время начала, время окончания и пр. В выборочном — сливается полностью трафик выбранных абонентов, включая видеозвонки. Вот для включения второго требуется санкция.
Создание систем, пишущих всё и вся, нецелесообразно даже с точки зрения статистики. Собственно, ne_kotin описал реально существующий порядок работы СОРМ
а если еще учесть, что количество потоков, выделенных под СОРМ, ограничено, то это еще надо постараться попасть «под колпак», ибо даже у НИХ ресурсы не безграничны.
Система СОРМ сама по себе ничего не записывет (причины указаны в начале этой статьи). она лишь позволяет встроиться в любой поток и послушать (посмотреть).
Статья осенила меня подозрением о том, что вскорости введут обязательное лицензирование социальных сетей как отдельный вид связи, с включением их в СОРМ (написание API за свой счет и т.п.). Наверное, Батька будет первым…
После этого комментария наверняка введут :)
Скорее к запрету на сайты знакомств добавят и социальные сети. Это если говорить про Беларусь.
Зачем, если всё уже есть у провайдеров? А если и обяжут владельцев сайтов писать полные логи «в целях правоприменения», то обяжут всех, от домашней странички «Васи Пупкина» до ВК и Яндекса. Только соцсети не выйдет, они тут же переименуются в «блогоплатформы», «порталы» и т… п.
Вы не представляете насколько ерундовая ерунда 500 Тб в месяц для оператора с 50 млн абонентов, тем более что это все будет однозначно размазано по региональным узлам связи.
Ваша математика меня порадовала: «514 Б = 500 ТБ» :)
Кстати, да. В оригинале (в ЖЖ _adept_), ссылка на который приведена ниже, написано 5E14 Б, что уже имеет смысл.
Автор выбросил непонятный символ? :)
Вот как раз про этот ЦОД и говорю ниже.
500Тб это много? :) Вы ЦОД того же Мегафона видели? Да и остальные цифры достаточно детские.
А можно я тоже посчитаю по вашим же цифрам?
«в среднем потребляют 134 минуты голосового трафика в месяц»
Это получается 8040 секунд.

«голосовой сигнал в сети GSM передается в виде цифрового потока со скоростью 9,6 Кбит/с»
8040 * 9.6 / 8 / 1024 = 9.4 Мб.

Винчестер на 2 Тб — 4 663.70
Умножим на два, для зеркального рейд-массива и посчитаем стоимость 1Мб.
4663.7 * 2 / 2000000 = 0.04 р. То есть — 4 копейки.

Посчитаем общую стоимость
4 * 9.4 = 37.6 коп.

Итак, стоимость хранения ежемесячных переговоров абонента равна 38 копейкам. Предположим, что тариф абонента — 1коп. за секунду, тогда стоимость хранения составит 0.45% от оплаченного абонентом счета.

0.45% Гигантская цифра, не правда ли? ;) Убивает на корню всю рентабельность «полной прослушки»? Не думаю.

P.S. Да, я посчитал только винчестеры. Давайте предположим, что все остальные затраты — на каналы, сервера и стойки оплачиваются из СМС, мобильного интернета, услуг контент-провайдеров, «хамелеонов», «антиаонов», «услуги Гудок» и прочей фигни.
Прошу прощения за оффтоп, но это только у меня в начале и в конце поста 2 и 5 абзацев текста — в битой кодировке??
Не в личку автору потому, что у остальных спрашиваю.
Отвечать не надо. Похоже, проблема у меня. Если у кого-то еще текст, взятый в "<i>...<i>", выводится битым, маякните в ЛС. Еще раз извиняюсь за мусор.
Да, да. Наглый рерайт!
СОРМ постоянно пишет только сигнальный трафик (СМС и все факты коммутации). Голос пишут только по выбранным номерам и только в рамках оперативно-розыскных мероприятий. Глобальной слежки точно нет, во всяком случае пока… :-)
А разве СОРМ пишет на хранилище оператора? У провайдера, например, сотрудники даже зайти в комнату с СОРМ не могут, логично предположить, что и хранилище у него свое?
Во первых хранить 500ТБ в месяц решаемая задача.
Во вторых существую и развиваются сервисы трансляции голоса в текст — они могут сущщественно сэкономить место и упростить анализ.
В третьих да, сейчас хранение всех данных нецелесообразно, люди слишком дофига болтают, траффик огромен и продолжает расти. Но ФСБ требует полной покорности и преданности в рамках возможного и чуть чуть за их пределами, а такими темпами вы незаметите когда невозможное станет возможным.
Воруй статьи @ получай профит.
К чему вообще эта статья?
Университетская задачка на расчет потребности в дисковом пространстве?
Никто никогда не утверждал что пишут всех и всегда. Но при необходимости ФСБ прослушает всех кого требуется, в рамках российского закона «О связи»
Всегда считал, что писать всех нереально, мысленно сравниваня с архивом netflow небольшого провайдера (пару терабайт в месяц). Думалось, что на голос на несколько порядков больше места надо.
Ан нет, 250 копеечных винтов в месяц на население Украины (в 42U поместиться)

Спасибо за статью, пошел восстанавливать SIP в андрофоне.
Если дадут стандартизированные сборщики и API к операторам, то такая система реализуется за пол-года — год силами пары программистов и менеджера проекта.

500Тб — смехотворный объём. С учётом, что это NL-STORAGE (в отличие от метаданных, которые hot) их можно хранить на совсем смешных массивах (например, RAID60 (16) = 12*3Тб=36Тб, полка на 36 дисков плюс система/хотспаря, = 2 массива на полку, то есть 72Тб данных на 4U. Стойка имеет примерно 38 полезных юнитов, то есть всё это хозяйство займёт одну (прописью: ОДНУ) стойку. К этому полагается ещё пара серверов с мета-данными о вызовах, hadoop или что-то им подобное, простенькие выборки — и всё.

Подумайте сами: ютубо-подобные (я уж не про сам ютуб) сайты как-то с диким потоком видео справляются? И с поиском, и с аплоадом, и с структуризацией… А в условиях полного заполнения метаданными от биллингов — будет просто ляпота и изящество.
Автор, поясните, зачем хранить голос в mp3, да еще с битрейтом 8kbps?
Чего ключевых слов никто не написал, по каким запись начинает осуществляться?
НЛО прилетело и опубликовало эту надпись здесь
Да. Например, «Сигнатек» делает оборудование СОРМ, которое умеет писать 3G.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации