Как стать автором
Обновить

Получаем список российских IP-адресов

Время на прочтение4 мин
Количество просмотров40K

Мир меняется. И в текущей ситуации становится полезным список IP-адресов, условно принадлежащих автономным системам той или иной страны.

Зачем?

Ну, во-первых, можно сделать так, чтобы трафик на эти адреса гарантированно не отправлялся в VPN.

Во-вторых, вполне себе вариант, чтобы трафик на все адреса, кроме российских, отправлялся в VPN. В условиях, когда всё больше и больше ресурсов блокируют подключение по принадлежности вашего адреса к России, вполне себе удобной тактикой может быть дефолтное хождение в нероссийский мир через VPN.

В-третьих, если ваш сервис предназначен только для российских клиентов, вы можете закуклиться и ограничить к нему доступ по IP (российские клиенты, находящиеся за рубежом, и пользователи VPN вам спасибо, конечно, не скажут - но это ваш добровольный выбор).

Да и мало ли других применений.

Получение такого списка легко автоматизируется, но не все заинтересованные знают как. Поскольку я уже порешал эту задачу, можно воспользоваться моим решением. А можно решить ее как-нибудь по-другому.

Как решил я

У нас есть два основных источника, хорошо помогающих в решении.

  1. RIPE публикует актуальный список автономных систем с привязкой к стране.

  2. Routeview публикует дампы BGP RIB в формате MRT TABLE DUMP V2, из которых можно дергать реальный набор префиксов, анонсируемых от автономной системы.

А еще для python написана библиотека pyasn, которая позволяет работать с упомянутыми дампами.

Поэтому логика решения проста как блин - тянем первое и второе, из первого получаем список нужных нам ASN, из второго связку IP-ASN, потом пробегаемся по второму результату с первым и получаем искомое. Ну и еще агрегируем, поскольку нам важны не сами анонсы, а анонсируемое пространство IP-адресов.

Код решения

Всё нижеописанное лежит в github. Название radb-tools скорее историческое, поскольку в текущей версии с RADB решение не связано никак. В первых версиях я пытался собирать всю информацию из RADB.

Решение состоит из двух отдельных скриптов, примитивных и не имеющих особой ценности.

renew-db - обновляет базы из описанных выше источников. Использует утилиты, идущие в комплекте с pyasn.

#!/bin/sh
rm -f rib*.bz2
wget -N https://ftp.ripe.net/ripe/asnames/asn.txt
pyasn_util_download.py --latest
pyasn_util_convert.py --single $(find . -maxdepth 1 -name "rib*.bz2" -print0) ipasn.lst

ip-country.py - генерирует на основании хранящихся тут же баз нужный нам список с именем ip_<country code>.lst. И да, разумеется, можно использовать скрипт для генерации списка префиксов любой страны, не только России.

#!/usr/bin/env python3
# coding: utf-8
# version: 0.4
import sys
import os
import pyasn
from aggregate_prefixes import aggregate_prefixes

try:
  country_code = sys.argv[1].upper()
except:
  print('Usage: ', sys.argv[0], ' <two letters country code> ')
  exit()

networks = []
filepath = os.path.dirname(sys.argv[0])
asndb = pyasn.pyasn(filepath+'/ipasn.lst')
asnfile = filepath + '/asn.txt'
result = filepath + '/ip_' + country_code + '.lst'

with open(result, 'w') as out_file, open(asnfile, 'r') as asn_file:
    asn_list = [ t.split(' ')[0] for t in asn_file if t.split(' ')[-1][:2] == country_code]
    for asn in asn_list:
        try:
            networks.extend(list(asndb.get_as_prefixes(asn)))
        except:
            pass
    for line in list(aggregate_prefixes(networks)):
        print(str(line), file=out_file)

Поскольку скрипт предназначен в основном для использования в различных автоматизированных системах, никакого интерактива не предусмотрено - после запуска он молча обновляет файл результата.

Что дальше?

А дальше можно, например, подсунуть этот список в bird и отдать по BGP в ваш маршрутизатор, чтобы там на его основании куда-то направлять или не направлять трафик. Или, соответственно, завернуть его в ipset и фильтровать на сервере доступ на его основе.

На данный момент в ip_RU.lst генерируется 10840 префиксов (а в ip_US, btw, 61619).

Размер используемых баз достаточно велик (сейчас где-то 4.5 мегабайта занимает список ASN и 113 мегабайт - упакованный RIB), поэтому частые обновления будут поедать ваш трафик, да и смысла в них нет.

У меня скрипты работают раз в сутки.

UPD. Версия получения из RIPE

Чем хорошо комьюнити - всегда находятся опытные люди, которые знают еще какие-нибудь варианты. Один из таких умных людей (спасибо!) принес ссылку на ресурс RIPE, который отдает список ASN, префиксов IPv4 и префиксов IPv6 в json. Чем я немедленно и воспользовался. Код ниже и в github.

#!/usr/bin/env python3
# coding: utf-8
# version: 0.4
from ipaddress import IPv4Address, IPv4Network, ip_address, summarize_address_range
import sys
import os
import json
import requests
from aggregate_prefixes import aggregate_prefixes

try:
  country_code = sys.argv[1].upper()
except:
  print('Usage: ', sys.argv[0], ' <two letters country code> ')
  exit()

networks = []
filepath = os.path.dirname(sys.argv[0])
result = filepath + '/ip_' + country_code + '.lst'
url = 'https://stat.ripe.net/data/country-resource-list/data.json?resource='+country_code
ripe_ip = json.loads(requests.get(url).content)['data']['resources']['ipv4']

with open(result, 'w') as out_file:
    for record in ripe_ip:
#        try:
            if record.find('-') > -1:
                ips = record.split('-')
                ipaddr = list(summarize_address_range(IPv4Address(ips[0]),IPv4Address(ips[1])))
            else:
                ipaddr = [IPv4Network(record)]
            networks.extend(ipaddr)
#        except:
#            pass
    for line in list(aggregate_prefixes(networks)):
        print(str(line), file=out_file)

Поскольку список префиксов, получаемый таким образом, идет из объектов в RIPE DB и отличается от выборки из живой копии RIB первоначального варианта, оставил обе версии - пользоваться можно той, результаты которой больше устраивают.

Только зарегистрированные пользователи могут участвовать в опросе. Войдите, пожалуйста.
Нужен ли список IP страны в вашем окружении?
46.1% Использую/буду использовать142
9.74% Не использую и не буду использовать30
44.16% Я томат136
Проголосовали 308 пользователей. Воздержались 52 пользователя.
Теги:
Хабы:
Если эта публикация вас вдохновила и вы хотите поддержать автора — не стесняйтесь нажать на кнопку
Всего голосов 31: ↑30 и ↓1+29
Комментарии10

Публикации