Хабр Курсы для всех
РЕКЛАМА
Практикум, Хекслет, SkyPro, авторские курсы — собрали всех и попросили скидки. Осталось выбрать!
with open("file.txt", "w") as f:
f.write("\n".join(list(set(usersStr.split("\n\r")))))
with open("file.txt", "w") as f:
f.write("\n".join(set(usersStr.split("\n\r"))))
with open('habrs.txt') as in_f:
users = in_f.readlines()
users = [ user.strip() for user in users]
users = set(users)
with open('habrs.txt', 'w') as out_f:
for user in users:
out_f.write(user)
out_f.write('\n')
import urllib2, re
def going(names,users = set(),limit=None):
for name in names:
page = urllib2.urlopen("http://habrahabr.ru/users/%s/subscription/followers/"%name).read()
names = set(re.findall('<div class="username"><a href="/users/(.*?)/">', page))
users|=names
if len(users)>=limit:
return users
return going(list(names),users,limit)
all_names=going(['grokru'],limit=100)
import urllib, re
def find_users(limit):
users=set()
for i in xrange(200000):
page=urllib.urlopen("http://habrahabr.ru/post/%s"%i).read()
users|=set(re.findall("http://habrahabr.ru/users/([a-zA-z0-9]+)/",page))
if len(users)>=limit:
return sorted(users)
import urllib, re
def find_users():
users=[]
for i in xrange(1,1537):
url="http://habrahabr.ru/hub/infosecurity/subscribers/rating/page%s/"%i
page=urllib.urlopen(url).read()
users+=re.findall('<a href="/users/[a-zA-Z0-9]+/">',page)
return users
$arr = file('example.txt', FILE_IGNORE_NEW_LINES | FILE_SKIP_EMPTY_LINES);
going отдельно получать список names, можно же передать start сразу ей:going([start])
Поиск уязвимостей у хабросайтов