Смешно. Но все таки — robots.txt — де-факто стандарт в интернете, и про него все знают. И формат файла так же стандартен. (Это не злой Яндекс его выдумал и принуждает делать неочевидные вещи, чтоб защититься от него). И все «вежливые» роботы этот файл уважают. В том числе и Яндексовский поисковик.
зачем картинки метрики распознавать?
идем на https://metrika.yandex.ru/dashboard?group=dekaminute&period=2016-10-21%3A2016-10-21&id=_счетчик_ и парсим результаты. через API, думаю, еще проще
Эта страница доступна только у тех сайтов, которые в настройках информера выбрали «Расширенный» тип. Таких сайтов еще меньше, чем тех, у которых открыта хотя бы картинка.
Как узнать посещаемость 3.8 млн. сайтов