Comments 31
UFO just landed and posted this here
Зачем это здесь? Никакой полезной нагрузки данная статья не несёт.
Автор, мы очень рады, что вы решили примкнуть к стройному ряду .net разработчкиков, но, поверьте, этот опус не нужен.
Автор, мы очень рады, что вы решили примкнуть к стройному ряду .net разработчкиков, но, поверьте, этот опус не нужен.
Цель данной статьи была в том, чтобы начинающие разработчики тратили меньше времени для поиска подобной информации, ибо я при написании такого простейшего парсера столкнулся с некоторыми проблемами. Но я Вас понял, что нужно побольше опыта, дабы писать статьи на Хабр.
А почему нельзя было теми же средствами, скачать файл через код? Зачем еще браузер подключать?
Кодом будет работать гораздо быстрее.
Кодом будет работать гораздо быстрее.
Пытался, потратил пару часов, но в итоге все равно пришел к этому варианту. Буду благодарен, если напишите ссылки, где об этом написано.
Можно посмотреть здесь http://codereview.stackexchange.com/a/18679
Это вредные советы, не надо таких советов новичкам давать. Если у вас проблемы с UserAgent, то браузер не обязательно запускать. Вот, например, одно из решений.
Дело не только в опыте. Не поймите меня привратно, но так лучше не писать. Мне кажется, что все когда-то начинали с такого кода и это прекрасно, что вы не боитесь пробовать. Но выставлять что-то подобное как «введение в C#» мне кажется неправильным.
При всем моем уважении к автору, было бы неплохо, если бы пособия для новичков писали не новички, а более опытные участники сообщества.
Потому что из данного моструозного решения непросто выделить какие-то полезные практики, равно как и невозможно научиться чему-либо полезному.
Потому что из данного моструозного решения непросто выделить какие-то полезные практики, равно как и невозможно научиться чему-либо полезному.
Я то думал, здесь будет ПАРСЕР, а тут… (
UFO just landed and posted this here
Плохо искал. Спасибо.
Вот и я как-то надеялся наконец-то познать немного теоретической составляющей анализа текстов. Но когда увидел запуск браузера из кода мягко говоря прибалдел :)
Откройте для себя Selenium.
Т.к. до недавнего времени я знал только 1С и немного командную строку, то недолго думая я решил написать его в командной строке
можно было подумать подольше, и вот что могло бы/должно получиться:
for i in $(seq 790 795); do wget "http://aimp.ru/index.php?do=download&sub=catalog&id=$i"; done
ах, ну да, Windows же!
FOR /L %i IN (790,1,795) DO wget "http://aimp.ru/index.php?do=download&sub=catalog&id=%i"
есть инструменты, которые уже давно придуманы для таких вещей
З.Ы. если бы Вы реально сделали парсер, я бы понял — мол, в образовательных целях… но таак извратиться!..
Именно такое у меня и получалось, но он не ожидал между запусками, в итоге практически одновременно открывалась куча вкладок в браузере, что в итоге могло привести к переполнению оперативной памяти. Но да, если немного подумать можно было бы доработать чтоб этого не возникало.
Причём тут браузер?
Вы невнимательно читаете. Срочно гуглить
Вы невнимательно читаете. Срочно гуглить
wget
А, прошу прощения, не заметил, да, я гуглил по поводу wget, но не хотелось ставить сторонние утилиты. Да и развиваться же нужно в плане C#.
А для парсинга HTML есть HtmlAgilityPack.
Дорогой автор, не расстраивайтесь по поводу отрицательных оценок вашей работы, просто она действительно реализована не совсем лучшим или рекомендуемым образом. Вам есть ещё куда расти, и я надеюсь, что теперь вы примерно видите направления для дальнейшего развития навыков. Не опускайте рук!
Sign up to leave a comment.
Пишем простой парсер файлов (для начинающих)