Pull to refresh

Плагин для извлечения данных с сайтов

Website development *
Коллеги-разработчики выпустили плагин, который умеет извлекать и анализировать плохо структурированную информацию. Проект ориентирован на самый широкий круг пользователей, в частности будет полезен владельцам интернет-магазинов и их клиентам. Что это и как работает — на видео:



Сервис называется Convextra. Работает он следующим образом: при запуске плагина вызывается программный код, который анализирует информацию на странице и осуществляет переход по страницам сайта. Для перехода плагин использует специальный поиск по кнопкам для навигации на сайте или пользователь может самостоятельно указать на данную кнопку. В течении нескольких секунд плагин собирает всю информацию, которая находится на странице в собственную таблицу. Далее из таблицы пользователь можете вывести данные в файл формата CSV, указав какие данные необходимо отображать. Повседневное применение осуществляется самым тривиальным способом: пользователь перетаскивает кнопку плагина на панель закладок и вызывает его на странице магазина. В течении нескольких секунд данные автоматически будут представлены в таблицу, ему остаётся только сохранить их в файл.

Плагин пока работает не безупречно, разработка находится где-то между альфа и бета-стадиями. Так что если на каком-то сайте он не запустился, то просьба не кидать тухлыми помидорами: цель поста — не реклама, а фидбек от потенциальных пользователей. В первую очередь плагин был разработан для владельцев интернет-магазинов. Анализ данных на рынке — очень важная и одна из труднейших работ для магазина, плагин помогает все данные собрать в таблицу, откуда проводить анализ будет проще. Также разработка будет полезна людям, которые хотят выбрать товар или магазин, где его можно будет купить, сэкономив при этом часть бюджета. Поэтому будем благодарны за отзывы и пожелания — какие функции необходимы, каким образом вы бы эту штуку применяли.
Tags:
Hubs:
Total votes 77: ↑69 and ↓8 +61
Views 28K
Comments Comments 48