Парсер web-страниц
Wiser - парсер HTML страниц.
Получает на входе набор HTML страниц и схему парсинга, возвращает структуру данных, заданную схемой парсинга и заполненную данными из исходных страниц-источников.
Схемы сохраняются в браузере или на сервере.
Расширение включает редактор схем парсинга и сам парсер.
Это готовое решение, позволяющее вам создавать схемы парсинга и получать результат прямо в браузере. Более того, вы можете хранить схемы на сервере и пользоваться серверым парсингом с некоторыми ограничениями.
Схемы парсинга поддерживают XPath и CSS селекторы, атрибуты элементов, текст элемента и текст всех потомков, html-содержимое, регулярные выражения и т.д.
Latest reviews
- (2023-03-10) Anton Puzorjov: Simply does not work at all.
- (2017-11-24) Иван: Рабочее приложение. Удобное. Использовал для выдергивания ссылок с сайта на jooml'е. Пример: "result": { "rtype": 3, "src": [ "//*[@id='ja-content-main']/div/p/span/a" ], "sett": 0, "fld": "@url" } Не хватает примеров разве что, но в целом все круто-спасибо!