从网页中提取数据到你定义的JSON结构中
# 功能
- "网页数据结构化" 是一个浏览器插件,它可以根据用户定义的结构,从网页中提取数据,将其转换成指定的JSON格式。
- JSON格式可以直接用于数据分析、数据可视化等工作。
- 用户不需要了解 CSS 选择器、XPath 等以前网页抓取所需要的技术,只需要描述需要提取的数据的结构即可。
- 如果配置了后端服务,它可以将提取的结果发送给该服务。
- 插件同时提供了 JSON 转 Excel 功能,特别对于 JSON 中的嵌套数组、对象等结构,可以生成多重表头的 Excel 文件。
- 通过大模型完成实际的信息提取,支持兼容 OpenAI 接口的多种大模型,如 DeepSeek、通义千问等。
- 对于不兼容 OpenAI 接口的模型,可以通过大模型网关进行调用。
# 优势
- 易于使用,用户无需分析网页结构,只需要描述想要数据结构即可。
- 产生的 JSON 数据格式完全由用户定义,可以随时根据自己的需求进行调整。
- 每网页的数据提取结构会单独存储,自动调用。
- 可以以 JSON 、表格方式预览提取的数据。