简介
WebScraper 使用 Integrity 引擎快速抓取网站,并可以以 CSV 或 JSON 格式输出(当前)抓取的数据。另外将图像上传到文件夹。
从网站收集数据或存档内容。
机会
• 快速、轻松的现场扫描和筛选
• 可以通过ProxyCrawl 服务对每个请求使用不同的IP 地址、用户代理等
• 在桌面上运行的本机 macOS 应用程序
• 多种检索数据的方式;各种元数据、内容(如文本、html 或 markdown)、具有特定类/标识符的元素、正则表达式
• 易于导出数据 - 选择您需要的列
• csv或json格式的数据输出
• 能够将所有图像下载到文件夹中/收集并导出所有链接
• 能够输出一个文本文件(设计用于归档文本内容、Markdown 或纯文本)
• 轻松设置从网站提取电子邮件地址
• 很多选项/设置