简介
数据提取器允许您提取文件中包含的稀疏数据并将其组装成内部结构化表。收集的数据可以随时以各种格式导出(CSV、TSV、HTML、自定义)。数据提取器可以在几秒钟内分析成千上万个文件并收集其中的所有原始数据。
它使用简单的说明来说明如何识别数据、如何提取数据以及将该数据放入准备导出的结构化表中的何处。
它可以解析您指定的所有文本文件并分析它们,从文本标签了解需要提取的内容和位置。
数据提取器将混乱的数据转换为有序的数据。
而这一切只需轻轻一按即可。
为什么这是必要的?
- 如果您有很多包含数据的文本文件,并且想要将它们传输到包含字段和记录的结构化数据库。
- 如果您需要提取在各种文本文档中通过不同类型的开始和结束标记或位置识别的数据。
强大
- 数据提取器可以提取需要数周、数月甚至数年手动收集的数据。
- 他会在几秒钟内为您完成,他可以扫描数千个文本,分析,复制必要的数据,将它们放入您使用必要字段创建的表格中。
- 使用各种选项从成千上万的文件中提取数据并以有组织的方式存储它们。
- 提供所有工具,在美观、优雅、仅限 Mac 的本机应用程序中智能地执行这些特定任务。
- 数据可以导出为各种格式,随时可用
易于使用
- 在“源”部分中,您指定需要解析哪个文本文件,或用于导航和解析的文件夹。
- 在“接受文件规则”中,您指定如何接受文件内容进行解析。
- 您在“创建记录规则”中指定何时将新记录插入数据目标
- 您在“提取规则”中指定要提取的内容以及将其放在何处
- 在“DataBase”中,您指定要从中收集数据的表。
- 在“运行”中,您可以运行并查看结果摘要。
特点
- 基于文档,您可以为每个文档使用一组不同的数据源
- 还可以将文档配置为通过定义的提取和分配规则快速批量处理大量数据。
- 可以将客户订单或通过电子邮件收到的任何数据集转换为数据库记录(数据提取器可以直接分析指向您硬盘上邮箱的电子邮件)。
- 如果订单未直接插入数据库,则收集作为服务器输出接收的订单。
- 从文件中逐一提取数据,也可以使用拖放功能拖放它们
- 非常适合处理 Mail.app 收到的电子邮件
- 可以处理文件夹,从内部的所有文件中提取数据,嵌套在任何级别
- 如果第一种格式使用带有标签的可识别模板来识别数据字段,则将以一种格式呈现的数据转换为另一种格式
- 可定制的数据列位置
- 从文件中提取数据,其中数据写入一个文件中,并且记录仅由区分行分隔
- 从文件中提取数据,其中记录由新行分隔,同一行上的字段仅由标签标识
- 使用非唯一的、不明确的标签从文本文档中提取数据,使用特殊标签来告诉数据提取器从哪里实际开始收集数据
- 仅当文件满足某些特征时才解析文件
- 仅在满足某些特征时才提取数据
- 如果数据由多个标签指定,也检索数据(它可以将不同的检索放在同一目标字段中)
- 可以对数据标签使用“区分大小写”选项
- 可以在后台运行
- 始终响应,包括从具有任何嵌套级别的数千个嵌套文件的文件夹中提取时
- 用户可以随时停止该进程
- 内部数据库表,完全可定制,用于收集提取的数据。
- 使用各种选项将数据导出为各种格式(CSV、TSV、HTML、自定义)
- 包括 PDF 用户手册,其中包含 4 个有关如何使用该应用程序的实用课程