浏览我们的产品

If so you can download any of the below versions for testing. The product will function as normal except for an evaluation limitation. At the time of purchase we provide a license file via email that will allow the product to work in its full capacity. If you would also like an evaluation license to test without any restrictions for 30 days, please follow the directions provided here.

通过 Java High Code API 下载用于文本提取和解析的 JAR

GroupDocs.Parser for Java 是一个引人入胜的文档文本提取 API。它从 Microsoft Word、Excel、PowerPoint、电子邮件信息、包含其他文件(如 ZIP 档案、纯文本文件和 HTML)的容器文件中提取文本和元数据,而无需安装任何这些文档阅读器。文本提取器 API 以前所未有的准确性和速度执行操作。 API 还提供了方便的工具来检测编码,例如 UTF32 LE、UTF32 BE、UTF16 LE、UTF16 BE 等


开始使用

GroupDocs.Parser for Java 不需要安装任何外部软件或第三方工具。只需按照中描述的方式之一 安装和配置.

通过将以下配置添加到 pom.xml,您可以直接在基于 Maven 的项目中轻松地使用 GroupDocs.Parser for Java API。

<存储库>
    groupdocs-artifacts-repository
    GroupDocs 工件存储库
    https://releases.groupdocs.com/java/repo/

<依赖>
    com.groupdocs
    groupdocs-parser
    <版本>22.6


Product Page | Docs | Demos | API Reference | Examples | Blog | Free Support | Temporary License

为什么要下载 GroupDocs.Parser for Java?

GroupDocs.Parser for Java 是本地 API,使您的 Java 应用程序能够从各种类型的文件格式中解析和提取数据。它允许您从 ZIP 档案、电子邮件档案、PDF 组合和数据库中提取超链接、表格、条形码、文本、图像以及数据提取。 GroupDocs.Parser for Java 可用于定义包含固定、正则表达式和链接字段位置的用户定义模板,以便准确提取数据。

文本提取和解析 Java On-Premise API 功能

  • 通过用户定义的模板进行文档解析
    • 使用数据字段和表格定义创建用户定义的模板。
    • 通过 user-defined templates 解析文档并提取数据,例如发票、表格等。
  • 支持提取各种文本元素,例如:
    • 纯文本提取
    • 格式化文本提取为简单文本、HTML 或 Markdown (MD)
    • XML形式的结构化文本提取
    • 根据特定坐标、文本样式提取文本区域
    • 在特定单词周围(在上下文中)提取文本
  • 支持多种提取模式,例如:
    • 准确的文本提取模式:具有最佳文本质量的默认文本提取模式。
    • 原始文本提取模式:性能更好但文本质量不如上述模式准确的提取模式。
  • 提取整个文档的文本或仅提取所需的文档页面。
  • 能够使用特定关键字或通过正则表达式搜索文档。
  • 支持从 Microsoft Word®、Excel®、PowerPoint®、PDF® 和其他文档类型中提取元数据和图像。
  • 从 Microsoft Office® Word® 和 EPUB 电子书格式中提取目录 (TOC)。
  • 能够从容器(档案)中提取数据,例如 ZIP、PDF 组合、OST 容器等。
  • 能够遍历表单字段并提取 PDF 表单数据。
  • Extract data from databases(例如 Sqlite)通过 JDBC。
  • 从 Microsoft OneNote® 笔记本中提取信息。
  • 从整个文档或特定页面或仅从特定页面区域提取所有超链接。

支持的文档解析器文件格式

Microsoft Word®: DOC/DOT/DOCX/DOCM/DOTX/DOTM/RTF/TXT
OpenOffice Writer®: ODT/OTT/ Microsoft Excel®: XLS/XLT/XLSX/XLSM/XLSB/XLTX/XLTM/XLA/XLAM
OpenOffice Calc®: ODS/OTS/CSV
Apple® iWork: NUMBERS
Microsoft PowerPoint®: PPT/PPS/POT/PPTX/PPTM/POTX/POTM/PPSX/PPSM
OpenOffice Impress®: ODP/OTP
Microsoft Outlook®: PST/OST/EML/MSG
Apple® 邮件消息: EMLX
Microsoft OneNote®: 一个
固定布局: PDF
后记: PS
标记: XHTML/MHTML/MD/XML
电子书: CHM/EPUB/FB2
存档: ZIP/RAR/TAR/GZ/BZ2
图片: BMP/GIF/JPG/JPEG/JPE/JP2/PNG/TIF/TIFF/DJVU/J2K/WEBP
矢量: SVG/SVGZ
Adobe Photoshop®: PSD
医学影像: DICOM
元数据: EMF/WMF
数据库: JDBC

有关详细信息和限制,请访问 Supported Document Formats

### 系统要求

  • Microsoft Windows®: Windows 桌面和服务器(x86、x64)、Microsoft Azure
  • macOS: Mac OS X
  • Linux: Ubuntu、OpenSUSE、CentOS 等
  • Java 版本: J2SE 7.0 (1.7)J2SE 8.0 (1.8) 或更高版本(例如 Java 10)

Product Page | Docs | Demos | API Reference | Examples | Blog | Free Support | Temporary License



直接下载

Java 19.5的groupdocs.parser

该zip文件仅包含groupDocs.parser Java 19.5的汇编。

添加: 5/29/2019 下载:

下载

文件大小: 102.8 MB

groupdocs.parser for Java 22.6

该zip文件仅包含groupDocs.parser的java的汇编

添加: 6/7/2022 下载:

下载

文件大小: 137.8 MB

Java 22.3的GroupDocs.Parser

该zip文件仅包含groupDocs.parser的java的汇编

添加: 3/18/2022 下载:

下载

文件大小: 137.8 MB

Java 21.2的GroupDocs.Parser

该zip文件仅包含groupDocs.parser的java的汇编

添加: 2/27/2021 下载:

下载

文件大小: 123.8 MB

Java 20.12的groupdocs.parser

该zip文件仅包含groupDocs.parser的java的汇编

添加: 12/30/2020 下载:

下载

文件大小: 117.7 MB

Java 20.8的GroupDocs.Parser

该zip文件仅包含groupDocs.parser的java 20.8的汇编。

添加: 8/19/2020 下载:

下载

文件大小: 118.0 MB

groupdocs.parser for Java 20.6

该zip文件仅包含groupDocs.parser的java 20.6的汇编。

添加: 6/30/2020 下载:

下载

文件大小: 113.4 MB

Java 20.5的GroupDocs.Parser

该zip文件仅包含groupDocs.parser的java 20.5的汇编。

添加: 5/14/2020 下载:

下载

文件大小: 101.2 MB

Java 20.3的GroupDocs.Parser

该zip文件仅包含groupDocs.parser的java 20.3的汇编。

添加: 4/1/2020 下载:

下载

文件大小: 101.0 MB

Java 20.1的GroupDocs.Parser

该zip文件仅包含groupDocs.parser的java 20.1的汇编。

添加: 2/4/2020 下载:

下载

文件大小: 101.0 MB

Java 19.11的groupdocs.parser

该zip文件仅包含groupDocs.parser的java 19.11的汇编。

添加: 12/3/2019 下载:

下载

文件大小: 104.4 MB

groupdocs.parser for Java 18.12

该zip文件仅包含groupDocs.parser Java 18.12的组件

添加: 12/11/2018 下载:

下载

文件大小: 97.9 MB

GroupDocs.Parser Java 18.11

该zip文件仅包含groupDocs.parser Java 18.11的汇编。

添加: 11/8/2018 下载:

下载

文件大小: 96.9 MB


 简体中文