Navegue pelos nossos produtos

If so you can download any of the below versions for testing. The product will function as normal except for an evaluation limitation. At the time of purchase we provide a license file via email that will allow the product to work in its full capacity. If you would also like an evaluation license to test without any restrictions for 30 days, please follow the directions provided here.

Faça o download do JAR para extração e análise de texto via Java High Code API

GroupDocs.Parser para Java é uma API de extração de texto de documento fascinante. Ele extrai texto e metadados do Microsoft Word, Excel, PowerPoint, mensagens de e-mail, arquivos de contêiner que contêm outros arquivos como arquivos ZIP, arquivos de texto simples e HTML sem nenhum desses leitores de documentos instalados. A API do extrator de texto realiza operações com precisão e velocidade sem precedentes. A API também fornece ferramentas convenientes para detectar codificação, como UTF32 LE, UTF32 BE, UTF16 LE , UTF16 BE e muito mais


Iniciar

O GroupDocs.Parser para Java não requer a instalação de nenhum software externo ou ferramenta de terceiros. Basta seguir uma das formas descritas em Instalação e configuração.

Você pode facilmente usar a API GroupDocs.Parser para Java diretamente em seu projeto baseado em Maven adicionando as seguintes configurações ao pom.xml.


    groupdocs-artifacts-repository
    Repositório de artefatos do GroupDocs
    https://releases.groupdocs.com/java/repo/


    com.groupdocs
    groupdocs-parser
    22.6


Product Page | Docs | Demos | API Reference | Examples | Blog | Free Support | Temporary License

Por que baixar GroupDocs.Parser para Java?

GroupDocs.Parser for Java é uma API local que permite que seus aplicativos Java analisem e extraiam dados de vários tipos de formatos de arquivo. Ele permite que você extraia hiperlinks, tabelas, códigos de barras, texto, imagens, bem como extração de dados de arquivos ZIP, arquivos de e-mail, portfólios PDF e bancos de dados. GroupDocs.Parser para Java pode ser usado para definir modelos definidos pelo usuário contendo posições de campo fixas, regex e vinculadas para extração de dados precisa.

Extração de texto e análise de recursos da API Java On-Premise

  • Análise de documentos por meio de modelo definido pelo usuário
    • Crie um modelo definido pelo usuário com definições de campo e tabela de dados.
    • Analise documentos via user-defined templates e extraia dados, como faturas, tabelas, etc.
  • Suporta extração de vários elementos de texto, como:
    • Extração de texto simples
    • Extração de texto formatado como texto simples, HTML ou Markdown (MD)
    • Extração de texto estruturado no formulário XML
    • Extração de área de texto conforme coordenadas específicas, estilo de texto
    • Extraia texto em torno (no contexto de) uma palavra específica
  • Suporta vários modos de extração, como:
    • Modo de extração de texto preciso: O modo de extração de texto padrão com a melhor qualidade de texto possível.
    • Modo de extração de texto bruto: O modo de extração com melhor desempenho, mas a qualidade do texto não é tão precisa quanto o modo mencionado.
  • Extraia o texto de todo o documento ou extraia apenas a página do documento desejada.
  • Capacidade de pesquisar documentos usando palavras-chave específicas ou via expressão regular.
  • Suporta extração de metadados e extração de imagens do Microsoft Word®, Excel®, PowerPoint®, PDF® e outros tipos de documentos.
  • Extraia o índice (TOC) dos formatos de eBook do Microsoft Office® Word® e EPUB.
  • Capacidade de extrair dados de contêineres (Arquivos), como ZIP, portfólios PDF, contêineres OST, etc.
  • Capacidade de iterar pelos campos do formulário e extrair dados do formulário PDF.
  • Extract data from databases (por exemplo, Sqlite) via JDBC.
  • Extraia informações de notebooks do Microsoft OneNote®.
  • Extraia todos os hiperlinks de todo o documento ou de uma página específica ou apenas de uma área de página específica.

Formatos de arquivo do analisador de documentos suportados

Microsoft Word®: DOC/DOT/DOCX/DOCM/DOTX/DOTM/RTF/TXT
OpenOffice Writer®: ODT/OTT/ Microsoft Excel®: XLS/XLT/XLSX/XLSM/XLSB/XLTX/XLTM/XLA/XLAM
OpenOffice Calc®: ODS/OTS/CSV
Apple® iWork: NÚMEROS
Microsoft PowerPoint®: PPT/PPS/POT/PPTX/PPTM/POTX/POTM/PPSX/PPSM
OpenOffice Impress®: ODP/OTP
Microsoft Outlook®: PST/OST/EML/MSG
Apple® Mail Message: EMLX
Microsoft OneNote®: UM
Layout fixo: PDF
Pós-escrito: PS
Marcação: XHTML/MHTML/MD/XML
e-book: CHM/EPUB/FB2
Arquivo: ZIP/RAR/TAR/GZ/BZ2
Imagem: BMP/GIF/JPG/JPEG/JPE/JP2/PNG/TIF/TIFF/DJVU/J2K/WEBP
Vetor: SVG/SVGZ
Adobe Photoshop®: PSD
Imagem médica: DICOM
Metadados: EMF/WMF
Banco de dados: JDBC

Para obter detalhes e limitações, visite Supported Document Formats.

Requisitos de sistema

  • Microsoft Windows®: Windows Desktop & Server (x86, x64), Microsoft Azure
  • macOS: Mac OS X
  • Linux: Ubuntu, OpenSUSE, CentOS e outros
  • Versões Java: J2SE 7.0 (1.7), J2SE 8.0 (1.8) ou superior (por exemplo, Java 10)

Product Page | Docs | Demos | API Reference | Examples | Blog | Free Support | Temporary License



Download direto

Groupdocs.parser para java 19.5

Este arquivo zip contém apenas assemblies para groupdocs.parser para java 19.5

Adicionada: 5/29/2019 Transferências:

Download

Tamanho do arquivo: 102.8 MB

Groupdocs.parser para java 22.6

Este arquivo zip contém apenas assemblies para groupdocs.parser para java

Adicionada: 6/7/2022 Transferências:

Download

Tamanho do arquivo: 137.8 MB

Groupdocs.parser para java 22.3

Este arquivo zip contém apenas assemblies para groupdocs.parser para java

Adicionada: 3/18/2022 Transferências:

Download

Tamanho do arquivo: 137.8 MB

Groupdocs.parser para java 21.2

Este arquivo zip contém apenas assemblies para groupdocs.parser para java

Adicionada: 2/27/2021 Transferências:

Download

Tamanho do arquivo: 123.8 MB

Groupdocs.parser para java 20.12

Este arquivo zip contém apenas assemblies para groupdocs.parser para java

Adicionada: 12/30/2020 Transferências:

Download

Tamanho do arquivo: 117.7 MB

Groupdocs.parser para java 20.8

Este arquivo zip contém apenas assemblies para groupdocs.parser para java 20.8

Adicionada: 8/19/2020 Transferências:

Download

Tamanho do arquivo: 118.0 MB

Groupdocs.parser para java 20.6

Este arquivo zip contém apenas assemblies para groupdocs.parser para java 20.6

Adicionada: 6/30/2020 Transferências:

Download

Tamanho do arquivo: 113.4 MB

Groupdocs.parser para java 20.5

Este arquivo zip contém apenas assemblies para groupdocs.parser para java 20.5

Adicionada: 5/14/2020 Transferências:

Download

Tamanho do arquivo: 101.2 MB

Groupdocs.parser para java 20.3

Este arquivo zip contém apenas assemblies para groupdocs.parser para java 20.3

Adicionada: 4/1/2020 Transferências:

Download

Tamanho do arquivo: 101.0 MB

Groupdocs.parser para java 20.1

Este arquivo zip contém apenas assemblies para groupdocs.parser para java 20.1

Adicionada: 2/4/2020 Transferências:

Download

Tamanho do arquivo: 101.0 MB

Groupdocs.parser para java 19.11

Este arquivo zip contém apenas assemblies para groupdocs.parser para java 19.11

Adicionada: 12/3/2019 Transferências:

Download

Tamanho do arquivo: 104.4 MB

Groupdocs.parser para java 18.12

Este arquivo zip contém apenas assemblies para groupdocs.parser para java 18.12

Adicionada: 12/11/2018 Transferências:

Download

Tamanho do arquivo: 97.9 MB

Groupdocs.parser para java 18.11

Este arquivo zip contém apenas assemblies para groupdocs.parser para java 18.11

Adicionada: 11/8/2018 Transferências:

Download

Tamanho do arquivo: 96.9 MB


 Português