Explore nuestros productos

If so you can download any of the below versions for testing. The product will function as normal except for an evaluation limitation. At the time of purchase we provide a license file via email that will allow the product to work in its full capacity. If you would also like an evaluation license to test without any restrictions for 30 days, please follow the directions provided here.

Descargue JAR para extracción y análisis de texto a través de la API Java High Code

GroupDocs.Parser para Java es una fascinante API de extracción de texto de documentos. Extrae texto y metadatos de Microsoft Word, Excel, PowerPoint, mensajes de correo electrónico, archivos contenedores que contienen otros archivos como archivos ZIP, archivos de texto sin formato y HTML sin tener instalado ninguno de estos lectores de documentos. La API de extractor de texto realiza operaciones con una precisión y velocidad sin precedentes. API también proporciona herramientas convenientes para detectar codificación como UTF32 LE, UTF32 BE, UTF16 LE, UTF16 BE y más


Empezar

GroupDocs.Parser para Java no requiere la instalación de ningún software externo o herramienta de terceros. Simplemente siga una de las formas descritas en Instalacion y configuracion.

Puede usar fácilmente GroupDocs.Parser para la API de Java directamente en su proyecto basado en Maven agregando las siguientes configuraciones a pom.xml.


    groupdocs-artefactos-repositorio
    Repositorio de artefactos de GroupDocs
    https://releases.groupdocs.com/java/repo/


    com.groupdocs
    groupdocs-parser
    22.6


{{HIPERVINCULO1}} | {{HIPERVINCULO2}} | {{HIPERVINCULO3}} | {{HIPERVINCULO4}} | {{HIPERVINCULO5}} | {{HIPERVINCULO6}} | {{HIPERVINCULO7}} | {{HIPERVINCULO8}}

¿Por qué descargar GroupDocs.Parser para Java?

GroupDocs.Parser for Java es una API local que permite que sus aplicaciones Java analicen y extraigan datos de varios tipos de formatos de archivo. Le permite extraer hipervínculos, tablas, códigos de barras, texto, imágenes, así como la extracción de datos de archivos ZIP, archivos de correo electrónico, carteras PDF y bases de datos. GroupDocs.Parser para Java se puede utilizar para definir plantillas definidas por el usuario que contienen posiciones de campo fijas, expresiones regulares y vinculadas para una extracción de datos precisa.

Extracción y análisis de texto Características de la API local de Java

  • Análisis de documentos a través de una plantilla definida por el usuario
    • Cree una plantilla definida por el usuario con campos de datos y definiciones de tablas.
    • Analice documentos a través de user-defined templates y extraiga datos, como facturas, tablas, etc.
  • Admite la extracción de varios elementos de texto, como:
    • Extracción de texto sin formato
    • Extracción de texto formateado como texto simple, HTML o Markdown (MD)
    • Extracción de texto estructurado en formato XML
    • Extracción de área de texto según coordenadas específicas, estilo de texto
    • Extraer texto alrededor (en el contexto de) una palabra específica
  • Soporta varios modos de extracción, tales como:
    • Modo de extracción de texto preciso: el modo de extracción de texto predeterminado con la mejor calidad de texto posible.
    • Modo de extracción de texto sin procesar: el modo de extracción con mejor rendimiento pero la calidad del texto no es tan precisa como el modo mencionado anteriormente.
  • Extraiga el texto de todo el documento o extraiga solo la página del documento deseado.
  • Capacidad para buscar documentos usando palabras clave específicas o mediante expresiones regulares.
  • Admite la extracción de metadatos y la extracción de imágenes de Microsoft Word®, Excel®, PowerPoint®, PDF® y otros tipos de documentos.
  • Extraiga la tabla de contenido (TOC) de los formatos de libro electrónico de Microsoft Office® Word® y EPUB.
  • Capacidad para extraer datos de contenedores (Archivos), como ZIP, carteras PDF, contenedores OST, etc.
  • Capacidad para iterar a través de los campos del formulario y extraer datos del formulario PDF.
  • Extract data from databases (por ejemplo, Sqlite) a través de JDBC.
  • Extraer información de los cuadernos de Microsoft OneNote®.
  • Extraiga todos los hipervínculos de todo el documento o de una página específica o solo de un área de página específica.

Formatos de archivo del analizador de documentos admitidos

Microsoft Word®: DOC/DOT/DOCX/DOCM/DOTX/DOTM/RTF/TXT
OpenOffice Writer®: ODT/OTT/ Microsoft Excel®: XLS/XLT/XLSX/XLSM/XLSB/XLTX/XLTM/XLA/XLAM
OpenOffice Calc®: ODS/OTS/CSV
Apple® iWork: NÚMEROS
Microsoft PowerPoint®: PPT/PPS/POT/PPTX/PPTM/POTX/POTM/PPSX/PPSM
OpenOffice Impress®: ODP/OTP
Microsoft Outlook®: PST/OST/EML/MSG
Mensaje de correo de Apple®: EMLX
Microsoft OneNote®: UNO
Diseño fijo: PDF
Posdata: PD
Marcado: XHTML/MHTML/MD/XML
Libro electrónico: CHM/EPUB/FB2
Archivo: ZIP/RAR/TAR/GZ/BZ2
Imagen: BMP/GIF/JPG/JPEG/JPE/JP2/PNG/TIF/TIFF/DJVU/J2K/WEBP
Vector: SVG/SVGZ
Adobe Photoshop®: PSD
Imágenes médicas: DICOM
Metadatos: EMF/WMF
Base de datos: JDBC

Para obtener detalles y limitaciones, visite Supported Document Formats.

Requisitos del sistema

  • Microsoft Windows®: Escritorio y servidor de Windows (x86, x64), Microsoft Azure
  • macOS: Mac OS X
  • Linux: Ubuntu, OpenSUSE, CentOS y otros
  • Versiones de Java: J2SE 7.0 (1.7), J2SE 8.0 (1.8) o superior (por ejemplo, Java 10)

{{HIPERVINCULO1}} | {{HIPERVINCULO2}} | {{HIPERVINCULO3}} | {{HIPERVINCULO4}} | {{HIPERVINCULO5}} | {{HIPERVINCULO6}} | {{HIPERVINCULO7}} | {{HIPERVINCULO8}}



Descarga directa

Groupdocs.parser para Java 19.5

Este archivo zip contiene solo ensamblajes para gruposdocs.parser para Java 19.5

Adicional: 5/29/2019 Descargas:

Descargar

Tamaño del archivo: 102.8 MB

Groupdocs.parser para Java 22.6

Este archivo zip contiene solo ensamblajes para gruposdocs.parser para java

Adicional: 6/7/2022 Descargas:

Descargar

Tamaño del archivo: 137.8 MB

Groupdocs.parser para Java 22.3

Este archivo zip contiene solo ensamblajes para gruposdocs.parser para java

Adicional: 3/18/2022 Descargas:

Descargar

Tamaño del archivo: 137.8 MB

Groupdocs.parser para Java 21.2

Este archivo zip contiene solo ensamblajes para gruposdocs.parser para java

Adicional: 2/27/2021 Descargas:

Descargar

Tamaño del archivo: 123.8 MB

Groupdocs.parser para Java 20.12

Este archivo zip contiene solo ensamblajes para gruposdocs.parser para java

Adicional: 12/30/2020 Descargas:

Descargar

Tamaño del archivo: 117.7 MB

Groupdocs.parser para Java 20.8

Este archivo zip contiene solo ensamblajes para gruposdocs.parser para Java 20.8

Adicional: 8/19/2020 Descargas:

Descargar

Tamaño del archivo: 118.0 MB

Groupdocs.parser para Java 20.6

Este archivo zip contiene solo ensamblajes para gruposdocs.parser para Java 20.6

Adicional: 6/30/2020 Descargas:

Descargar

Tamaño del archivo: 113.4 MB

Groupdocs.parser para Java 20.5

Este archivo zip contiene solo ensamblajes para gruposdocs.parser para Java 20.5

Adicional: 5/14/2020 Descargas:

Descargar

Tamaño del archivo: 101.2 MB

Groupdocs.parser para Java 20.3

Este archivo zip contiene solo ensamblajes para gruposdocs.parser para Java 20.3

Adicional: 4/1/2020 Descargas:

Descargar

Tamaño del archivo: 101.0 MB

Groupdocs.parser para Java 20.1

Este archivo zip contiene solo ensamblajes para gruposdocs.parser para Java 20.1

Adicional: 2/4/2020 Descargas:

Descargar

Tamaño del archivo: 101.0 MB

Groupdocs.parser para Java 19.11

Este archivo zip contiene solo ensamblajes para gruposdocs.parser para Java 19.11

Adicional: 12/3/2019 Descargas:

Descargar

Tamaño del archivo: 104.4 MB

Groupdocs.parser para Java 18.12

Este archivo zip contiene solo ensamblajes para gruposdocs.parser para Java 18.12

Adicional: 12/11/2018 Descargas:

Descargar

Tamaño del archivo: 97.9 MB

Groupdocs.parser para Java 18.11

Este archivo zip contiene solo ensamblajes para gruposdocs.parser para Java 18.11

Adicional: 11/8/2018 Descargas:

Descargar

Tamaño del archivo: 96.9 MB


 Español