Browse our Products

If so you can download any of the below versions for testing. The product will function as normal except for an evaluation limitation. At the time of purchase we provide a license file via email that will allow the product to work in its full capacity. If you would also like an evaluation license to test without any restrictions for 30 days, please follow the directions provided here.

Télécharger JAR pour l'extraction et l'analyse de texte via l'API Java High Code

GroupDocs.Parser pour Java est une fascinante API d'extraction de texte de document. Il extrait du texte et des métadonnées de Microsoft Word, Excel, PowerPoint, des messages électroniques, des fichiers conteneurs contenant d'autres fichiers tels que des archives ZIP, des fichiers texte brut et HTML sans qu'aucun de ces lecteurs de documents ne soit installé. L'API d'extraction de texte effectue des opérations avec une précision et une rapidité sans précédent. L'API fournit également des outils pratiques pour détecter l'encodage tels que UTF32 LE, UTF32 BE, UTF16 LE, UTF16 BE et plus


Commencer

GroupDocs.Parser for Java ne nécessite l'installation d'aucun logiciel externe ou outil tiers. Suivez simplement l'une des méthodes décrites dans Installation et configuration.

Vous pouvez facilement utiliser GroupDocs.Parser pour l'API Java directement dans votre projet basé sur Maven en ajoutant les configurations suivantes au fichier pom.xml.


    groupdocs-artefacts-repository
    Dépôt d'artefacts GroupDocs
    https://releases.groupdocs.com/java/repo/


    com.groupdocs
    groupdocs-parser
    22.6


Product Page | Docs | Demos | API Reference | Examples | Blog | Free Support | Temporary License

Pourquoi télécharger GroupDocs.Parser pour Java ?

GroupDocs.Parser for Java est une API sur site qui permet à vos applications Java d’analyser et d’extraire des données à partir de différents types de formats de fichiers. Il vous permet d’extraire des hyperliens, des tableaux, des codes-barres, du texte, des images, ainsi que l’extraction de données à partir d’archives ZIP, d’archives de courrier électronique, de portefeuilles PDF et de bases de données. GroupDocs.Parser pour Java peut être utilisé pour définir des modèles définis par l’utilisateur contenant des positions de champs fixes, regex et liés pour une extraction précise des données.

Extraction de texte et analyse des fonctionnalités de l’API Java sur site

  • Analyse de documents via un modèle défini par l’utilisateur
    • Créez un modèle défini par l’utilisateur avec des définitions de champ de données et de table.
    • Analyser des documents via user-defined templates et extraire des données, telles que des factures, des tableaux, etc.
  • Prend en charge l’extraction de divers éléments de texte, tels que :
    • Extraction de texte brut
    • Extraction de texte formaté en texte simple, HTML ou Markdown (MD)
    • Extraction de texte structuré sous forme XML
    • Extraction de zone de texte selon des coordonnées spécifiques, style de texte
    • Extraire du texte autour (dans le contexte) d’un mot spécifique
  • Prend en charge divers modes d’extraction, tels que :
    • Mode d’extraction de texte précis : Le mode d’extraction de texte par défaut avec la meilleure qualité de texte possible.
    • Mode d’extraction de texte brut : le mode d’extraction avec de meilleures performances mais la qualité du texte n’est pas aussi précise que le mode susmentionné.
  • Extrayez le texte de tout le document ou extrayez uniquement la page de document souhaitée.
  • Possibilité de rechercher des documents à l’aide de mots-clés spécifiques ou via une expression régulière.
  • Prend en charge l’extraction de métadonnées et l’extraction d’images à partir de Microsoft Word®, Excel®, PowerPoint®, PDF® et d’autres types de documents.
  • Extrayez la table des matières (TOC) des formats Microsoft Office® Word® et EPUB eBook.
  • Possibilité d’extraire des données de conteneurs (Archives), tels que ZIP, portefeuilles PDF, conteneurs OST, etc.
  • Possibilité de parcourir les champs du formulaire et d’extraire les données du formulaire PDF.
  • Extract data from databases (par exemple Sqlite) via JDBC.
  • Extrayez des informations des blocs-notes Microsoft OneNote®.
  • Extrayez tous les hyperliens du document entier ou d’une page spécifique ou d’une zone de page spécifique uniquement.

Formats de fichier d’analyseur de documents pris en charge

Microsoft Word® : DOC/DOT/DOCX/DOCM/DOTX/DOTM/RTF/TXT
OpenOffice Writer® : ODT/OTT/ Microsoft Excel® : XLS/XLT/XLSX/XLSM/XLSB/XLTX/XLTM/XLA/XLAM
OpenOffice Calc® : ODS/OTS/CSV
Apple® iWork : CHIFFRES
Microsoft PowerPoint® : PPT/PPS/POT/PPTX/PPTM/POTX/POTM/PPSX/PPSM
OpenOffice Impress® : ODP/OTP
Microsoft Outlook® : PST/OST/EML/MSG
Message électronique Apple® : EMLX
Microsoft OneNote® : ONE
Mise en page fixe : PDF
Post-scriptum : PS
Marquage : XHTML/MHTML/MD/XML
Livre électronique : CHM/EPUB/FB2
Archive : ZIP/RAR/TAR/GZ/BZ2
Image : BMP/GIF/JPG/JPEG/JPE/JP2/PNG/TIF/TIFF/DJVU/J2K/WEBP
Vecteur : SVG/SVGZ
Adobe Photoshop® : PSD
Imagerie médicale : DICOM
Métadonnées : EMF/WMF
Base de données : JDBC

Pour plus de détails et les limitations, veuillez visiter Supported Document Formats.

Configuration requise

  • Microsoft Windows® : Windows Desktop & Server (x86, x64), Microsoft Azure
  • macOS : Mac OS X
  • Linux : Ubuntu, OpenSUSE, CentOS et autres
  • Versions Java : J2SE 7.0 (1.7), J2SE 8.0 (1.8) ou supérieur (par exemple Java 10)

Product Page | Docs | Demos | API Reference | Examples | Blog | Free Support | Temporary License



Direct Download

GroupDocs.Parser pour Java 19.5

Ce fichier zip ne contient que des assemblées pour groupDocs.parser pour Java 19.5

Added: 5/29/2019 Downloads:

Download

Taille du fichier: 102.8 MB

GroupDocs.Parser pour Java 22.6

Ce fichier zip ne contient que des assemblées pour groupDocs.parser pour Java

Added: 6/7/2022 Downloads:

Download

Taille du fichier: 137.8 MB

GroupDocs.Parser pour Java 22.3

Ce fichier zip ne contient que des assemblées pour groupDocs.parser pour Java

Added: 3/18/2022 Downloads:

Download

Taille du fichier: 137.8 MB

GroupDocs.Parser pour Java 21.2

Ce fichier zip ne contient que des assemblées pour groupDocs.parser pour Java

Added: 2/27/2021 Downloads:

Download

Taille du fichier: 123.8 MB

GroupDocs.Parser pour Java 20.12

Ce fichier zip ne contient que des assemblées pour groupDocs.parser pour Java

Added: 12/30/2020 Downloads:

Download

Taille du fichier: 117.7 MB

GroupDocs.Parser pour Java 20.8

Ce fichier zip ne contient que des assemblées pour groupDocs.parser pour Java 20.8

Added: 8/19/2020 Downloads:

Download

Taille du fichier: 118.0 MB

GroupDocs.Parser pour Java 20.6

Ce fichier zip ne contient que des assemblées pour groupDocs.parser pour Java 20.6

Added: 6/30/2020 Downloads:

Download

Taille du fichier: 113.4 MB

GroupDocs.Parser pour Java 20.5

Ce fichier zip ne contient que des assemblées pour groupDocs.parser pour Java 20.5

Added: 5/14/2020 Downloads:

Download

Taille du fichier: 101.2 MB

GroupDocs.Parser pour Java 20.3

Ce fichier zip ne contient que des assemblées pour groupDocs.parser pour Java 20.3

Added: 4/1/2020 Downloads:

Download

Taille du fichier: 101.0 MB

GroupDocs.Parser pour Java 20.1

Ce fichier zip ne contient que des assemblées pour groupDocs.parser pour Java 20.1

Added: 2/4/2020 Downloads:

Download

Taille du fichier: 101.0 MB

GroupDocs.Parser pour Java 19.11

Ce fichier zip ne contient que des assemblées pour groupDocs.parser pour Java 19.11

Added: 12/3/2019 Downloads:

Download

Taille du fichier: 104.4 MB

GroupDocs.Parser pour Java 18.12

Ce fichier zip ne contient que des assemblées pour groupDocs.parser pour Java 18.12

Added: 12/11/2018 Downloads:

Download

Taille du fichier: 97.9 MB

GroupDocs.Parser pour Java 18.11

Ce fichier zip ne contient que des assemblées pour groupDocs.parser pour Java 18.11

Added: 11/8/2018 Downloads:

Download

Taille du fichier: 96.9 MB


 Français