Περιηγηθείτε στα Προϊόντα μας

If so you can download any of the below versions for testing. The product will function as normal except for an evaluation limitation. At the time of purchase we provide a license file via email that will allow the product to work in its full capacity. If you would also like an evaluation license to test without any restrictions for 30 days, please follow the directions provided here.

Κατεβάστε το JAR για εξαγωγή και ανάλυση κειμένου μέσω Java High Code API

Το GroupDocs.Parser για Java είναι ένα συναρπαστικό API εξαγωγής κειμένου εγγράφων. Εξάγει κείμενο και μεταδεδομένα από Microsoft Word, Excel, PowerPoint, μηνύματα email, αρχεία κοντέινερ που περιέχουν άλλα αρχεία όπως αρχεία ZIP, αρχεία απλού κειμένου και HTML χωρίς να έχει εγκατασταθεί κανένα από αυτά τα προγράμματα ανάγνωσης εγγράφων. Το API εξαγωγής κειμένου εκτελεί λειτουργίες με πρωτοφανή ακρίβεια και ταχύτητα. Το API παρέχει επίσης βολικά εργαλεία για την ανίχνευση κωδικοποίησης όπως UTF32 LE, UTF32 BE, UTF16 LE, UTF16 BE και άλλα


Ξεκίνα

Το GroupDocs.Parser για Java δεν απαιτεί την εγκατάσταση εξωτερικού λογισμικού ή εργαλείου τρίτου μέρους. Απλώς ακολουθήστε έναν από τους τρόπους που περιγράφονται στο Εγκατάσταση και Διαμόρφωση.

Μπορείτε εύκολα να χρησιμοποιήσετε το GroupDocs.Parser για Java API απευθείας στο έργο σας που βασίζεται στο Maven, προσθέτοντας τις ακόλουθες διαμορφώσεις στο pom.xml.

<αποθήκη>
    groupdocs-artifacts-repository
    GroupDocs Artifacts Repository
    https://releases.groupdocs.com/java/repo/

<εξάρτηση>
    com.groupdocs
    groupdocs-parser
    22.6


Product Page | Docs | Demos | API Reference | Examples | Blog | Free Support | Temporary License

Γιατί να κάνετε λήψη του GroupDocs.Parser για Java;

Το GroupDocs.Parser for Java είναι API εσωτερικής εγκατάστασης που επιτρέπει στις εφαρμογές σας Java να αναλύουν και να εξάγουν δεδομένα από διάφορους τύπους μορφών αρχείων. Σας επιτρέπει να εξαγάγετε υπερσυνδέσμους, πίνακες, γραμμωτούς κώδικες, κείμενο, εικόνες, καθώς και εξαγωγή δεδομένων από αρχεία ZIP, αρχεία email, χαρτοφυλάκια PDF και βάσεις δεδομένων. Το GroupDocs.Parser για Java μπορεί να χρησιμοποιηθεί για τον καθορισμό προτύπων που ορίζονται από το χρήστη που περιέχουν σταθερές, regex και συνδεδεμένες θέσεις πεδίων για ακριβή εξαγωγή δεδομένων.

Εξαγωγή κειμένου και ανάλυση Java On-Premise Δυνατότητες API

  • Ανάλυση εγγράφων μέσω προτύπου που ορίζει ο χρήστης
    • Δημιουργήστε ένα πρότυπο που ορίζεται από το χρήστη με ορισμούς πεδίων δεδομένων και πινάκων.
    • Ανάλυση εγγράφων μέσω user-defined templates και εξαγωγή δεδομένων, όπως τιμολόγια, πίνακες κ.λπ.
  • Υποστηρίζει εξαγωγή διαφόρων στοιχείων κειμένου, όπως:
    • Εξαγωγή απλού κειμένου
    • Μορφοποιημένη εξαγωγή κειμένου ως απλό κείμενο, HTML ή Markdown (MD)
    • Δομημένη εξαγωγή κειμένου σε μορφή XML
    • Εξαγωγή περιοχής κειμένου σύμφωνα με συγκεκριμένες συντεταγμένες, στυλ κειμένου
    • Εξαγωγή κειμένου γύρω από (στο πλαίσιο) μιας συγκεκριμένης λέξης
  • Υποστηρίζει διάφορους τρόπους εξαγωγής, όπως:
    • Ακριβής λειτουργία εξαγωγής κειμένου: Η προεπιλεγμένη λειτουργία εξαγωγής κειμένου με την καλύτερη δυνατή ποιότητα κειμένου.
    • Λειτουργία εξαγωγής ακατέργαστου κειμένου: Η λειτουργία εξαγωγής με καλύτερη απόδοση αλλά η ποιότητα του κειμένου δεν είναι τόσο ακριβής όσο η προαναφερθείσα λειτουργία.
  • Εξαγωγή του κειμένου ολόκληρου του εγγράφου ή εξαγωγή μόνο της επιθυμητής σελίδας εγγράφου.
  • Δυνατότητα αναζήτησης εγγράφων χρησιμοποιώντας συγκεκριμένες λέξεις-κλειδιά ή μέσω κανονικής έκφρασης.
  • Υποστηρίζει εξαγωγή μεταδεδομένων και εξαγωγή εικόνας από Microsoft Word®, Excel®, PowerPoint®, PDF® και άλλους τύπους εγγράφων.
  • Εξαγωγή πίνακα περιεχομένων (TOC) από μορφές eBook Microsoft Office® Word® & EPUB.
  • Δυνατότητα εξαγωγής δεδομένων από κοντέινερ (Αρχεία), όπως, ZIP, χαρτοφυλάκια PDF, κοντέινερ OST κ.λπ.
  • Δυνατότητα επανάληψης μέσω των πεδίων φόρμας και εξαγωγής δεδομένων Φόρμας PDF.
  • Extract data from databases (π.χ. Sqlite) μέσω JDBC.
  • Εξαγωγή πληροφοριών από σημειωματάρια Microsoft OneNote®.
  • Εξαγωγή όλων των υπερσυνδέσμων από ολόκληρο το έγγραφο ή από συγκεκριμένη σελίδα ή μόνο από μια συγκεκριμένη περιοχή σελίδας.

Υποστηριζόμενες μορφές αρχείων ανάλυσης εγγράφων

Microsoft Word®: DOC/DOT/DOCX/DOCM/DOTX/DOTM/RTF/TXT
OpenOffice Writer®: ODT/OTT/ Microsoft Excel®: XLS/XLT/XLSX/XLSM/XLSB/XLTX/XLTM/XLA/XLAM
OpenOffice Calc®: ODS/OTS/CSV
Apple® iWork: NUMBERS
Microsoft PowerPoint®: PPT/PPS/POT/PPTX/PPTM/POTX/POTM/PPSX/PPSM
OpenOffice Impress®: ODP/OTP
Microsoft Outlook®: PST/OST/EML/MSG
Μήνυμα Apple® Mail: EMLX
Microsoft OneNote®: ONE
Σταθερή διάταξη: PDF
Υστερόγραφο: ΥΓ
Σήμανση: XHTML/MHTML/MD/XML
eBook: CHM/EPUB/FB2
Αρχείο: ZIP/RAR/TAR/GZ/BZ2
Εικόνα: BMP/GIF/JPG/JPEG/JPE/JP2/PNG/TIF/TIFF/DJVU/J2K/WEBP
Διάνυσμα: SVG/SVGZ
Adobe Photoshop®: PSD
Ιατρική απεικόνιση: DICOM
Μεταδεδομένα: EMF/WMF
Βάση δεδομένων: JDBC

Για λεπτομέρειες και περιορισμούς, επισκεφτείτε τη διεύθυνση Supported Document Formats.

Απαιτήσεις συστήματος

  • Microsoft Windows®: Windows Desktop & Server (x86, x64), Microsoft Azure
  • macOS: Mac OS X
  • Linux: Ubuntu, OpenSUSE, CentOS και άλλα
  • Εκδόσεις Java: “J2SE 7.0 (1.7)”, “J2SE 8.0 (1.8)” ή νεότερη έκδοση (για παράδειγμα Java 10)

Product Page | Docs | Demos | API Reference | Examples | Blog | Free Support | Temporary License



Αμεσο κατέβασμα

Groupdocs.parser για Java 19.5

Αυτό το αρχείο zip περιέχει μόνο συγκροτήματα για το GroupDocs.Parser για Java 19.5

Προστέθηκε: 5/29/2019 Λήψεις:

Κατεβάστε

Μέγεθος αρχείου: 102.8 MB

Groupdocs.parser για java 22.6

Αυτό το αρχείο zip περιέχει μόνο συγκροτήματα για το groupdocs.parser για java

Προστέθηκε: 6/7/2022 Λήψεις:

Κατεβάστε

Μέγεθος αρχείου: 137.8 MB

Groupdocs.parser για java 22.3

Αυτό το αρχείο zip περιέχει μόνο συγκροτήματα για το groupdocs.parser για java

Προστέθηκε: 3/18/2022 Λήψεις:

Κατεβάστε

Μέγεθος αρχείου: 137.8 MB

Groupdocs.parser για java 21.2

Αυτό το αρχείο zip περιέχει μόνο συγκροτήματα για το groupdocs.parser για java

Προστέθηκε: 2/27/2021 Λήψεις:

Κατεβάστε

Μέγεθος αρχείου: 123.8 MB

Groupdocs.parser για Java 20.12

Αυτό το αρχείο zip περιέχει μόνο συγκροτήματα για το groupdocs.parser για java

Προστέθηκε: 12/30/2020 Λήψεις:

Κατεβάστε

Μέγεθος αρχείου: 117.7 MB

Groupdocs.parser για Java 20.8

Αυτό το αρχείο zip περιέχει μόνο συγκροτήματα για το GroupDocs.Parser για Java 20.8

Προστέθηκε: 8/19/2020 Λήψεις:

Κατεβάστε

Μέγεθος αρχείου: 118.0 MB

Groupdocs.parser για Java 20.6

Αυτό το αρχείο zip περιέχει μόνο συγκροτήματα για το GroupDocs.Parser για Java 20.6

Προστέθηκε: 6/30/2020 Λήψεις:

Κατεβάστε

Μέγεθος αρχείου: 113.4 MB

Groupdocs.parser για Java 20.5

Αυτό το αρχείο zip περιέχει μόνο συγκροτήματα για το GroupDocs.Parser για Java 20.5

Προστέθηκε: 5/14/2020 Λήψεις:

Κατεβάστε

Μέγεθος αρχείου: 101.2 MB

Groupdocs.parser για Java 20.3

Αυτό το αρχείο zip περιέχει μόνο συγκροτήματα για το GroupDocs.Parser για Java 20.3

Προστέθηκε: 4/1/2020 Λήψεις:

Κατεβάστε

Μέγεθος αρχείου: 101.0 MB

Groupdocs.parser για java 20.1

Αυτό το αρχείο zip περιέχει μόνο συγκροτήματα για το GroupDocs.Parser για Java 20.1

Προστέθηκε: 2/4/2020 Λήψεις:

Κατεβάστε

Μέγεθος αρχείου: 101.0 MB

Groupdocs.parser για Java 19.11

Αυτό το αρχείο zip περιέχει μόνο συγκροτήματα για το GroupDocs.Parser για το Java 19.11

Προστέθηκε: 12/3/2019 Λήψεις:

Κατεβάστε

Μέγεθος αρχείου: 104.4 MB

Groupdocs.parser για Java 18.12

Αυτό το αρχείο zip περιέχει μόνο συγκροτήματα για το GroupDocs.Parser για Java 18.12

Προστέθηκε: 12/11/2018 Λήψεις:

Κατεβάστε

Μέγεθος αρχείου: 97.9 MB

Groupdocs.parser για Java 18.11

Αυτό το αρχείο zip περιέχει μόνο συγκροτήματα για το GroupDocs.Parser για Java 18.11

Προστέθηκε: 11/8/2018 Λήψεις:

Κατεβάστε

Μέγεθος αρχείου: 96.9 MB


 Ελληνικά