<repositories>
<repository>
<id>repository.groupdocs.com</id>
<name>GroupDocs Repository</name>
<url>https://releases.groupdocs.com/java/repo/</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-search</artifactId>
<version>22.11</version>
</dependency>
</dependencies>
repositories {
maven {
url 'https://releases.groupdocs.com/java/repo/'
}
}
compile(group: 'com.groupdocs', name: 'groupdocs-search', version: '22.11')
<ivysettings>
<settings defaultResolver="chain"/>
<resolvers>
<chain name="chain">
<ibiblio name="GroupDocs Repository" m2compatible="true" root="https://releases.groupdocs.com/java/repo/"/>
</chain>
</resolvers>
</ivysettings>
<dependency org="com.groupdocs" name="groupdocs-search" rev="22.11">
<artifact name="groupdocs-search" ext="jar"/>
</dependency>
resolvers += Resolver.url("GroupDocs Repository", url("https://releases.groupdocs.com/java/repo/"))
libraryDependencies += "com.groupdocs" % "groupdocs-search" % "22.11"
Υψηλός κώδικας Java API σε έγγραφα ευρετηρίου και αναζήτησης
Σελίδα προϊόντος | Έγγραφα | Επίδειξη | Αναφορά API | Παραδείγματα | Ιστολόγιο | Δωρεάν υποστήριξη | Προσωρινή άδεια
Το GroupDocsSearch για java είναι ένα API Java για να βοηθήσει στην ευρετηρίαση περιεχομένου και μεταδεδομένων εγγράφων, να εκτελέσει αναζητήσεις (Boolean, Faceted, Fuzzy, Homephone) & Custom Text Extraction, Εφαρμογή φίλτρων αναζήτησης και επισημάνσεις.
Αναζήτηση & ευρετήριο Java On-Premise API Χαρακτηριστικά
Χαρακτηριστικά API ευρετηρίου
Δημιουργία ευρετηρίου αναζήτησης, Εφαρμογή ρυθμίσεων ευρετηρίου και εγγραφείτε σε συμβάντα ευρετηρίου.
Υποστηρίζει έγγραφα ευρετηρίου από αρχείο, ροή ή δομή δεδομένων.
Συγχώνευση πολλαπλών ευρετηρίων αναζήτησης σε ένα.
Support is available for:
- Πρόσθετα πεδία
- Κανονικοί χαρακτήρες (διαχωριστές και γράμματα)
- Αναμειγνύονται χαρακτήρες (αυτοί οι ειδικοί χαρακτήρες είναι ευρετηριασμένοι ως διαχωριστές καθώς και γράμματα, π.χ. παύλα)
- χαρακτήρες που ευρετηριάζονται ως ολόκληρη λέξη
- Αντικατάσταση χαρακτήρων κατά τη διάρκεια της ευρετηρίασης
- Προσαρμοσμένοι εξαγόμενοι κειμένου
Index files protected with password
Παρέχει τις επιλογές συμπαγούς και δείκτη μεταδεδομένων.
Υποστηρίζει διαφορετικό επίπεδο συμπίεσης για την αποθήκευση του εκχυλισμένου κειμένου στον δείκτη.
Δυνατότητα φιλτραρίσματος εγγράφων κατά τη διάρκεια της ευρετηρίασης.
Επιλογή για τη διαγραφή ευρετηρίου διαδρομών από το ευρετήριο.
Ενώ η ευρετηρίαση, μετατρέψτε όλους τους χαρακτήρες σε πεζά ή αφαιρέστε τη διάσπαση από το κείμενο χρησιμοποιώντας αντικατάσταση χαρακτήρων.
Δυνατότητα Καθορίστε το επιθυμητό σύνολο χαρακτήρων ως γράμματα.
Εφαρμόστε την υποστήριξη για ένα προσαρμοσμένο εξαγόμενο κείμενο και στη συνέχεια χρησιμοποιήστε αυτόν τον προσαρμοσμένο εξαγόμενο για ευρετηρίαση.
Διαγράψτε ή καταργήστε τα επιθυμητά έγγραφα από τον δείκτη αναζήτησης.
Αφαιρέστε ή διαγράψτε τους ευρετηρίου φακέλων και αρχεία από το ευρετήριο.
Σημειώστε τα ευρετήρια έγγραφα με ετικέτες κειμένου χωρίς επανεξέταση.
Φιλτράρισμα έγγραφα κατά τη διάρκεια της αναζήτησης μέσω εφαρμοσμένων χαρακτηριστικών εγγράφων.
Εφαρμόστε διάφορους τύπους φίλτρων κατά την ευρετηρίαση, such as:
- Φίλτρο χρόνου δημιουργίας (δηλ. Αρχεία παραλείψεων που δημιουργήθηκαν νωρίτερα/αργότερα από μια συγκεκριμένη ημερομηνία ή εκτός του παρεχόμενου εύρους ημερομηνίας)
- Φίλτρο χρόνου τροποποίησης (ίδιο με το φίλτρο χρόνου δημιουργίας αλλά λειτουργεί στην ημερομηνία τροποποίησης του εγγράφου)
- φίλτρο διαδρομής αρχείου (Εφαρμόστε regex για να παραλείψετε τα αρχεία με πλήρεις διαδρομές που δεν ταιριάζουν με το καθορισμένο μοτίβο)
- φίλτρο μήκους αρχείου (καθορίστε το κάτω/άνω όριο ή το εύρος του αποδεκτού μήκους αρχείου σε bytes)
- Φίλτρο επέκτασης αρχείων (μόνο αρχεία που ταιριάζουν με τη λίστα των συγκεκριμένων επεκτάσεων αρχείων θα είναι ευρετηριασμένα)
- Λογικό μη φίλτρο (ανατρέψτε τη λογική ενός εσωτερικού φίλτρου)
- Λογικό και φίλτρο (σύνθετο φίλτρο που απαιτεί να πετύχουν όλα τα εσωτερικά φίλτρα)
- Λογικό ή φίλτρο (σύνθετο φίλτρο που απαιτεί τουλάχιστον ένα εσωτερικό φίλτρο για να πετύχει)
Rename any indexed document without requiring it to reindex during the update
Προσθέστε πρόσθετα πεδία σε ευρετηριασμένα έγγραφα για να συσχετίσετε περισσότερα μεταδεδομένα.
Δυνατότητα αποθήκευσης του κειμένου του εγγράφου στο ευρετήριο.
Αναζήτηση χαρακτηριστικών API
Supports various types of searches, such as:
- Υποστηρίζει και, ή όχι χειριστές.
- Συνδυάστε πολλά quries αναζήτησης Boolean για να συνθέσετε comlex quries.
Αναγκαστική αναζήτηση περιπτώσεων Θεωρεί τους κεφαλαίους και τους πεζούς χαρακτήρες ως ξεχωριστές.
Αναζήτηση εύρους ημερομηνίας Αναζητήσεις με βάση το παρεχόμενο εύρος ημερομηνίας σε συγκεκριμένη μορφή ημερομηνίας.
Αναζητημένη αναζήτηση αναζητήσεις μόνο σε συγκεκριμένα πεδία αντί για ολόκληρο έγγραφο.
Ασαφής αναζήτηση Αναζήτηση που ανιχνεύει λανθασμένες λέξεις ορθογραφίας σωστά χρησιμοποιώντας ασαφή λογική.
Αναζήτηση ομόφωνο Αναζήτηση λέξεων που είναι παρόμοιες σε ήχο (προφορά) με την αναζητούμενη λέξη.
Λήψη του κειμένου των ευρετηριασμένων εγγράφων στη μορφή
html
.Apply various filters while searching documents, such as:
- φίλτρο διαδρομής αρχείου (Εφαρμόστε regex για να αντλήσετε τα αρχεία με πλήρεις διαδρομές που ταιριάζουν με το καθορισμένο μοτίβο)
- Φίλτρο επέκτασης αρχείων (επιστρέφει τα αρχεία που ταιριάζει με τη λίστα συγκεκριμένων επεκτάσεων αρχείων)
- Φίλτρο χαρακτηριστικών (επιστρέφει τα αρχεία με τα οποία σχετίζονται τα καθορισμένα χαρακτηριστικά)
- Συνδυασμένα φίλτρα (εφαρμόστε σύνθετα φίλτρα και, ή, να μην συνθέσετε σύνθετα ερωτήματα)
Μετά την αναζήτηση, μπορούν να επισημανθούν οι προκύπτουσες λέξεις και φράσεις στο περιεχόμενο του εγγράφου.
Ενεργοποιήστε την επιλογή διόρθωση διάταξης πληκτρολογίου για να αντικαταστήσετε τους μη υποστηριζόμενους χαρακτήρες λέξεων -κλειδιών με τους πραγματικούς χαρακτήρες.
Αναζητήστε διαφορετικές φόρμες λέξεων, όπως, ουσιαστικό, επίθετο, μορφές ρήματος κ.λπ.
Αναζήτηση λειτουργιών API διαχείρισης λεξικού
- Various types of λεξικά can be used & managed, such as:
- Λεξικό ψευδώνυμο
- Λεξικό αλφάβητου
- Λεξικό αντικαταστάσεων χαρακτήρων
- Λεξικό κωδικών εγγράφων
- λεξικό ομόφωνο
- Διορθωτής ορθογραφίας
- Σταματήστε το λεξικό λέξεων
- Λεξικό συνώνυμου
- πάροχος φόρμας λέξεων
Υποστηριζόμενες μορφές αρχείου αναζήτησης εγγράφων
Η λειτουργία περιεχομένου ευρετηρίου υποστηρίζεται για τις ακόλουθες μορφές αρχείων:
**Microsoft Word & Reg: ** Doc/dot/docx/docm/dotx/dotm/rtf/txt
OpenOffice Writer & Reg;: ODT/OTT
**Microsoft Excel & reg ·: ** XLS/XLT/XLSX/XLSM/XLSB/XLTX/XLTM/XLA/XLAM
OpenOffice Calc & reg;: ODS/OTS/CSV/TSV/Spreadsheetml
**Microsoft PowerPoint & Reg: ** PPT/PPS/POT/PPTX/PPTM/POTX/POTM/PPSX/PPSM
OpenOffice Impress & reg;: ODP
Microsoft Outlook & reg;: PST/OST/EML/MSG
**Apple & reg; Μήνυμα αλληλογραφίας: ** EMLX
Microsoft OneNote & reg;: one
**σήμανση: ** html/xhtml/mhtml/md/xml
**Ebook: ** chm/epub/fb2
**Αρχείο: ** Zip
**Σταθερή διάταξη: ** PDF
Η λειτουργία μεταδεδομένων ευρετηρίου υποστηρίζεται για τις ακόλουθες μορφές αρχείων:
**Microsoft Word & Reg: ** Doc/dot/docx/docm/dotx/dotm/rtf/txt
OpenOffice Writer & Reg;: ODT/OTT
**Microsoft Excel & reg ·: ** XLS/XLT/XLSX/XLSM/XLSB/XLTX/XLTM/XLA/XLAM
OpenOffice Calc & reg;: ODS/OTS/CSV/TSV/Spreadsheetml
**Microsoft PowerPoint & Reg: ** PPT/PPS/POT/PPTX/PPTM/POTX/POTM/PPSX/PPSM
OpenOffice Impress & reg;: ODP
Microsoft Outlook & reg;: PST/OST/EML/MSG
**Apple & reg; Μήνυμα αλληλογραφίας: ** EMLX
Microsoft OneNote & reg;: one
Microsoft Project & Reg;: MPP
Microsoft Visio & reg;: vsd/vss
**σήμανση: ** html/xhtml/mhtml/md/xml
**Ebook: ** chm/epub/fb2
**Αρχείο: ** Zip
**Ήχος: ** mp3/wav
**Βίντεο: ** AVI/MOV/QT/FLV/ASF
**Εικόνα: ** BMP/GIF/JP2/PNG/WEBP/TIFF/JPG/DJVU
Adobe Photoshop & Reg;: PSD
**Ιατρική απεικόνιση: ** DCM/DICOM
**Μεταδεδομένα: ** EMF/WMF
**Σταθερή διάταξη: ** PDF
**Bittorrent: ** torrent
Για λεπτομέρειες και περιορισμούς, επισκεφθείτε, Υποστηριζόμενες μορφές εγγράφων.
Απαιτήσεις συστήματος
- **Microsoft Windows: ** Windows Desktop & Server (x86, x64), Microsoft Azure
- **macos: ** mac os x
- **Linux: ** ubuntu, opensuse, centos και άλλοι
- **Εκδόσεις Java: **
J2SE 7.0 (1,7)
,J2SE 8.0 (1,8)
ή παραπάνω (για παράδειγμα Java 10)
Το GroupDocs.search για το Java δεν απαιτεί εγκατεστημένο εξωτερικό λογισμικό ή εργαλείο τρίτου μέρους. Απλώς ακολουθήστε έναν από τους τρόπους όπως περιγράφεται στο Εγκατάσταση και διαμόρφωση.
Ξεκίνα
Το GroupDocs φιλοξενεί όλα τα API Java στο Αποθετήριο GroupDocs. Μπορείτε εύκολα να χρησιμοποιήσετε το GroupDocs.Search για το Java API απευθείας στα έργα Maven σας με απλές διαμορφώσεις. Για τις λεπτομερείς οδηγίες, επισκεφτείτε τη σελίδα τεκμηρίωσης Εγκατάσταση από το αποθετήριο GroupDocs χρησιμοποιώντας το Maven.
δείγμα κώδικα Java για να χρησιμοποιήσετε τους αναμειγμένους χαρακτήρες στην ευρετηρίαση αναζήτησης
String indexFolder = "c:\\MyIndex\\";
String documentFolder = "c:\\MyDocuments\\";
// Creating an index in the specified folder
Index index = new Index(indexFolder);
// Setting hyphen character type to blended
index.getDictionaries().getAlphabet().setRange(new char[] { '-' }, CharacterType.Blended);
// Indexing documents from the specified folder
index.add(documentFolder);
// Searching in the index
SearchResult result1 = index.search("Elliot-Murray-Kynynmound");
SearchResult result2 = index.search("Elliot");
SearchResult result3 = index.search("Murray");
SearchResult result4 = index.search("Kynynmound");
Σελίδα προϊόντος | Έγγραφα | Επίδειξη | Αναφορά API | Παραδείγματα | Ιστολόγιο | Δωρεάν υποστήριξη | Προσωρινή άδεια
Version | Release Date |
---|---|
22.11 | 30 Νοεμβρίου 2022 |
22.10 | 24 Οκτωβρίου 2022 |
21.2 | 25 Ιανουαρίου 2022 |
20.8 | 25 Ιανουαρίου 2022 |
19.2 | 25 Ιανουαρίου 2022 |
18.12 | 25 Ιανουαρίου 2022 |
21.8 | 18 Αυγούστου 2021 |
21.3 | 18 Μαρτίου 2021 |
20.11 | 19 Νοεμβρίου 2020 |
20.6 | 23 Ιουνίου 2020 |
20.4 | 16 Απριλίου 2020 |
19.12 | 11 Δεκεμβρίου 2019 |
19.5.1 | 15 Ιουλίου 2019 |
19.5 | 31 Μαΐου 2019 |
19.3 | 7 Μαρτίου 2019 |
18.11 | 1 Νοεμβρίου 2018 |
GroupDocs.Total GroupDocs.Search API on premise DOC DOT DOCX DOCM DOTX DOTM RTF TXT ODT OTT XLS XLT XLSX XLSM XLSB XLTX XLTM XLA XLAM ODS OTS CSV TSV SpreadsheetML PPT PPS POT PPTX PPTM POTX POTM PPSX PPSM ODP PST OST EML MSG EMLX ONE MPP VSD VSS HTML XHTML MHTML MD XML CHM EPUB FB2 ZIP MP3 WAV AVI MOV QT FLV ASF BMP GIF JP2 PNG WEBP TIFF JPG DJVU PSD DCM DICOM EMF WMF PDF TORRENT search-index regular characters blended regular-characters blended-characters index password protected password-protected compression extract extraction diacritics extractor indexing attributes filter regex regular expression regular-expression faceted search fuzzy homophone dictionary alias alphabet synonym windows macOS Linux J2SE document automation