<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-search</artifactId>
    <version>20.4</version>
</dependency>compile(group: 'com.groupdocs', name: 'groupdocs-search', version: '20.4')<dependency org="com.groupdocs" name="groupdocs-search" rev="20.4">
    <artifact name="groupdocs-search" ext="jar"/>
</dependency>libraryDependencies += "com.groupdocs" % "groupdocs-search" % "20.4"Hohe Code Java -API zu Index- und Suchdokumenten
Produktseite | Dokumente | Demos | API -Referenz | Beispiele | Blog | Freie Unterstützung | Vorübergehende Lizenz
GroupDocsSearch für Java ist eine lokale Java-API, mit der Dokumenteninhalte und Metadaten indexiert, Suchvorgänge (boolean, facettiert, Fuzzy, Homephone) und benutzerdefinierte Textextraktion, Suchfilter anwenden und Ergebnisse hervorgehoben werden können.
Search & Index Java On-Premise-API-Funktionen
Indexierungs -API -Funktionen
- Suchindex erstellen, Indexeinstellungen anwenden und Indexereignisse abonnieren. 
- Unterstützt die Indizierungsdokumente aus Datei, Stream oder einer Datenstruktur. 
- Führen Sie mehrere Suchindizes in einen zusammen. 
- Unterstützung ist verfügbar für: - Zusätzliche Felder
- reguläre Zeichen (Separatoren & Buchstaben)
- Blended Zeichen (diese Sonderzeichen werden sowohl als Trennzeichen als auch als Buchstaben indiziert, z. B. Bindestrich)
- Charaktere, die als ganzes Wort indiziert sind
- Charakterersatz während der Indexierung
- Benutzerdefinierte Textextraktoren
 
- Indexdateien mit Passwort geschützt 
- Bietet die kompakten und Metadaten -Indexoptionen. 
- Unterstützt unterschiedliche Komprimierungsstufe, um extrahierten Text im Index zu speichern. 
- Fähigkeit, Dokumente während der Indexierung zu filtern. 
- Option zum Löschen indizierter Pfade aus dem Index. 
- Während des Indexierens konvertieren Sie alle Zeichen in Kleinbuchstaben oder entfernen Sie Diakritik aus dem Text unter Verwendung des Zeichenersatzes. 
- Fähigkeit zu Geben Sie die gewünschten Zeichensatz als Buchstaben an. 
- Implementieren Sie die Unterstützung für einen benutzerdefinierten Textextraktor und verwenden Sie diesen benutzerdefinierten Extraktor für die Indexierung. 
- Löschen oder entfernen Sie gewünschte Dokumente aus dem Suchindex. 
- Entfernen oder löschen indizierte Ordner und Dateien aus dem Index. 
- Markieren Sie indizierte Dokumente mit Textetiketten ohne Neuindexing. 
- Filterdokumente während der Suche über angewandte Dokumentattribute. 
- Wenden Sie verschiedene Arten von Filtern an, während Sie indizieren, wie:: - Erstellungszeitfilter (d. H. Überspringen von Dateien, die früher/später als ein bestimmtes Datum oder außerhalb des angegebenen Datumsbereichs erstellt wurden)
- Änderungszeitfilter (gleiche wie der Erstellungszeitfilter, funktioniert jedoch zum Datum der Änderung des Dokuments)
- Dateipfadfilter (REGEX anwenden, um die Dateien mit vollständigen Pfaden zu überspringen, die nicht dem angegebenen Muster übereinstimmen)
- Filter der Dateilänge (Angeben Sie die untere/obere Grenze oder den Bereich der akzeptablen Dateilänge in Bytes)
- Dateierweiterungsfilter (nur Dateien, die mit der Liste der angegebenen Dateierweiterungen übereinstimmen, werden indiziert)
- Logisch nicht Filter (umkehren die Logik eines internen Filters)
- Logischer und Filter (zusammengesetzter Filter, bei dem alle internen Filter erfolgreich sein müssen)
- Logischer oder Filter (zusammengesetzter Filter, für das mindestens ein interner Filter erfolgreich ist)
 
- Benennen Sie jedes indizierte Dokument um, ohne dass es während des Updates an Reindedex erforderlich ist 
- Fügen Sie indizierte Dokumente zusätzliche Felder hinzu, um mehr Metadaten zu verbinden. 
- Fähigkeit, den Dokumenttext im Index zu speichern. 
Suchen Sie API -Funktionen
- Unterstützt verschiedene Arten von Suchvorgängen, wie z. B.: - Unterstützt und, oder nicht, nicht Betreiber.
- Kombinieren Sie mehrere boolesche Suchkurys, um Comlex Qurys zu komponieren.
 
- Fallempfindliche Suche betrachtet Groß- und Kleinbuchstaben als unterschiedlich. 
- DATE RANGESSUCHE Suchvorgänge basierend auf dem vorgesehenen Datumbereich im angegebenen Datumformat. 
- Facettensuchung sucht nur in angegebenen Feldern anstelle des gesamten Dokuments. 
- Ungenaue Suche Suche, die falsche Schellings Wörter mit Fuzzy Logic korrekt erkennt. 
- Homophon -Suche Suche nach Wörtern, die in Ton (Aussprache) dem durchsuchten Wort ähnlich sind. 
 
- Rufen Sie den Text mit indizierten Dokumenten im Format “html` ab. 
- Wenden Sie verschiedene Filter an, während Sie Dokumente durchsuchen, z. B.: - Dateipfadfilter (REGEX anwenden, um die Dateien mit vollständigen Pfaden abzurufen, die dem angegebenen Muster entsprechen)
- Dateierweiterungsfilter (gibt die Dateien zurück, die mit der Liste der angegebenen Dateierweiterungen übereinstimmen)
- Attributfilter (gibt die Dateien zurück, mit denen die angegebenen Attribute zugeordnet sind)
- Kombinierte Filter (anwenden Verbundfilter anwenden und nicht komplexe Abfragen zusammenstellen)
 
- Nach der Suche können die gefundenen resultierenden Wörter und Phrasen innerhalb des Dokumentinhalts hervorgehoben werden. 
- Aktivieren Sie die Option Tastaturlayoutkorrektur, um die nicht unterstützten Schlüsselwortzeichen durch die tatsächlichen Zeichen zu ersetzen. 
- Suche nach verschiedenen Wortformen, wie Nomen, Adjektiv, Formen von Verben usw. 
Search Dictionary Management API -Funktionen
- Verschiedene Arten von Wörterbücher können verwendet und verwaltet werden, wie z. B.:- Alias Dictionary
- Alphabet -Wörterbuch
- Charakterersatzwörterbuch
- Dokumentkennwörter Wörterbuch
- Homophon -Wörterbuch
- Rechtschreibkorrektur
- Stoppen Sie das Wortwörterbuch an
- Synonym -Wörterbuch
- Anbieter von Wortformen
 
unterstützte Dokumentsuchdateiformate
Der Inhaltsvorgang wird für die folgenden Dateiformate unterstützt:
Microsoft Word & reg;: doc/dot/docx/docm/dotx/dotm/rtf/txt
OpenOffice Writer & Reg;: ODT/OTT
**Microsoft Excel & Reg;
OpenOffice Calc & Reg;: ODS/OTS/CSV/TSV/TRAPTHEETML
Microsoft PowerPoint & reg;: ppt/pps/ptpx/pptm/potx/ptm/ppsx/ppsm
OpenOffice impress & reg;: odp
Microsoft Outlook & Reg;: PST/ost/eml/msg
Apple & Reg; Mail -Nachricht: emlx
Microsoft OneNote & reg;: eins
markup: html/xhtml/mhtml/md/xml
eBook: chm/epub/fb2 \
Archiv: ZIP
Festes Layout: PDF
Die Indexierungsmetadatenoperation wird für die folgenden Dateiformate unterstützt:
Microsoft Word & reg;: doc/dot/docx/docm/dotx/dotm/rtf/txt
OpenOffice Writer & Reg;: ODT/OTT
**Microsoft Excel & Reg;
OpenOffice Calc & Reg;: ODS/OTS/CSV/TSV/TRAPTHEETML
Microsoft PowerPoint & reg;: ppt/pps/ptpx/pptm/potx/ptm/ppsx/ppsm
OpenOffice impress & reg;: odp
Microsoft Outlook & Reg;: PST/ost/eml/msg
Apple & Reg; Mail -Nachricht: emlx
Microsoft OneNote & reg;: eins
Microsoft Project & Reg;: MPP
Microsoft Visio & Reg;: VSD/VSS
markup: html/xhtml/mhtml/md/xml
eBook: chm/epub/fb2 \
Archiv: ZIP
Audio: mp3/wav
Video: avi/mov/qt/flv/asf
Bild: bmp/gif/jp2/png/webp/tiff/jpg/djvu
Adobe Photoshop & reg;: PSD
Medizinische Bildgebung: dcm/dicom \
Metadaten: EMF/WMF
Behobene Layout: pdf
Bittorrent: Torrent
Für Details und Einschränkungen besuchen Sie bitte Unterstützte Dokumentformate.
System Anforderungen
- Microsoft Windows: Windows Desktop & Server (x86, x64), Microsoft Azure
- macOS: Mac OS x
- Linux: Ubuntu, OpenSuse, Centos und andere
- Java -Versionen: J2SE 7.0 (1,7), `J2SE 8.0 (1,8) oder höher (zum Beispiel Java 10)
GroupDocs.Search für Java erfordert keine externe Software oder ein Drittanbieter -Tool. Folgen Sie einfach einem der in Installation und Konfiguration beschriebenen Wege.
Loslegen
GroupDocs veranstaltet alle Java -APIs am GroupDocs Repository. Sie können problemlos GroupDocs.search für Java -API direkt in Ihren Maven -Projekten mit einfachen Konfigurationen verwenden. Für die detaillierten Anweisungen besuchen Sie bitte die Seite “Installation vom GroupDocs -Repository mit Maven Dokumentation”.
Beispiel -Java -Code für die Verwendung der gemischten Zeichen in der Suche in der Suchindexierung
String indexFolder = "c:\\MyIndex\\";
String documentFolder = "c:\\MyDocuments\\";
 
// Creating an index in the specified folder
Index index = new Index(indexFolder);
 
// Setting hyphen character type to blended
index.getDictionaries().getAlphabet().setRange(new char[] { '-' }, CharacterType.Blended);
 
// Indexing documents from the specified folder
index.add(documentFolder);
 
// Searching in the index
SearchResult result1 = index.search("Elliot-Murray-Kynynmound");
SearchResult result2 = index.search("Elliot");
SearchResult result3 = index.search("Murray");
SearchResult result4 = index.search("Kynynmound");
Produktseite | Dokumente | Demos | API -Referenz | Beispiele | Blog | Freie Unterstützung | Vorübergehende Lizenz
| Version | Release Date | 
|---|---|
| 25.4 | 23. April 2025 | 
| 24.4 | 22. April 2024 | 
| 24.2 | 6. Februar 2024 | 
| 24.1 | 15. Januar 2024 | 
| 23.6 | 15. Juni 2023 | 
| 23.3 | 24. März 2023 | 
| 22.11 | 30. November 2022 | 
| 22.10 | 24. Oktober 2022 | 
| 21.2 | 25. Januar 2022 | 
| 20.8 | 25. Januar 2022 | 
| 19.2 | 25. Januar 2022 | 
| 18.12 | 25. Januar 2022 | 
| 21.8 | 18. August 2021 | 
| 21.3 | 18. März 2021 | 
| 20.11 | 19. November 2020 | 
| 20.6 | 23. Juni 2020 | 
| 20.4 | 16. April 2020 | 
| 19.12 | 11. Dezember 2019 | 
| 19.5.1 | 15. Juli 2019 | 
| 19.5 | 31. Mai 2019 | 
| 19.3 | 7. März 2019 | 
| 18.11 | 1. November 2018 | 
| File | Classifier | Size | 
|---|---|---|
| groupdocs-search-20.4-javadoc.jar | javadoc | 675.93 KB | 
| groupdocs-search-20.4.jar | 254.09 MB | |
| groupdocs-search-20.4.pom | 3.04 KB | 

