GroupDocs.Search for Java 20.4

<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-search</artifactId>
    <version>20.4</version>
</dependency>

copied!

compile(group: 'com.groupdocs', name: 'groupdocs-search', version: '20.4')

copied!

<dependency org="com.groupdocs" name="groupdocs-search" rev="20.4">
    <artifact name="groupdocs-search" ext="jar"/>
</dependency>

copied!

libraryDependencies += "com.groupdocs" % "groupdocs-search" % "20.4"

copied!

Hohe Code Java -API zu Index- und Suchdokumenten

GroupDocsSearch für Java ist eine lokale Java-API, mit der Dokumenteninhalte und Metadaten indexiert, Suchvorgänge (boolean, facettiert, Fuzzy, Homephone) und benutzerdefinierte Textextraktion, Suchfilter anwenden und Ergebnisse hervorgehoben werden können.

Search & Index Java On-Premise-API-Funktionen

Indexierungs -API -Funktionen

Suchindex erstellen, Indexeinstellungen anwenden und Indexereignisse abonnieren.
Unterstützt die Indizierungsdokumente aus Datei, Stream oder einer Datenstruktur.
Führen Sie mehrere Suchindizes in einen zusammen.
Unterstützung ist verfügbar für:
- Zusätzliche Felder
- reguläre Zeichen (Separatoren & Buchstaben)
- Blended Zeichen (diese Sonderzeichen werden sowohl als Trennzeichen als auch als Buchstaben indiziert, z. B. Bindestrich)
- Charaktere, die als ganzes Wort indiziert sind
- Charakterersatz während der Indexierung
- Benutzerdefinierte Textextraktoren
Indexdateien mit Passwort geschützt
Bietet die kompakten und Metadaten -Indexoptionen.
Unterstützt unterschiedliche Komprimierungsstufe, um extrahierten Text im Index zu speichern.
Fähigkeit, Dokumente während der Indexierung zu filtern.
Option zum Löschen indizierter Pfade aus dem Index.
Während des Indexierens konvertieren Sie alle Zeichen in Kleinbuchstaben oder entfernen Sie Diakritik aus dem Text unter Verwendung des Zeichenersatzes.
Fähigkeit zu Geben Sie die gewünschten Zeichensatz als Buchstaben an.
Implementieren Sie die Unterstützung für einen benutzerdefinierten Textextraktor und verwenden Sie diesen benutzerdefinierten Extraktor für die Indexierung.
Löschen oder entfernen Sie gewünschte Dokumente aus dem Suchindex.
Entfernen oder löschen indizierte Ordner und Dateien aus dem Index.
Markieren Sie indizierte Dokumente mit Textetiketten ohne Neuindexing.
Filterdokumente während der Suche über angewandte Dokumentattribute.
Wenden Sie verschiedene Arten von Filtern an, während Sie indizieren, wie::
- Erstellungszeitfilter (d. H. Überspringen von Dateien, die früher/später als ein bestimmtes Datum oder außerhalb des angegebenen Datumsbereichs erstellt wurden)
- Änderungszeitfilter (gleiche wie der Erstellungszeitfilter, funktioniert jedoch zum Datum der Änderung des Dokuments)
- Dateipfadfilter (REGEX anwenden, um die Dateien mit vollständigen Pfaden zu überspringen, die nicht dem angegebenen Muster übereinstimmen)
- Filter der Dateilänge (Angeben Sie die untere/obere Grenze oder den Bereich der akzeptablen Dateilänge in Bytes)
- Dateierweiterungsfilter (nur Dateien, die mit der Liste der angegebenen Dateierweiterungen übereinstimmen, werden indiziert)
- Logisch nicht Filter (umkehren die Logik eines internen Filters)
- Logischer und Filter (zusammengesetzter Filter, bei dem alle internen Filter erfolgreich sein müssen)
- Logischer oder Filter (zusammengesetzter Filter, für das mindestens ein interner Filter erfolgreich ist)
Benennen Sie jedes indizierte Dokument um, ohne dass es während des Updates an Reindedex erforderlich ist
Fügen Sie indizierte Dokumente zusätzliche Felder hinzu, um mehr Metadaten zu verbinden.
Fähigkeit, den Dokumenttext im Index zu speichern.

Suchen Sie API -Funktionen

Unterstützt verschiedene Arten von Suchvorgängen, wie z. B.:
- Boolesche Suche
  - Unterstützt und, oder nicht, nicht Betreiber.
  - Kombinieren Sie mehrere boolesche Suchkurys, um Comlex Qurys zu komponieren.
- Fallempfindliche Suche betrachtet Groß- und Kleinbuchstaben als unterschiedlich.
- DATE RANGESSUCHE Suchvorgänge basierend auf dem vorgesehenen Datumbereich im angegebenen Datumformat.
- Facettensuchung sucht nur in angegebenen Feldern anstelle des gesamten Dokuments.
- Ungenaue Suche Suche, die falsche Schellings Wörter mit Fuzzy Logic korrekt erkennt.
- Homophon -Suche Suche nach Wörtern, die in Ton (Aussprache) dem durchsuchten Wort ähnlich sind.
Rufen Sie den Text mit indizierten Dokumenten im Format “html` ab.
Wenden Sie verschiedene Filter an, während Sie Dokumente durchsuchen, z. B.:
- Dateipfadfilter (REGEX anwenden, um die Dateien mit vollständigen Pfaden abzurufen, die dem angegebenen Muster entsprechen)
- Dateierweiterungsfilter (gibt die Dateien zurück, die mit der Liste der angegebenen Dateierweiterungen übereinstimmen)
- Attributfilter (gibt die Dateien zurück, mit denen die angegebenen Attribute zugeordnet sind)
- Kombinierte Filter (anwenden Verbundfilter anwenden und nicht komplexe Abfragen zusammenstellen)
Nach der Suche können die gefundenen resultierenden Wörter und Phrasen innerhalb des Dokumentinhalts hervorgehoben werden.
Aktivieren Sie die Option Tastaturlayoutkorrektur, um die nicht unterstützten Schlüsselwortzeichen durch die tatsächlichen Zeichen zu ersetzen.
Suche nach verschiedenen Wortformen, wie Nomen, Adjektiv, Formen von Verben usw.

Search Dictionary Management API -Funktionen

Verschiedene Arten von Wörterbücher können verwendet und verwaltet werden, wie z. B.:
- Alias Dictionary
- Alphabet -Wörterbuch
- Charakterersatzwörterbuch
- Dokumentkennwörter Wörterbuch
- Homophon -Wörterbuch
- Rechtschreibkorrektur
- Stoppen Sie das Wortwörterbuch an
- Synonym -Wörterbuch
- Anbieter von Wortformen

unterstützte Dokumentsuchdateiformate

Der Inhaltsvorgang wird für die folgenden Dateiformate unterstützt: Microsoft Word & reg;: doc/dot/docx/docm/dotx/dotm/rtf/txt
OpenOffice Writer & Reg;: ODT/OTT
**Microsoft Excel & Reg; OpenOffice Calc & Reg;: ODS/OTS/CSV/TSV/TRAPTHEETML
Microsoft PowerPoint & reg;: ppt/pps/ptpx/pptm/potx/ptm/ppsx/ppsm
OpenOffice impress & reg;: odp
Microsoft Outlook & Reg;: PST/ost/eml/msg
Apple & Reg; Mail -Nachricht: emlx
Microsoft OneNote & reg;: eins
markup: html/xhtml/mhtml/md/xml
eBook: chm/epub/fb2 \
Archiv: ZIP
Festes Layout: PDF Die Indexierungsmetadatenoperation wird für die folgenden Dateiformate unterstützt: Microsoft Word & reg;: doc/dot/docx/docm/dotx/dotm/rtf/txt
OpenOffice Writer & Reg;: ODT/OTT
**Microsoft Excel & Reg; OpenOffice Calc & Reg;: ODS/OTS/CSV/TSV/TRAPTHEETML
Microsoft PowerPoint & reg;: ppt/pps/ptpx/pptm/potx/ptm/ppsx/ppsm
OpenOffice impress & reg;: odp
Microsoft Outlook & Reg;: PST/ost/eml/msg
Apple & Reg; Mail -Nachricht: emlx
Microsoft OneNote & reg;: eins
Microsoft Project & Reg;: MPP
Microsoft Visio & Reg;: VSD/VSS
markup: html/xhtml/mhtml/md/xml
eBook: chm/epub/fb2 \
Archiv: ZIP
Audio: mp3/wav
Video: avi/mov/qt/flv/asf
Bild: bmp/gif/jp2/png/webp/tiff/jpg/djvu
Adobe Photoshop & reg;: PSD
Medizinische Bildgebung: dcm/dicom \
Metadaten: EMF/WMF
Behobene Layout: pdf
Bittorrent: Torrent

Für Details und Einschränkungen besuchen Sie bitte Unterstützte Dokumentformate.

System Anforderungen

Microsoft Windows: Windows Desktop & Server (x86, x64), Microsoft Azure
macOS: Mac OS x
Linux: Ubuntu, OpenSuse, Centos und andere
Java -Versionen: J2SE 7.0 (1,7), `J2SE 8.0 (1,8) oder höher (zum Beispiel Java 10)

GroupDocs.Search für Java erfordert keine externe Software oder ein Drittanbieter -Tool. Folgen Sie einfach einem der in Installation und Konfiguration beschriebenen Wege.

Loslegen

GroupDocs veranstaltet alle Java -APIs am GroupDocs Repository. Sie können problemlos GroupDocs.search für Java -API direkt in Ihren Maven -Projekten mit einfachen Konfigurationen verwenden. Für die detaillierten Anweisungen besuchen Sie bitte die Seite “Installation vom GroupDocs -Repository mit Maven Dokumentation”.

Beispiel -Java -Code für die Verwendung der gemischten Zeichen in der Suche in der Suchindexierung

String indexFolder = "c:\\MyIndex\\";
String documentFolder = "c:\\MyDocuments\\";
 
// Creating an index in the specified folder
Index index = new Index(indexFolder);
 
// Setting hyphen character type to blended
index.getDictionaries().getAlphabet().setRange(new char[] { '-' }, CharacterType.Blended);
 
// Indexing documents from the specified folder
index.add(documentFolder);
 
// Searching in the index
SearchResult result1 = index.search("Elliot-Murray-Kynynmound");
SearchResult result2 = index.search("Elliot");
SearchResult result3 = index.search("Murray");
SearchResult result4 = index.search("Kynynmound");

Version	Release Date
25.4	23. April 2025
24.4	22. April 2024
24.2	6. Februar 2024
24.1	15. Januar 2024
23.6	15. Juni 2023
23.3	24. März 2023
22.11	30. November 2022
22.10	24. Oktober 2022
21.2	25. Januar 2022
20.8	25. Januar 2022
19.2	25. Januar 2022
18.12	25. Januar 2022
21.8	18. August 2021
21.3	18. März 2021
20.11	19. November 2020
20.6	23. Juni 2020
20.4	16. April 2020
19.12	11. Dezember 2019
19.5.1	15. Juli 2019
19.5	31. Mai 2019
19.3	7. März 2019
18.11	1. November 2018

GroupDocs.Search for Java 20.4 Release Notes

File	Classifier	Size
groupdocs-search-20.4-javadoc.jar	javadoc	675.93 KB
groupdocs-search-20.4.jar		254.09 MB
groupdocs-search-20.4.pom		3.04 KB