<repositories>
<repository>
<id>repository.groupdocs.com</id>
<name>GroupDocs Repository</name>
<url>https://releases.groupdocs.com/java/repo/</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-search</artifactId>
<version>22.11</version>
</dependency>
</dependencies>
repositories {
maven {
url 'https://releases.groupdocs.com/java/repo/'
}
}
compile(group: 'com.groupdocs', name: 'groupdocs-search', version: '22.11')
<ivysettings>
<settings defaultResolver="chain"/>
<resolvers>
<chain name="chain">
<ibiblio name="GroupDocs Repository" m2compatible="true" root="https://releases.groupdocs.com/java/repo/"/>
</chain>
</resolvers>
</ivysettings>
<dependency org="com.groupdocs" name="groupdocs-search" rev="22.11">
<artifact name="groupdocs-search" ext="jar"/>
</dependency>
resolvers += Resolver.url("GroupDocs Repository", url("https://releases.groupdocs.com/java/repo/"))
libraryDependencies += "com.groupdocs" % "groupdocs-search" % "22.11"
Hohe Code Java -API zu Index- und Suchdokumenten
Produktseite | Dokumente | Demos | API -Referenz | Beispiele | Blog | Freie Unterstützung | Vorübergehende Lizenz
GroupDocsSearch für Java ist eine lokale Java-API, mit der Dokumenteninhalte und Metadaten in der Indexierung von Dokumenten und Metadaten bei der Durchführung von Suchvorgängen (boolean, facettiert, unscharf, homephone) und benutzerdefinierter Textextraktion, Suchfilter anwenden und hervorgehoben werden können.
Search & Index Java On-Premise-API-Funktionen
Indexierungs -API -Funktionen
Suchindex erstellen, Indexeinstellungen anwenden und Indexereignisse abonnieren.
Unterstützt die Indizierungsdokumente aus Datei, Stream oder einer Datenstruktur.
Führen Sie mehrere Suchindizes in einen zusammen.
Support is available for:
- Zusätzliche Felder
- reguläre Zeichen (Separatoren & Buchstaben)
- Blended Zeichen (diese Sonderzeichen werden sowohl als Trennzeichen als auch als Buchstaben indiziert, z. B. Bindestrich)
- Charaktere, die als ganzes Wort indiziert sind
- Charakterersatz während der Indexierung
- Benutzerdefinierte Textextraktoren
Index files protected with password
Bietet die kompakten und Metadaten -Indexoptionen.
Unterstützt unterschiedliche Komprimierungsstufe, um extrahierten Text im Index zu speichern.
Fähigkeit, Dokumente während der Indexierung zu filtern.
Option zum Löschen indizierter Pfade aus dem Index.
Während des Indexierens konvertieren Sie alle Zeichen in Kleinbuchstaben oder entfernen Sie Diakritik aus dem Text unter Verwendung des Zeichenersatzes.
Fähigkeit zu Geben Sie die gewünschten Zeichensatz als Buchstaben an.
Implementieren Sie die Unterstützung für einen benutzerdefinierten Textextraktor und verwenden Sie diesen benutzerdefinierten Extraktor für die Indexierung.
Löschen oder entfernen Sie gewünschte Dokumente aus dem Suchindex.
Entfernen oder löschen indizierte Ordner und Dateien aus dem Index.
Markieren Sie indizierte Dokumente mit Textetiketten ohne Neuindexing.
Filterdokumente während der Suche über angewandte Dokumentattribute.
Wenden Sie verschiedene Arten von Filtern an, während Sie indizieren, such as:
- Erstellungszeitfilter (d. H. Überspringen von Dateien, die früher/später als ein bestimmtes Datum oder außerhalb des angegebenen Datumsbereichs erstellt wurden)
- Änderungszeitfilter (gleiche wie der Erstellungszeitfilter, funktioniert jedoch zum Datum der Änderung des Dokuments)
- Dateipfadfilter (REGEX anwenden, um die Dateien mit vollständigen Pfaden zu überspringen, die nicht dem angegebenen Muster übereinstimmen)
- Filter der Dateilänge (Angeben Sie die untere/obere Grenze oder den Bereich der akzeptablen Dateilänge in Bytes)
- Dateierweiterungsfilter (nur Dateien, die mit der Liste der angegebenen Dateierweiterungen übereinstimmen, werden indiziert)
- Logisch nicht Filter (umkehren die Logik eines internen Filters)
- Logischer und Filter (zusammengesetzter Filter, bei dem alle internen Filter erfolgreich sein müssen)
- Logischer oder Filter (zusammengesetzter Filter, für das mindestens ein interner Filter erfolgreich ist)
Rename any indexed document without requiring it to reindex during the update
Fügen Sie indizierte Dokumente zusätzliche Felder hinzu, um mehr Metadaten zu verbinden.
Fähigkeit, den Dokumenttext im Index zu speichern.
Suchen Sie API -Funktionen
Supports various types of searches, such as:
- Unterstützt und, oder nicht, nicht Betreiber.
- Kombinieren Sie mehrere boolesche Suchkurys, um Comlex Qurys zu komponieren.
Fallempfindliche Suche betrachtet Groß- und Kleinbuchstaben als unterschiedlich.
DATE RANGESSUCHE Suchanfragen basierend auf dem bereitgestellten Datumsbereich im angegebenen Datumsformat.
Facettensuchung nur in bestimmten Feldern anstelle von ganzem Dokument sucht.
Ungenaue Suche -Suche, die falsche Schreibwörter mit Fuzzy Logic korrekt erkennt.
Homophon -Suche Suche nach Wörtern, die in Ton (Aussprache) dem durchsuchten Wort ähnlich sind.
Rufen Sie den Text mit indizierten Dokumenten im Format “html` ab.
Apply various filters while searching documents, such as:
- Dateipfadfilter (REGEX anwenden, um die Dateien mit vollständigen Pfaden abzurufen, die dem angegebenen Muster entsprechen)
- Dateierweiterungsfilter (gibt die Dateien zurück, die mit der Liste der angegebenen Dateierweiterungen übereinstimmen)
- Attributfilter (gibt die Dateien zurück, mit denen die angegebenen Attribute zugeordnet sind)
- Kombinierte Filter (anwenden Verbundfilter anwenden und nicht komplexe Abfragen zusammenstellen)
Nach der Suche können die gefundenen resultierenden Wörter und Phrasen innerhalb des Dokumentinhalts hervorgehoben werden.
Aktivieren Sie die Option Tastaturlayoutkorrektur, um die nicht unterstützten Schlüsselwortzeichen durch die tatsächlichen Zeichen zu ersetzen.
Suche nach verschiedenen Wortformen wie Substantiv, Adjektiv, Formen von Verben usw.
Search Dictionary Management API -Funktionen
- Various types of Wörterbücher can be used & managed, such as:
- Alias Dictionary
- Alphabet -Wörterbuch
- Charakterersatzwörterbuch
- Dokumentkennwörter Wörterbuch
- Homophon -Wörterbuch
- Rechtschreibkorrektur
- Stoppen Sie das Wortwörterbuch an
- Synonym -Wörterbuch
- Anbieter von Wortformen
unterstützte Dokumentsuchdateiformate
Der Inhaltsvorgang wird für die folgenden Dateiformate unterstützt:
Microsoft Word & reg;: doc/dot/docx/docm/dotx/dotm/rtf/txt
OpenOffice Writer & Reg;: ODT/OTT
**Microsoft Excel & Reg;
OpenOffice Calc & Reg;: ODS/OTS/CSV/TSV/TRAPTHEETML
Microsoft PowerPoint & reg;: ppt/pps/ptpx/pptm/potx/ptm/ppsx/ppsm
OpenOffice impress & reg;: odp
Microsoft Outlook & Reg;: PST/ost/eml/msg
Apple & Reg; Mail -Nachricht: emlx
Microsoft OneNote & reg;: eins
markup: html/xhtml/mhtml/md/xml
eBook: chm/epub/fb2 \
Archiv: ZIP
Festes Layout: PDF
Die Indexierungsmetadatenoperation wird für die folgenden Dateiformate unterstützt:
Microsoft Word & reg;: doc/dot/docx/docm/dotx/dotm/rtf/txt
OpenOffice Writer & Reg;: ODT/OTT
**Microsoft Excel & Reg;
OpenOffice Calc & Reg;: ODS/OTS/CSV/TSV/TRAPTHEETML
Microsoft PowerPoint & reg;: ppt/pps/ptpx/pptm/potx/ptm/ppsx/ppsm
OpenOffice impress & reg;: odp
Microsoft Outlook & Reg;: PST/ost/eml/msg
Apple & Reg; Mail -Nachricht: emlx
Microsoft OneNote & reg;: eins
Microsoft Project & Reg;: MPP
Microsoft Visio & Reg;: VSD/VSS
markup: html/xhtml/mhtml/md/xml
eBook: chm/epub/fb2 \
Archiv: ZIP
Audio: mp3/wav
Video: avi/mov/qt/flv/asf
Bild: bmp/gif/jp2/png/webp/tiff/jpg/djvu
Adobe Photoshop & reg;: PSD
Medizinische Bildgebung: dcm/dicom \
Metadaten: EMF/WMF
Behobene Layout: pdf
Bittorrent: Torrent
Details und Einschränkungen finden Sie unter Unterstützte Dokumentformate.
System Anforderungen
- Microsoft Windows: Windows Desktop & Server (x86, x64), Microsoft Azure
- macOS: Mac OS x
- Linux: Ubuntu, OpenSuse, Centos und andere
- Java -Versionen:
J2SE 7.0 (1,7)
, `J2SE 8.0 (1,8) oder höher (zum Beispiel Java 10)
GroupDocs.Search für Java erfordert keine externe Software oder ein Drittanbieter -Tool. Folgen Sie einfach einem der in Installation und Konfiguration beschriebenen Wege.
Loslegen
GroupDocs veranstaltet alle Java -APIs am GroupDocs Repository. Sie können problemlos GroupDocs.search für Java -API direkt in Ihren Maven -Projekten mit einfachen Konfigurationen verwenden. Für die detaillierten Anweisungen besuchen Sie bitte Installation vom GroupDocs -Repository mit Maven Dokumentationsseite.
Beispiel -Java -Code für die Verwendung der gemischten Zeichen in der Suche in der Suchindexierung
String indexFolder = "c:\\MyIndex\\";
String documentFolder = "c:\\MyDocuments\\";
// Creating an index in the specified folder
Index index = new Index(indexFolder);
// Setting hyphen character type to blended
index.getDictionaries().getAlphabet().setRange(new char[] { '-' }, CharacterType.Blended);
// Indexing documents from the specified folder
index.add(documentFolder);
// Searching in the index
SearchResult result1 = index.search("Elliot-Murray-Kynynmound");
SearchResult result2 = index.search("Elliot");
SearchResult result3 = index.search("Murray");
SearchResult result4 = index.search("Kynynmound");
Produktseite | Dokumente | Demos | API -Referenz | Beispiele | Blog | Freie Unterstützung | Vorübergehende Lizenz
Version | Release Date |
---|---|
22.11 | 30. November 2022 |
22.10 | 24. Oktober 2022 |
21.2 | 25. Januar 2022 |
20.8 | 25. Januar 2022 |
19.2 | 25. Januar 2022 |
18.12 | 25. Januar 2022 |
21.8 | 18. August 2021 |
21.3 | 18. März 2021 |
20.11 | 19. November 2020 |
20.6 | 23. Juni 2020 |
20.4 | 16. April 2020 |
19.12 | 11. Dezember 2019 |
19.5.1 | 15. Juli 2019 |
19.5 | 31. Mai 2019 |
19.3 | 7. März 2019 |
18.11 | 1. November 2018 |
GroupDocs.Total GroupDocs.Search API on premise DOC DOT DOCX DOCM DOTX DOTM RTF TXT ODT OTT XLS XLT XLSX XLSM XLSB XLTX XLTM XLA XLAM ODS OTS CSV TSV SpreadsheetML PPT PPS POT PPTX PPTM POTX POTM PPSX PPSM ODP PST OST EML MSG EMLX ONE MPP VSD VSS HTML XHTML MHTML MD XML CHM EPUB FB2 ZIP MP3 WAV AVI MOV QT FLV ASF BMP GIF JP2 PNG WEBP TIFF JPG DJVU PSD DCM DICOM EMF WMF PDF TORRENT search-index regular characters blended regular-characters blended-characters index password protected password-protected compression extract extraction diacritics extractor indexing attributes filter regex regular expression regular-expression faceted search fuzzy homophone dictionary alias alphabet synonym windows macOS Linux J2SE document automation