<repositories>
   <repository>
      <id>repository.groupdocs.com</id>
      <name>GroupDocs Repository</name>
      <url>https://releases.groupdocs.com/java/repo/</url>
   </repository>
</repositories>

<dependencies>
   <dependency>
      <groupId>com.groupdocs</groupId>
      <artifactId>groupdocs-search</artifactId>
      <version>22.11</version>
   </dependency>
</dependencies>
copied!  
repositories {
    maven {
        url 'https://releases.groupdocs.com/java/repo/'
    }
}

compile(group: 'com.groupdocs', name: 'groupdocs-search', version: '22.11')
copied!  
<ivysettings>
    <settings defaultResolver="chain"/>
    <resolvers>
        <chain name="chain">
            <ibiblio name="GroupDocs Repository" m2compatible="true" root="https://releases.groupdocs.com/java/repo/"/>
        </chain>
    </resolvers>
</ivysettings>

<dependency org="com.groupdocs" name="groupdocs-search" rev="22.11">
   <artifact name="groupdocs-search" ext="jar"/>
</dependency>
copied!  
resolvers += Resolver.url("GroupDocs Repository", url("https://releases.groupdocs.com/java/repo/"))

libraryDependencies += "com.groupdocs" % "groupdocs-search" % "22.11"
copied!  

Hohe Code Java -API zu Index- und Suchdokumenten

main-banner

Produktseite | Dokumente | Demos | API -Referenz | Beispiele | Blog | Freie Unterstützung | Vorübergehende Lizenz

GroupDocsSearch für Java ist eine lokale Java-API, mit der Dokumenteninhalte und Metadaten in der Indexierung von Dokumenten und Metadaten bei der Durchführung von Suchvorgängen (boolean, facettiert, unscharf, homephone) und benutzerdefinierter Textextraktion, Suchfilter anwenden und hervorgehoben werden können.

Search & Index Java On-Premise-API-Funktionen

Indexierungs -API -Funktionen

  • Suchindex erstellen, Indexeinstellungen anwenden und Indexereignisse abonnieren.

  • Unterstützt die Indizierungsdokumente aus Datei, Stream oder einer Datenstruktur.

  • Führen Sie mehrere Suchindizes in einen zusammen.

  • Support is available for:

    • Zusätzliche Felder
    • reguläre Zeichen (Separatoren & Buchstaben)
    • Blended Zeichen (diese Sonderzeichen werden sowohl als Trennzeichen als auch als Buchstaben indiziert, z. B. Bindestrich)
    • Charaktere, die als ganzes Wort indiziert sind
    • Charakterersatz während der Indexierung
    • Benutzerdefinierte Textextraktoren
  • Index files protected with password

  • Bietet die kompakten und Metadaten -Indexoptionen.

  • Unterstützt unterschiedliche Komprimierungsstufe, um extrahierten Text im Index zu speichern.

  • Fähigkeit, Dokumente während der Indexierung zu filtern.

  • Option zum Löschen indizierter Pfade aus dem Index.

  • Während des Indexierens konvertieren Sie alle Zeichen in Kleinbuchstaben oder entfernen Sie Diakritik aus dem Text unter Verwendung des Zeichenersatzes.

  • Fähigkeit zu Geben Sie die gewünschten Zeichensatz als Buchstaben an.

  • Implementieren Sie die Unterstützung für einen benutzerdefinierten Textextraktor und verwenden Sie diesen benutzerdefinierten Extraktor für die Indexierung.

  • Löschen oder entfernen Sie gewünschte Dokumente aus dem Suchindex.

  • Entfernen oder löschen indizierte Ordner und Dateien aus dem Index.

  • Markieren Sie indizierte Dokumente mit Textetiketten ohne Neuindexing.

  • Filterdokumente während der Suche über angewandte Dokumentattribute.

  • Wenden Sie verschiedene Arten von Filtern an, während Sie indizieren, such as:

    • Erstellungszeitfilter (d. H. Überspringen von Dateien, die früher/später als ein bestimmtes Datum oder außerhalb des angegebenen Datumsbereichs erstellt wurden)
    • Änderungszeitfilter (gleiche wie der Erstellungszeitfilter, funktioniert jedoch zum Datum der Änderung des Dokuments)
    • Dateipfadfilter (REGEX anwenden, um die Dateien mit vollständigen Pfaden zu überspringen, die nicht dem angegebenen Muster übereinstimmen)
    • Filter der Dateilänge (Angeben Sie die untere/obere Grenze oder den Bereich der akzeptablen Dateilänge in Bytes)
    • Dateierweiterungsfilter (nur Dateien, die mit der Liste der angegebenen Dateierweiterungen übereinstimmen, werden indiziert)
    • Logisch nicht Filter (umkehren die Logik eines internen Filters)
    • Logischer und Filter (zusammengesetzter Filter, bei dem alle internen Filter erfolgreich sein müssen)
    • Logischer oder Filter (zusammengesetzter Filter, für das mindestens ein interner Filter erfolgreich ist)
  • Rename any indexed document without requiring it to reindex during the update

  • Fügen Sie indizierte Dokumente zusätzliche Felder hinzu, um mehr Metadaten zu verbinden.

  • Fähigkeit, den Dokumenttext im Index zu speichern.

Suchen Sie API -Funktionen

  • Supports various types of searches, such as:

    • Boolesche Suche

      • Unterstützt und, oder nicht, nicht Betreiber.
      • Kombinieren Sie mehrere boolesche Suchkurys, um Comlex Qurys zu komponieren.
    • Fallempfindliche Suche betrachtet Groß- und Kleinbuchstaben als unterschiedlich.

    • DATE RANGESSUCHE Suchanfragen basierend auf dem bereitgestellten Datumsbereich im angegebenen Datumsformat.

    • Facettensuchung nur in bestimmten Feldern anstelle von ganzem Dokument sucht.

    • Ungenaue Suche -Suche, die falsche Schreibwörter mit Fuzzy Logic korrekt erkennt.

    • Homophon -Suche Suche nach Wörtern, die in Ton (Aussprache) dem durchsuchten Wort ähnlich sind.

  • Rufen Sie den Text mit indizierten Dokumenten im Format “html` ab.

  • Apply various filters while searching documents, such as:

    • Dateipfadfilter (REGEX anwenden, um die Dateien mit vollständigen Pfaden abzurufen, die dem angegebenen Muster entsprechen)
    • Dateierweiterungsfilter (gibt die Dateien zurück, die mit der Liste der angegebenen Dateierweiterungen übereinstimmen)
    • Attributfilter (gibt die Dateien zurück, mit denen die angegebenen Attribute zugeordnet sind)
    • Kombinierte Filter (anwenden Verbundfilter anwenden und nicht komplexe Abfragen zusammenstellen)
  • Nach der Suche können die gefundenen resultierenden Wörter und Phrasen innerhalb des Dokumentinhalts hervorgehoben werden.

  • Aktivieren Sie die Option Tastaturlayoutkorrektur, um die nicht unterstützten Schlüsselwortzeichen durch die tatsächlichen Zeichen zu ersetzen.

  • Suche nach verschiedenen Wortformen wie Substantiv, Adjektiv, Formen von Verben usw.

Search Dictionary Management API -Funktionen

  • Various types of Wörterbücher can be used & managed, such as:
    • Alias ​​Dictionary
    • Alphabet -Wörterbuch
    • Charakterersatzwörterbuch
    • Dokumentkennwörter Wörterbuch
    • Homophon -Wörterbuch
    • Rechtschreibkorrektur
    • Stoppen Sie das Wortwörterbuch an
    • Synonym -Wörterbuch
    • Anbieter von Wortformen

unterstützte Dokumentsuchdateiformate

Der Inhaltsvorgang wird für die folgenden Dateiformate unterstützt: Microsoft Word & reg;: doc/dot/docx/docm/dotx/dotm/rtf/txt
OpenOffice Writer & Reg;: ODT/OTT
**Microsoft Excel & Reg; OpenOffice Calc & Reg;: ODS/OTS/CSV/TSV/TRAPTHEETML
Microsoft PowerPoint & reg;: ppt/pps/ptpx/pptm/potx/ptm/ppsx/ppsm
OpenOffice impress & reg;: odp
Microsoft Outlook & Reg;: PST/ost/eml/msg
Apple & Reg; Mail -Nachricht: emlx
Microsoft OneNote & reg;: eins
markup: html/xhtml/mhtml/md/xml
eBook: chm/epub/fb2 \
Archiv: ZIP
Festes Layout: PDF Die Indexierungsmetadatenoperation wird für die folgenden Dateiformate unterstützt: Microsoft Word & reg;: doc/dot/docx/docm/dotx/dotm/rtf/txt
OpenOffice Writer & Reg;: ODT/OTT
**Microsoft Excel & Reg; OpenOffice Calc & Reg;: ODS/OTS/CSV/TSV/TRAPTHEETML
Microsoft PowerPoint & reg;: ppt/pps/ptpx/pptm/potx/ptm/ppsx/ppsm
OpenOffice impress & reg;: odp
Microsoft Outlook & Reg;: PST/ost/eml/msg
Apple & Reg; Mail -Nachricht: emlx
Microsoft OneNote & reg;: eins
Microsoft Project & Reg;: MPP
Microsoft Visio & Reg;: VSD/VSS
markup: html/xhtml/mhtml/md/xml
eBook: chm/epub/fb2 \
Archiv: ZIP
Audio: mp3/wav
Video: avi/mov/qt/flv/asf
Bild: bmp/gif/jp2/png/webp/tiff/jpg/djvu
Adobe Photoshop & reg;: PSD
Medizinische Bildgebung: dcm/dicom \
Metadaten: EMF/WMF
Behobene Layout: pdf
Bittorrent: Torrent

Details und Einschränkungen finden Sie unter Unterstützte Dokumentformate.

System Anforderungen

  • Microsoft Windows: Windows Desktop & Server (x86, x64), Microsoft Azure
  • macOS: Mac OS x
  • Linux: Ubuntu, OpenSuse, Centos und andere
  • Java -Versionen: J2SE 7.0 (1,7), `J2SE 8.0 (1,8) oder höher (zum Beispiel Java 10)

GroupDocs.Search für Java erfordert keine externe Software oder ein Drittanbieter -Tool. Folgen Sie einfach einem der in Installation und Konfiguration beschriebenen Wege.

Loslegen

GroupDocs veranstaltet alle Java -APIs am GroupDocs Repository. Sie können problemlos GroupDocs.search für Java -API direkt in Ihren Maven -Projekten mit einfachen Konfigurationen verwenden. Für die detaillierten Anweisungen besuchen Sie bitte Installation vom GroupDocs -Repository mit Maven Dokumentationsseite.

Beispiel -Java -Code für die Verwendung der gemischten Zeichen in der Suche in der Suchindexierung

String indexFolder = "c:\\MyIndex\\";
String documentFolder = "c:\\MyDocuments\\";

// Creating an index in the specified folder
Index index = new Index(indexFolder);

// Setting hyphen character type to blended
index.getDictionaries().getAlphabet().setRange(new char[] { '-' }, CharacterType.Blended);

// Indexing documents from the specified folder
index.add(documentFolder);

// Searching in the index
SearchResult result1 = index.search("Elliot-Murray-Kynynmound");
SearchResult result2 = index.search("Elliot");
SearchResult result3 = index.search("Murray");
SearchResult result4 = index.search("Kynynmound");

Produktseite | Dokumente | Demos | API -Referenz | Beispiele | Blog | Freie Unterstützung | Vorübergehende Lizenz

VersionRelease Date
22.1130. November 2022
22.1024. Oktober 2022
21.225. Januar 2022
20.825. Januar 2022
19.225. Januar 2022
18.1225. Januar 2022
21.818. August 2021
21.318. März 2021
20.1119. November 2020
20.623. Juni 2020
20.416. April 2020
19.1211. Dezember 2019
19.5.115. Juli 2019
19.531. Mai 2019
19.37. März 2019
18.111. November 2018