<repositories>
   <repository>
      <id>repository.groupdocs.com</id>
      <name>GroupDocs Repository</name>
      <url>https://releases.groupdocs.com/java/repo/</url>
   </repository>
</repositories>

<dependencies>
   <dependency>
      <groupId>com.groupdocs</groupId>
      <artifactId>groupdocs-search</artifactId>
      <version>22.11</version>
   </dependency>
</dependencies>
copied!  
repositories {
    maven {
        url 'https://releases.groupdocs.com/java/repo/'
    }
}

compile(group: 'com.groupdocs', name: 'groupdocs-search', version: '22.11')
copied!  
<ivysettings>
    <settings defaultResolver="chain"/>
    <resolvers>
        <chain name="chain">
            <ibiblio name="GroupDocs Repository" m2compatible="true" root="https://releases.groupdocs.com/java/repo/"/>
        </chain>
    </resolvers>
</ivysettings>

<dependency org="com.groupdocs" name="groupdocs-search" rev="22.11">
   <artifact name="groupdocs-search" ext="jar"/>
</dependency>
copied!  
resolvers += Resolver.url("GroupDocs Repository", url("https://releases.groupdocs.com/java/repo/"))

libraryDependencies += "com.groupdocs" % "groupdocs-search" % "22.11"
copied!  

Code élevé API Java pour indexer et rechercher des documents

main-banner

Page de produit | Docs | Démos | Référence de l’API | Exemples | Blog | Support gratuit | Licence temporaire

GroupDocsSearch pour Java est une API Java sur site pour aider à indexer le contenu et les métadonnées du document, effectuer des recherches (booléen, facetted, flou, homephone) et extraction de texte personnalisée, appliquer des filtres de recherche et mettre en évidence les résultats.

Rechercher et index des fonctionnalités de l’API sur site java

Indexation des fonctionnalités d’API

  • Créer une index de recherche, appliquer les paramètres de l’index et vous abonner aux événements d’index.

  • prend en charge l’indexation des documents du fichier, du flux ou d’une structure de données.

  • Fusionner plusieurs index de recherche en un seul.

  • Support is available for:

    • champs supplémentaires
    • caractères réguliers (séparateurs et lettres)
    • Les caractères mélangés (ces caractères spéciaux sont indexés en tant que séparateurs ainsi que des lettres, par ex. Conthèle)
    • caractères indexés comme un mot entier
    • Remplacement du caractère pendant l’indexation
    • Extracteurs de texte personnalisés
  • Index files protected with password

  • Fournit les options d’index compacte et de métadonnées.

  • prend en charge différents niveaux de compression pour enregistrer du texte extrait dans l’index.

  • Capacité à filtrer les documents pendant l’indexation.

  • Option pour supprimer les chemins indexés de l’index.

  • Pendant l’indexation, convertissez tous les caractères en minuscules ou supprimez les diacritiques du texte à l’aide du remplacement des caractères.

  • Capacité à Spécifiez l’ensemble de caractères souhaité comme lettres.

  • Implémentez la prise en charge d’un extracteur de texte personnalisé, puis utilisez cet extracteur personnalisé pour l’indexation.

  • Supprimer ou supprimer les documents souhaités de l’index de recherche.

  • Supprimez ou supprimez les dossiers et fichiers indexés de l’index.

  • Marquez des documents indexés avec des étiquettes de texte sans réindexer.

  • Filtrez des documents lors de la recherche via des attributs de documents appliqués.

  • Appliquer différents types de filtres pendant l’indexation, such as:

    • Filtre de temps de création (c’est-à-dire les fichiers de saut créés plus tôt / plus tard qu’une certaine date, ou en dehors de la plage de dates fournie)
    • Filtre de temps de modification (Identique au filtre de temps de création mais fonctionne à la date de modification du document)
    • Filtre de chemin de fichier (appliquez Regex pour sauter les fichiers avec des chemins complets ne correspondant pas au modèle spécifié)
    • Filtre de longueur de fichier (spécifiez la limite inférieure / supérieure, ou la plage de longueur de fichier acceptable en octets)
    • Filtre d’extension de fichier (seuls les fichiers correspondant à la liste des extensions de fichiers spécifiés seront indexés)
    • Logical pas filtre (inversez la logique d’un filtre interne)
    • logique et filtre (filtre composite qui nécessite que tous les filtres internes réussissent)
    • logique ou filtre (filtre composite qui nécessite au moins un filtre interne pour réussir)
  • Rename any indexed document without requiring it to reindex during the update

  • Ajouter des champs supplémentaires aux documents indexés pour associer plus de métadonnées.

  • Capacité à enregistrer le texte du document dans l’index.

Recherche de fonctionnalités d’API

  • Supports various types of searches, such as:

  • Récupérez le texte des documents indexés au format HTML.

  • Apply various filters while searching documents, such as:

    • Filtre de chemin de fichier (appliquez Regex pour récupérer les fichiers avec des chemins complets correspondant au modèle spécifié)
    • Filtre d’extension de fichier (renvoie les fichiers correspondant à la liste des extensions de fichiers spécifiées)
    • Filtre d’attribut (renvoie les fichiers avec lesquels les attributs spécifiés sont associés)
    • Filtres combinés (appliquez des filtres composites et, ou, pour ne pas composer des requêtes complexes)
  • Après la recherche, les mots et phrases résultant dans le document peuvent être mis en évidence.

  • Activez l’option Correction de disposition du clavier pour remplacer les caractères de mots clés non pris en charge par les caractères réels.

  • Recherche de différentes formes de mots, comme, nom, adjectif, formes de verbes, etc.

Caractéristiques de l’API de gestion du dictionnaire de recherche

  • Various types of dictionnaires can be used & managed, such as:
    • Alias ​​Dictionary
    • Dictionnaire alphabet
    • Dictionnaire des remplacements de caractère
    • Documer les mots de passe dictionnaire
    • Dictionnaire homophone
    • Correcteur d’orthographe
    • Stop Word Dictionary
    • Dictionnaire synonyme
    • fournisseur de formulaires de mots

Formats de fichiers de recherche de documents pris en charge

L’opération de contenu d’indexation est prise en charge pour les formats de fichiers suivants: Microsoft Word & Reg;: doc / dot / docx / docm / dotx / dotm / rtf / txt
OpenOffice Writer & Reg;: odt / ott
Microsoft Excel & Reg;: xls / xlt / xlsx / xlsm / xlsb / xltx / xltm / xla / xlam
OpenOffice Calc & Reg;: ODS / OTS / CSV / TSV / SPESSARETHETHEETML
Microsoft PowerPoint & Reg;: PPT / PPS / POT / PPTX / PPTM / POTX / POTM / PPSX / PPSM
OpenOffice Impress & Reg;: ODP
Microsoft Outlook & Reg;: PST / OST / EML / MSG
Apple & Reg; Message du courrier: emlx
Microsoft OneNote & Reg;: un
Marquage: html / xhtml / mhtml / md / xml
ebook: chm / epub / fb2
Archive: zip
Disposition fixe: PDF L’opération d’indexation des métadonnées est prise en charge pour les formats de fichiers suivants: Microsoft Word & Reg;: doc / dot / docx / docm / dotx / dotm / rtf / txt
OpenOffice Writer & Reg;: odt / ott
Microsoft Excel & Reg;: xls / xlt / xlsx / xlsm / xlsb / xltx / xltm / xla / xlam
OpenOffice Calc & Reg;: ODS / OTS / CSV / TSV / SPESSARETHETHEETML
Microsoft PowerPoint & Reg;: PPT / PPS / POT / PPTX / PPTM / POTX / POTM / PPSX / PPSM
OpenOffice Impress & Reg;: ODP
Microsoft Outlook & Reg;: PST / OST / EML / MSG
Apple & Reg; Message du courrier: emlx
Microsoft OneNote & Reg;: un
Microsoft Project & Reg;: MPP
Microsoft Visio & Reg;: VSD / VSS
Marquage: html / xhtml / mhtml / md / xml
ebook: chm / epub / fb2
Archive: zip
Audio: mp3 / wav
Vidéo: Avi / mov / qt / flv / asf
Image: bmp / ​​gif / jp2 / png / webp / tiff / jpg / djvu
Adobe Photoshop & Reg;: PSD
Imagerie médicale: DCM / DICOM
Métadonnées: EMF / WMF
Disposition fixe: PDF
BitTorrent: Torrent

Pour plus de détails et limitations, veuillez visiter, Formats de documents pris en charge.

Configuration requise

  • Microsoft Windows: Windows Desktop & Server (x86, x64), Microsoft Azure
  • macOS: mac os x
  • Linux: Ubuntu, OpenSuse, Centos et autres
  • Versions Java: J2SE 7.0 (1.7), J2SE 8.0 (1.8) ou au-dessus (par exemple Java 10)

GroupDocs.Search pour Java ne nécessite pas d’installation de logiciel ou de tiers externe. Suivez simplement l’une des voies décrites dans Installation et configuration.

Commencer

GroupDocs héberge toutes les API Java au Référentiel de groupes. Vous pouvez facilement utiliser GroupDocs.Search pour Java API directement dans vos projets Maven avec des configurations simples. Pour les instructions détaillées, veuillez visiter la page de documentation Installation du référentiel GroupDocs à l’aide de maven.

Exemple de code Java pour utiliser les caractères mélangés dans l’indexation de la recherche

String indexFolder = "c:\\MyIndex\\";
String documentFolder = "c:\\MyDocuments\\";

// Creating an index in the specified folder
Index index = new Index(indexFolder);

// Setting hyphen character type to blended
index.getDictionaries().getAlphabet().setRange(new char[] { '-' }, CharacterType.Blended);

// Indexing documents from the specified folder
index.add(documentFolder);

// Searching in the index
SearchResult result1 = index.search("Elliot-Murray-Kynynmound");
SearchResult result2 = index.search("Elliot");
SearchResult result3 = index.search("Murray");
SearchResult result4 = index.search("Kynynmound");

Page de produit | Docs | Démos | Référence de l’API | Exemples | Blog | Support gratuit | Licence temporaire

VersionRelease Date
22.1130 novembre 2022
22.1024 octobre 2022
21.225 janvier 2022
20.825 janvier 2022
19.225 janvier 2022
18.1225 janvier 2022
21.818 août 2021
21.318 mars 2021
20.1119 novembre 2020
20.623 juin 2020
20.416 avril 2020
19.1211 décembre 2019
19.5.115 juillet 2019
19.531 mai 2019
19.37 mars 2019
18.111 novembre 2018