<repositories>
<repository>
<id>repository.groupdocs.com</id>
<name>GroupDocs Repository</name>
<url>https://releases.groupdocs.com/java/repo/</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-search</artifactId>
<version>22.11</version>
</dependency>
</dependencies>
repositories {
maven {
url 'https://releases.groupdocs.com/java/repo/'
}
}
compile(group: 'com.groupdocs', name: 'groupdocs-search', version: '22.11')
<ivysettings>
<settings defaultResolver="chain"/>
<resolvers>
<chain name="chain">
<ibiblio name="GroupDocs Repository" m2compatible="true" root="https://releases.groupdocs.com/java/repo/"/>
</chain>
</resolvers>
</ivysettings>
<dependency org="com.groupdocs" name="groupdocs-search" rev="22.11">
<artifact name="groupdocs-search" ext="jar"/>
</dependency>
resolvers += Resolver.url("GroupDocs Repository", url("https://releases.groupdocs.com/java/repo/"))
libraryDependencies += "com.groupdocs" % "groupdocs-search" % "22.11"
Code élevé API Java pour indexer et rechercher des documents
Page de produit | Docs | Démos | Référence de l’API | Exemples | Blog | Support gratuit | Licence temporaire
GroupDocsSearch pour Java est une API Java sur site pour aider à indexer le contenu et les métadonnées du document, effectuer des recherches (booléen, facetted, flou, homephone) et extraction de texte personnalisée, appliquer des filtres de recherche et mettre en évidence les résultats.
Rechercher et index des fonctionnalités de l’API sur site java
Indexation des fonctionnalités d’API
Créer une index de recherche, appliquer les paramètres de l’index et vous abonner aux événements d’index.
prend en charge l’indexation des documents du fichier, du flux ou d’une structure de données.
Fusionner plusieurs index de recherche en un seul.
Support is available for:
- champs supplémentaires
- caractères réguliers (séparateurs et lettres)
- Les caractères mélangés (ces caractères spéciaux sont indexés en tant que séparateurs ainsi que des lettres, par ex. Conthèle)
- caractères indexés comme un mot entier
- Remplacement du caractère pendant l’indexation
- Extracteurs de texte personnalisés
Index files protected with password
Fournit les options d’index compacte et de métadonnées.
prend en charge différents niveaux de compression pour enregistrer du texte extrait dans l’index.
Capacité à filtrer les documents pendant l’indexation.
Option pour supprimer les chemins indexés de l’index.
Pendant l’indexation, convertissez tous les caractères en minuscules ou supprimez les diacritiques du texte à l’aide du remplacement des caractères.
Capacité à Spécifiez l’ensemble de caractères souhaité comme lettres.
Implémentez la prise en charge d’un extracteur de texte personnalisé, puis utilisez cet extracteur personnalisé pour l’indexation.
Supprimer ou supprimer les documents souhaités de l’index de recherche.
Supprimez ou supprimez les dossiers et fichiers indexés de l’index.
Marquez des documents indexés avec des étiquettes de texte sans réindexer.
Filtrez des documents lors de la recherche via des attributs de documents appliqués.
Appliquer différents types de filtres pendant l’indexation, such as:
- Filtre de temps de création (c’est-à-dire les fichiers de saut créés plus tôt / plus tard qu’une certaine date, ou en dehors de la plage de dates fournie)
- Filtre de temps de modification (Identique au filtre de temps de création mais fonctionne à la date de modification du document)
- Filtre de chemin de fichier (appliquez Regex pour sauter les fichiers avec des chemins complets ne correspondant pas au modèle spécifié)
- Filtre de longueur de fichier (spécifiez la limite inférieure / supérieure, ou la plage de longueur de fichier acceptable en octets)
- Filtre d’extension de fichier (seuls les fichiers correspondant à la liste des extensions de fichiers spécifiés seront indexés)
- Logical pas filtre (inversez la logique d’un filtre interne)
- logique et filtre (filtre composite qui nécessite que tous les filtres internes réussissent)
- logique ou filtre (filtre composite qui nécessite au moins un filtre interne pour réussir)
Rename any indexed document without requiring it to reindex during the update
Ajouter des champs supplémentaires aux documents indexés pour associer plus de métadonnées.
Capacité à enregistrer le texte du document dans l’index.
Recherche de fonctionnalités d’API
Supports various types of searches, such as:
- supports et, ou non opérateurs.
- Combinez plusieurs fleur de recherche booléens pour composer les fleurs comlex.
Recherche sensible à la casse considère les caractères majuscules et minuscules comme distincts.
Recherche de plages de dates Recherches basées sur la plage de dates fournies au format de date spécifié.
Recherche à facettes Recherche uniquement dans des champs spécifiés au lieu d’un document entier.
Recherche floue Recherche qui détecte correctement les mots d’orthographe à l’aide de la logique floue.
Recherche d’homophone Recherche de mots similaires en son (prononciation) au mot recherché.
Récupérez le texte des documents indexés au format
HTML
.Apply various filters while searching documents, such as:
- Filtre de chemin de fichier (appliquez Regex pour récupérer les fichiers avec des chemins complets correspondant au modèle spécifié)
- Filtre d’extension de fichier (renvoie les fichiers correspondant à la liste des extensions de fichiers spécifiées)
- Filtre d’attribut (renvoie les fichiers avec lesquels les attributs spécifiés sont associés)
- Filtres combinés (appliquez des filtres composites et, ou, pour ne pas composer des requêtes complexes)
Après la recherche, les mots et phrases résultant dans le document peuvent être mis en évidence.
Activez l’option Correction de disposition du clavier pour remplacer les caractères de mots clés non pris en charge par les caractères réels.
Recherche de différentes formes de mots, comme, nom, adjectif, formes de verbes, etc.
Caractéristiques de l’API de gestion du dictionnaire de recherche
- Various types of dictionnaires can be used & managed, such as:
- Alias Dictionary
- Dictionnaire alphabet
- Dictionnaire des remplacements de caractère
- Documer les mots de passe dictionnaire
- Dictionnaire homophone
- Correcteur d’orthographe
- Stop Word Dictionary
- Dictionnaire synonyme
- fournisseur de formulaires de mots
Formats de fichiers de recherche de documents pris en charge
L’opération de contenu d’indexation est prise en charge pour les formats de fichiers suivants:
Microsoft Word & Reg;: doc / dot / docx / docm / dotx / dotm / rtf / txt
OpenOffice Writer & Reg;: odt / ott
Microsoft Excel & Reg;: xls / xlt / xlsx / xlsm / xlsb / xltx / xltm / xla / xlam
OpenOffice Calc & Reg;: ODS / OTS / CSV / TSV / SPESSARETHETHEETML
Microsoft PowerPoint & Reg;: PPT / PPS / POT / PPTX / PPTM / POTX / POTM / PPSX / PPSM
OpenOffice Impress & Reg;: ODP
Microsoft Outlook & Reg;: PST / OST / EML / MSG
Apple & Reg; Message du courrier: emlx
Microsoft OneNote & Reg;: un
Marquage: html / xhtml / mhtml / md / xml
ebook: chm / epub / fb2
Archive: zip
Disposition fixe: PDF
L’opération d’indexation des métadonnées est prise en charge pour les formats de fichiers suivants:
Microsoft Word & Reg;: doc / dot / docx / docm / dotx / dotm / rtf / txt
OpenOffice Writer & Reg;: odt / ott
Microsoft Excel & Reg;: xls / xlt / xlsx / xlsm / xlsb / xltx / xltm / xla / xlam
OpenOffice Calc & Reg;: ODS / OTS / CSV / TSV / SPESSARETHETHEETML
Microsoft PowerPoint & Reg;: PPT / PPS / POT / PPTX / PPTM / POTX / POTM / PPSX / PPSM
OpenOffice Impress & Reg;: ODP
Microsoft Outlook & Reg;: PST / OST / EML / MSG
Apple & Reg; Message du courrier: emlx
Microsoft OneNote & Reg;: un
Microsoft Project & Reg;: MPP
Microsoft Visio & Reg;: VSD / VSS
Marquage: html / xhtml / mhtml / md / xml
ebook: chm / epub / fb2
Archive: zip
Audio: mp3 / wav
Vidéo: Avi / mov / qt / flv / asf
Image: bmp / gif / jp2 / png / webp / tiff / jpg / djvu
Adobe Photoshop & Reg;: PSD
Imagerie médicale: DCM / DICOM
Métadonnées: EMF / WMF
Disposition fixe: PDF
BitTorrent: Torrent
Pour plus de détails et limitations, veuillez visiter, Formats de documents pris en charge.
Configuration requise
- Microsoft Windows: Windows Desktop & Server (x86, x64), Microsoft Azure
- macOS: mac os x
- Linux: Ubuntu, OpenSuse, Centos et autres
- Versions Java:
J2SE 7.0 (1.7)
,J2SE 8.0 (1.8)
ou au-dessus (par exemple Java 10)
GroupDocs.Search pour Java ne nécessite pas d’installation de logiciel ou de tiers externe. Suivez simplement l’une des voies décrites dans Installation et configuration.
Commencer
GroupDocs héberge toutes les API Java au Référentiel de groupes. Vous pouvez facilement utiliser GroupDocs.Search pour Java API directement dans vos projets Maven avec des configurations simples. Pour les instructions détaillées, veuillez visiter la page de documentation Installation du référentiel GroupDocs à l’aide de maven.
Exemple de code Java pour utiliser les caractères mélangés dans l’indexation de la recherche
String indexFolder = "c:\\MyIndex\\";
String documentFolder = "c:\\MyDocuments\\";
// Creating an index in the specified folder
Index index = new Index(indexFolder);
// Setting hyphen character type to blended
index.getDictionaries().getAlphabet().setRange(new char[] { '-' }, CharacterType.Blended);
// Indexing documents from the specified folder
index.add(documentFolder);
// Searching in the index
SearchResult result1 = index.search("Elliot-Murray-Kynynmound");
SearchResult result2 = index.search("Elliot");
SearchResult result3 = index.search("Murray");
SearchResult result4 = index.search("Kynynmound");
Page de produit | Docs | Démos | Référence de l’API | Exemples | Blog | Support gratuit | Licence temporaire
Version | Release Date |
---|---|
22.11 | 30 novembre 2022 |
22.10 | 24 octobre 2022 |
21.2 | 25 janvier 2022 |
20.8 | 25 janvier 2022 |
19.2 | 25 janvier 2022 |
18.12 | 25 janvier 2022 |
21.8 | 18 août 2021 |
21.3 | 18 mars 2021 |
20.11 | 19 novembre 2020 |
20.6 | 23 juin 2020 |
20.4 | 16 avril 2020 |
19.12 | 11 décembre 2019 |
19.5.1 | 15 juillet 2019 |
19.5 | 31 mai 2019 |
19.3 | 7 mars 2019 |
18.11 | 1 novembre 2018 |
GroupDocs.Total GroupDocs.Search API on premise DOC DOT DOCX DOCM DOTX DOTM RTF TXT ODT OTT XLS XLT XLSX XLSM XLSB XLTX XLTM XLA XLAM ODS OTS CSV TSV SpreadsheetML PPT PPS POT PPTX PPTM POTX POTM PPSX PPSM ODP PST OST EML MSG EMLX ONE MPP VSD VSS HTML XHTML MHTML MD XML CHM EPUB FB2 ZIP MP3 WAV AVI MOV QT FLV ASF BMP GIF JP2 PNG WEBP TIFF JPG DJVU PSD DCM DICOM EMF WMF PDF TORRENT search-index regular characters blended regular-characters blended-characters index password protected password-protected compression extract extraction diacritics extractor indexing attributes filter regex regular expression regular-expression faceted search fuzzy homophone dictionary alias alphabet synonym windows macOS Linux J2SE document automation