<repositories>
<repository>
<id>repository.groupdocs.com</id>
<name>GroupDocs Repository</name>
<url>https://releases.groupdocs.com/java/repo/</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-search</artifactId>
<version>22.11</version>
</dependency>
</dependencies>
repositories {
maven {
url 'https://releases.groupdocs.com/java/repo/'
}
}
compile(group: 'com.groupdocs', name: 'groupdocs-search', version: '22.11')
<ivysettings>
<settings defaultResolver="chain"/>
<resolvers>
<chain name="chain">
<ibiblio name="GroupDocs Repository" m2compatible="true" root="https://releases.groupdocs.com/java/repo/"/>
</chain>
</resolvers>
</ivysettings>
<dependency org="com.groupdocs" name="groupdocs-search" rev="22.11">
<artifact name="groupdocs-search" ext="jar"/>
</dependency>
resolvers += Resolver.url("GroupDocs Repository", url("https://releases.groupdocs.com/java/repo/"))
libraryDependencies += "com.groupdocs" % "groupdocs-search" % "22.11"
API Java de código alto a los documentos de índice y búsqueda
Página del producto | Documentos | Población | Referencia de API | Ejemplos | Blog | Soporte gratuito | Licencia temporal
GroupdocsSearch para Java es una API Java local para ayudar a indexar el contenido y los metadatos del documento, realizar búsquedas (booleanos, facetados, difusos, caseros) y extracción de texto personalizado, aplicar filtros de búsqueda y resaltar resultados.
Search & Index Java Funciones de API locales
Las características de la API de indexación
Cree el índice de búsqueda, aplique la configuración del índice y suscríbase a los eventos de índice.
Admite documentos de indexación desde el archivo, la transmisión o una estructura de datos.
Fusionar múltiples índices de búsqueda en uno.
Support is available for:
- Campos Adicionales
- Caracteres regulares (separadores y letras)
- Caracteres combinados (estos caracteres especiales se indexan como separadores y letras, por ejemplo, guión)
- caracteres indexados como una palabra completa
- Reemplazo de personajes durante la indexación
- Extractores de texto personalizados
Index files protected with password
Proporciona las opciones de índice compacto y de metadatos.
Admite un nivel diferente de compresión para guardar el texto extraído en el índice.
Capacidad para filtrar documentos durante la indexación.
Opción para eliminar rutas indexadas del índice.
Mientras indexa, convierta todos los caracteres en minúsculas o elimine a los diacríticos del texto utilizando el reemplazo de caracteres.
Capacidad para especificar el conjunto deseado de caracteres como letras.
Implemente el soporte para un extractor de texto personalizado y luego use ese extractor personalizado para la indexación.
Eliminar o eliminar los documentos deseados del índice de búsqueda.
Eliminar o eliminar carpetas y archivos indexados del índice.
Marque documentos indexados con etiquetas de texto sin volver a indicar.
Filtrar documentos durante la búsqueda a través de atributos del documento aplicado.
Aplicar varios tipos de filtros mientras se indexan, such as:
- Filtro de tiempo de creación (es decir, omitir archivos creados antes/más tarde que una fecha determinada, o fuera del rango de fechas proporcionado)
- Filtro de tiempo de modificación (igual que el filtro de tiempo de creación pero funciona en la fecha de modificación del documento)
- Filtro de ruta de archivo (aplique regex para omitir los archivos con rutas completas que no coinciden con el patrón especificado)
- Filtro de longitud de archivo (especifique el límite inferior/superior, o el rango de longitud de archivo aceptable en bytes)
- Filtro de extensión de archivo (solo se indexarán los archivos que coinciden con la lista de extensiones de archivo especificadas)
- lógico no filtro (invertir la lógica de un filtro interno)
- Lógico y filtro (filtro compuesto que requiere que todos los filtros internos tengan éxito)
- lógico o filtro (filtro compuesto que requiere al menos un filtro interno para tener éxito)
Rename any indexed document without requiring it to reindex during the update
Agregue campos adicionales a documentos indexados para asociar más metadatos.
Capacidad para guardar el texto del documento en el índice.
Buscando características de API
Supports various types of searches, such as:
- Soporte y, o no operadores.
- Combine múltiples Quries de búsqueda booleanos para componer Quries Comlex.
Búsqueda sensible a mayúsculas considera los personajes mayúsculas y minúsculas como distintos.
Búsqueda de rango de fechas Búsquedas basadas en el rango de fecha proporcionado en formato de fecha especificado.
Facetas de búsqueda Búsquedas solo dentro de los campos especificados en lugar de un documento completo.
Búsqueda borrosa Búsqueda que detecta palabras de ortografía incorrecta correctamente usando Logic Fuzzy.
Búsqueda de homófono Busque palabras que sean similares en sonido (pronunciación) a la palabra buscada.
Obtenga el texto de documentos indexados en el formato
HTML
.Apply various filters while searching documents, such as:
- Filtro de ruta de archivo (aplique Regex para obtener los archivos con rutas completas que coincidan con el patrón especificado)
- Filtro de extensión de archivo (devuelve los archivos que coinciden con la lista de extensiones de archivo especificadas)
- Filtro de atributos (devuelve los archivos con los que están asociados los atributos especificados)
- Filtros combinados (aplique filtros compuestos y, o no para componer consultas complejas)
Después de la búsqueda, se pueden resaltar las palabras y frases resultantes dentro del contenido del documento.
Habilite la opción Corrección del diseño del teclado para reemplazar los caracteres de palabras clave no compatibles con los caracteres reales.
Buscar diferentes formularios de palabras, como, sustantivo, adjetivo, formas de verbos, etc.
Características de la API de gestión del diccionario de búsqueda
- Various types of diccionarios can be used & managed, such as:
- Diccionario de alias
- Diccionario de alfabeto
- Diccionario de reemplazos de personajes
- Diccionario de documentos de contraseñas
- Diccionario de homófono
- Corrector de ortografía
- Diccionario de parada de palabras
- Diccionario de sinónimo
- Proveedor de formularios de palabras
formatos de archivo de búsqueda de documentos compatibles
La operación de contenido de indexación es compatible con los siguientes formatos de archivo:
Microsoft Word & Reg ;: doc/dot/docx/docm/dotx/dotm/rtf/txt
OpenOffice Writer & Reg ;: ODT/OTT
Microsoft Excel & Reg ;: xls/xlt/xlsx/xlsm/xlsb/xltx/xltm/xla/xlam
OpenOffice Calc & Reg ;: ODS/OTS/CSV/TSV/STARPSheetMl
Microsoft PowerPoint & Reg ;: PPT/PPS/POT/PPTX/PPTM/POTX/POTM/PPSX/PPSM
OpenOffice Impress & Reg;: ODP
Microsoft Outlook & Reg ;: PST/OST/EML/MSG
Apple & Reg; Mensaje de correo: EMLX
Microsoft OneNote & Reg;: One
Markup: html/xhtml/mhtml/md/xml
Ebook: CHM/EPUB/FB2
Archivo: Zip
Diseño fijo: PDF
La operación de metadatos de indexación es compatible con los siguientes formatos de archivo:
Microsoft Word & Reg ;: doc/dot/docx/docm/dotx/dotm/rtf/txt
OpenOffice Writer & Reg ;: ODT/OTT
Microsoft Excel & Reg ;: xls/xlt/xlsx/xlsm/xlsb/xltx/xltm/xla/xlam
OpenOffice Calc & Reg ;: ODS/OTS/CSV/TSV/STARPSheetMl
Microsoft PowerPoint & Reg ;: PPT/PPS/POT/PPTX/PPTM/POTX/POTM/PPSX/PPSM
OpenOffice Impress & Reg;: ODP
Microsoft Outlook & Reg ;: PST/OST/EML/MSG
Apple & Reg; Mensaje de correo: EMLX
Microsoft OneNote & Reg;: One
Microsoft Project & Reg ;: MPP
Microsoft Visio & Reg ;: VSD/VSS
Markup: html/xhtml/mhtml/md/xml
Ebook: CHM/EPUB/FB2
Archivo: Zip
audio: mp3/wav
Video: avi/mov/qt/flv/asf
Imagen: bmp/gif/jp2/png/webp/tiff/jpg/djvu
Adobe Photoshop & Reg ;: PSD
Imágenes médicas: DCM/DICOM
Metadatos: EMF/WMF
Diseño fijo: PDF
bitTorrent: torrent
Para obtener detalles y limitaciones, visite Formatos de documento compatibles.
Requisitos del sistema
- Microsoft Windows: Windows Desktop & Server (x86, x64), Microsoft Azure
- macOS: Mac OS X
- Linux: Ubuntu, OpenSuse, CentOS y otros
- Versiones Java:
J2SE 7.0 (1.7)
,J2SE 8.0 (1.8)
o superior (por ejemplo Java 10)
Groupdocs.Search para Java no requiere que se instale ningún software externo o herramienta de terceros. Simplemente siga una de las formas como se describe en Instalacion y configuracion.
Empezar
Groupdocs aloja todas las API de Java en el Repositorio de grupos. Puede usar fácilmente Groupdocs.Search para Java API directamente en sus proyectos Maven con configuraciones simples. Para las instrucciones detalladas, visite la página de documentación Instalación desde el repositorio de Groupdocs utilizando Maven.
Ejemplo de código Java para usar los caracteres combinados en la indexación de búsqueda
String indexFolder = "c:\\MyIndex\\";
String documentFolder = "c:\\MyDocuments\\";
// Creating an index in the specified folder
Index index = new Index(indexFolder);
// Setting hyphen character type to blended
index.getDictionaries().getAlphabet().setRange(new char[] { '-' }, CharacterType.Blended);
// Indexing documents from the specified folder
index.add(documentFolder);
// Searching in the index
SearchResult result1 = index.search("Elliot-Murray-Kynynmound");
SearchResult result2 = index.search("Elliot");
SearchResult result3 = index.search("Murray");
SearchResult result4 = index.search("Kynynmound");
Página del producto | Documentos | Población | Referencia de API | Ejemplos | Blog | Soporte gratuito | Licencia temporal
Version | Release Date |
---|---|
22.11 | 30 de noviembre de 2022 |
22.10 | 24 de octubre de 2022 |
21.2 | 25 de enero de 2022 |
20.8 | 25 de enero de 2022 |
19.2 | 25 de enero de 2022 |
18.12 | 25 de enero de 2022 |
21.8 | 18 de agosto de 2021 |
21.3 | 18 de marzo de 2021 |
20.11 | 19 de noviembre de 2020 |
20.6 | 23 de junio de 2020 |
20.4 | 16 de abril de 2020 |
19.12 | 11 de diciembre de 2019 |
19.5.1 | 15 de julio de 2019 |
19.5 | 31 de mayo de 2019 |
19.3 | 7 de marzo de 2019 |
18.11 | 1 de noviembre de 2018 |
GroupDocs.Total GroupDocs.Search API on premise DOC DOT DOCX DOCM DOTX DOTM RTF TXT ODT OTT XLS XLT XLSX XLSM XLSB XLTX XLTM XLA XLAM ODS OTS CSV TSV SpreadsheetML PPT PPS POT PPTX PPTM POTX POTM PPSX PPSM ODP PST OST EML MSG EMLX ONE MPP VSD VSS HTML XHTML MHTML MD XML CHM EPUB FB2 ZIP MP3 WAV AVI MOV QT FLV ASF BMP GIF JP2 PNG WEBP TIFF JPG DJVU PSD DCM DICOM EMF WMF PDF TORRENT search-index regular characters blended regular-characters blended-characters index password protected password-protected compression extract extraction diacritics extractor indexing attributes filter regex regular expression regular-expression faceted search fuzzy homophone dictionary alias alphabet synonym windows macOS Linux J2SE document automation