<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-search</artifactId>
<version>20.8</version>
</dependency>
compile(group: 'com.groupdocs', name: 'groupdocs-search', version: '20.8')
<dependency org="com.groupdocs" name="groupdocs-search" rev="20.8">
<artifact name="groupdocs-search" ext="jar"/>
</dependency>
libraryDependencies += "com.groupdocs" % "groupdocs-search" % "20.8"
API Java de código alto a los documentos de índice y búsqueda
Página del producto | Documentos | Población | Referencia de API | Ejemplos | Blog | Soporte gratuito | Licencia temporal
GroupdocsSearch para Java es una API Java local para ayudar a indexar el contenido y los metadatos del documento, realizar búsquedas (booleanos, facetados, difusos, caseros) y extracción de texto personalizado, aplicar filtros de búsqueda y resaltar resultados.
Search & Index Java Funciones de API locales
Las características de la API de indexación
Cree el índice de búsqueda, aplique la configuración del índice y suscríbase a los eventos de índice.
Admite documentos de indexación desde el archivo, la transmisión o una estructura de datos.
Fusionar múltiples índices de búsqueda en uno.
El soporte está disponible para:
- Campos Adicionales
- Caracteres regulares (separadores y letras)
- Caracteres combinados (estos caracteres especiales se indexan como separadores y letras, por ejemplo, guión)
- caracteres indexados como una palabra completa
- Reemplazo de personajes durante la indexación
- Extractores de texto personalizados
Archivos de índice protegidos con contraseña
Proporciona las opciones de índice compacto y de metadatos.
Admite un nivel diferente de compresión para guardar el texto extraído en el índice.
Capacidad para filtrar documentos durante la indexación.
Opción para eliminar rutas indexadas del índice.
Mientras indexa, convierta todos los caracteres en minúsculas o elimine a los diacríticos del texto utilizando el reemplazo de caracteres.
Capacidad para especificar el conjunto deseado de caracteres como letras.
Implemente el soporte para un extractor de texto personalizado y luego use ese extractor personalizado para la indexación.
Eliminar o eliminar los documentos deseados del índice de búsqueda.
Eliminar o eliminar carpetas y archivos indexados del índice.
Marque documentos indexados con etiquetas de texto sin volver a indicar.
Filtrar documentos durante la búsqueda a través de atributos del documento aplicado.
Aplicar varios tipos de filtros mientras se indexan, como:
- Filtro de tiempo de creación (es decir, omitir archivos creados antes/más tarde que una fecha determinada, o fuera del rango de fechas proporcionado)
- Filtro de tiempo de modificación (igual que el filtro de tiempo de creación pero funciona en la fecha de modificación del documento)
- Filtro de ruta de archivo (aplique regex para omitir los archivos con rutas completas que no coinciden con el patrón especificado)
- Filtro de longitud de archivo (especifique el límite inferior/superior, o el rango de longitud de archivo aceptable en bytes)
- Filtro de extensión de archivo (solo se indexarán los archivos que coinciden con la lista de extensiones de archivo especificadas)
- lógico no filtro (invertir la lógica de un filtro interno)
- Lógico y filtro (filtro compuesto que requiere que todos los filtros internos tengan éxito)
- lógico o filtro (filtro compuesto que requiere al menos un filtro interno para tener éxito)
Cambie el nombre de cualquier documento indexado sin exigir que reindexa durante la actualización
Agregue campos adicionales a documentos indexados para asociar más metadatos.
Capacidad para guardar el texto del documento en el índice.
Buscando características de API
Admite varios tipos de búsquedas, como:
- Soporte y, o no operadores.
- Combine múltiples Quries de búsqueda booleanos para componer Quries Comlex.
Búsqueda sensible a mayúsculas considera los caracteres mayúsculas y minúsculas como distintos.
Búsqueda de rango de fechas Búsquedas basadas en el rango de fecha proporcionado en formato de fecha especificado.
Facetas de búsqueda solo busca dentro de los campos especificados en lugar de un documento completo.
Búsqueda borrosa Búsqueda que detecta palabras de ortografía incorrecta correctamente usando Logic Fuzzy.
Búsqueda de homófono Busque palabras que sean similares en sonido (pronunciación) a la palabra buscada.
Obtenga el texto de documentos indexados en el formato
HTML
.Aplicar varios filtros mientras busca documentos, como:
- Filtro de ruta de archivo (aplique Regex para obtener los archivos con rutas completas que coincidan con el patrón especificado)
- Filtro de extensión de archivo (devuelve los archivos que coinciden con la lista de extensiones de archivo especificadas)
- Filtro de atributos (devuelve los archivos con los que están asociados los atributos especificados)
- Filtros combinados (aplique filtros compuestos y, o no para componer consultas complejas)
Después de la búsqueda, se pueden resaltar las palabras y frases resultantes dentro del contenido del documento.
Habilite la opción Corrección del diseño del teclado para reemplazar los caracteres de palabras clave no compatibles con los caracteres reales.
Buscar diferentes formularios de palabras, como, sustantivo, adjetivo, formas de verbos, etc.
Características de la API de gestión del diccionario de búsqueda
- Se pueden usar y administrar varios tipos de diccionarios, como:
- Diccionario de alias
- Diccionario de alfabeto
- Diccionario de reemplazos de personajes
- Diccionario de documentos de contraseñas
- Diccionario de homófono
- Corrector de ortografía
- Diccionario de parada de palabras
- Diccionario de sinónimo
- Proveedor de formularios de palabras
formatos de archivo de búsqueda de documentos compatibles
La operación de contenido de indexación es compatible con los siguientes formatos de archivo:
Microsoft Word & Reg ;: doc/dot/docx/docm/dotx/dotm/rtf/txt
OpenOffice Writer & Reg ;: ODT/OTT
Microsoft Excel & Reg ;: xls/xlt/xlsx/xlsm/xlsb/xltx/xltm/xla/xlam
OpenOffice Calc & Reg ;: ODS/OTS/CSV/TSV/STARPSheetMl
Microsoft PowerPoint & Reg ;: PPT/PPS/POT/PPTX/PPTM/POTX/POTM/PPSX/PPSM
OpenOffice Impress & Reg;: ODP
Microsoft Outlook & Reg ;: PST/OST/EML/MSG
Apple & Reg; Mensaje de correo: EMLX
Microsoft OneNote & Reg;: One
Markup: html/xhtml/mhtml/md/xml
Ebook: CHM/EPUB/FB2
Archivo: Zip
Diseño fijo: PDF
La operación de metadatos de indexación es compatible con los siguientes formatos de archivo:
Microsoft Word & Reg ;: doc/dot/docx/docm/dotx/dotm/rtf/txt
OpenOffice Writer & Reg ;: ODT/OTT
Microsoft Excel & Reg ;: xls/xlt/xlsx/xlsm/xlsb/xltx/xltm/xla/xlam
OpenOffice Calc & Reg ;: ODS/OTS/CSV/TSV/STARPSheetMl
Microsoft PowerPoint & Reg ;: PPT/PPS/POT/PPTX/PPTM/POTX/POTM/PPSX/PPSM
OpenOffice Impress & Reg;: ODP
Microsoft Outlook & Reg ;: PST/OST/EML/MSG
Apple & Reg; Mensaje de correo: EMLX
Microsoft OneNote & Reg;: One
Microsoft Project & Reg ;: MPP
Microsoft Visio & Reg ;: VSD/VSS
Markup: html/xhtml/mhtml/md/xml
Ebook: CHM/EPUB/FB2
Archivo: Zip
audio: mp3/wav
Video: avi/mov/qt/flv/asf
Imagen: bmp/gif/jp2/png/webp/tiff/jpg/djvu
Adobe Photoshop & Reg ;: PSD
Imágenes médicas: DCM/DICOM
Metadatos: EMF/WMF
Diseño fijo: PDF
bitTorrent: torrent
Para obtener detalles y limitaciones, visite Formatos de documento compatibles.
Requisitos del sistema
- Microsoft Windows: Windows Desktop & Server (x86, x64), Microsoft Azure
- macOS: Mac OS X
- Linux: Ubuntu, OpenSuse, CentOS y otros
- Versiones Java:
J2SE 7.0 (1.7)
,J2SE 8.0 (1.8)
o superior (por ejemplo Java 10)
Groupdocs.Search para Java no requiere que se instale ningún software externo o herramienta de terceros. Simplemente siga una de las formas como se describe en Instalacion y configuracion.
Empezar
Groupdocs aloja todas las API de Java en el Repositorio de grupos. Puede usar fácilmente Groupdocs.Search para Java API directamente en sus proyectos Maven con configuraciones simples. Para las instrucciones detalladas, visite la página de documentación Instalación desde el repositorio de Groupdocs utilizando Maven.
Ejemplo de código Java para usar los caracteres combinados en la indexación de búsqueda
String indexFolder = "c:\\MyIndex\\";
String documentFolder = "c:\\MyDocuments\\";
// Creating an index in the specified folder
Index index = new Index(indexFolder);
// Setting hyphen character type to blended
index.getDictionaries().getAlphabet().setRange(new char[] { '-' }, CharacterType.Blended);
// Indexing documents from the specified folder
index.add(documentFolder);
// Searching in the index
SearchResult result1 = index.search("Elliot-Murray-Kynynmound");
SearchResult result2 = index.search("Elliot");
SearchResult result3 = index.search("Murray");
SearchResult result4 = index.search("Kynynmound");
Página del producto | Documentos | Población | Referencia de API | Ejemplos | Blog | Soporte gratuito | Licencia temporal
Version | Release Date |
---|---|
25.4 | 23 de abril de 2025 |
24.4 | 22 de abril de 2024 |
24.2 | 6 de febrero de 2024 |
24.1 | 15 de enero de 2024 |
23.6 | 15 de junio de 2023 |
23.3 | 24 de marzo de 2023 |
22.11 | 30 de noviembre de 2022 |
22.10 | 24 de octubre de 2022 |
21.2 | 25 de enero de 2022 |
20.8 | 25 de enero de 2022 |
19.2 | 25 de enero de 2022 |
18.12 | 25 de enero de 2022 |
21.8 | 18 de agosto de 2021 |
21.3 | 18 de marzo de 2021 |
20.11 | 19 de noviembre de 2020 |
20.6 | 23 de junio de 2020 |
20.4 | 16 de abril de 2020 |
19.12 | 11 de diciembre de 2019 |
19.5.1 | 15 de julio de 2019 |
19.5 | 31 de mayo de 2019 |
19.3 | 7 de marzo de 2019 |
18.11 | 1 de noviembre de 2018 |
File | Classifier | Size |
---|---|---|
groupdocs-search-20.8-javadoc.jar | javadoc | 712 KB |
groupdocs-search-20.8.jar | 258 MB | |
groupdocs-search-20.8.pom | 3 KB |