<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-search</artifactId>
    <version>24.1</version>
</dependency>
copied!  
compile(group: 'com.groupdocs', name: 'groupdocs-search', version: '24.1')
copied!  
<dependency org="com.groupdocs" name="groupdocs-search" rev="24.1">
    <artifact name="groupdocs-search" ext="jar"/>
</dependency>
copied!  
libraryDependencies += "com.groupdocs" % "groupdocs-search" % "24.1"
copied!  

API Java local de alto nivel para indexar y buscar documentos

banner

Página del producto | Documentación | Demos | Referencia API | Ejemplos | Blog | Soporte gratuito | Licencia temporal

GroupDocs.Search para Java es una API Java on-premise que permite indexar contenido y metadatos de documentos, ejecutar búsquedas (booleanas, facetas, difusas, por homófonos), extraer texto personalizado, aplicar filtros de búsqueda y resaltar resultados.

Funcionalidades de indexación

  • Crear índices de búsqueda, configurar opciones de indexado y suscribirse a eventos.
  • Indexación desde archivo, stream o estructura de datos.
  • Combinar múltiples índices en uno solo.
  • Soporte para:
    • campos adicionales
    • caracteres regulares y combinados
    • reemplazo de caracteres durante la indexación
    • extracción de texto personalizada
  • Indexación de archivos protegidos con contraseña.
  • Compatibilidad con niveles de compresión y opciones de índice compactado o con metadatos.
  • Filtros durante la indexación: fecha de creación/modificación, longitud, extensión, ruta, lógica booleana compuesta (AND/OR/NOT).
  • Renombrar documentos indexados sin reindexar.
  • Eliminar documentos o rutas específicas del índice.
  • Etiquetado de documentos indexados sin reindexado.
  • Guardar texto de documentos en el índice.
  • Establecer qué caracteres se tratan como letras, incluyendo diacríticos.

Funcionalidades de búsqueda

API de gestión de diccionarios

  • Administración de diccionarios:
    • Alias
    • Alfabeto
    • Reemplazos de caracteres
    • Contraseñas
    • Homófonos
    • Corrector ortográfico
    • Palabras vacías
    • Sinónimos
    • Formas de palabras

Formatos compatibles

Indexación de contenido:

  • Word: DOC, DOCX, DOT, DOTX, DOCM, DOTM, RTF, TXT
  • Excel: XLS, XLSX, XLSM, CSV, TSV, SpreadsheetML
  • PowerPoint: PPT, PPTX, POT, POTX, PPS, PPSX
  • OpenOffice: ODT, OTT, ODS, OTS, ODP
  • Outlook: PST, OST, MSG, EML, EMLX
  • OneNote: ONE
  • HTML/XML/MHTML/MD
  • eBooks: CHM, EPUB, FB2
  • Archivos: ZIP
  • PDF (layout fijo)

Indexación de metadatos:

  • Todos los anteriores +
  • Visio: VSD, VSS
  • Project: MPP
  • Imágenes: PNG, JPG, GIF, BMP, TIFF, JP2, DJVU, WEBP, PSD
  • Sonido: MP3, WAV
  • Video: AVI, MOV, FLV, ASF, QT
  • DICOM/Medical: DCM
  • Archivos de metadatos: EMF, WMF
  • BitTorrent: TORRENT

Para más detalles, consulta la lista de formatos soportados.

Requisitos del sistema

  • Sistemas operativos: Windows, macOS, Linux
  • Java: J2SE 7.0 (1.7) o superior (Java 8+ recomendado)
  • Dependencias externas: No se requieren

Consulta la guía de instalación para más detalles.

VersionRelease Date
25.423 de abril de 2025
24.422 de abril de 2024
24.26 de febrero de 2024
24.115 de enero de 2024
23.615 de junio de 2023
23.324 de marzo de 2023
22.1130 de noviembre de 2022
22.1024 de octubre de 2022
21.225 de enero de 2022
20.825 de enero de 2022
19.225 de enero de 2022
18.1225 de enero de 2022
21.818 de agosto de 2021
21.318 de marzo de 2021
20.1119 de noviembre de 2020
20.623 de junio de 2020
20.416 de abril de 2020
19.1211 de diciembre de 2019
19.5.115 de julio de 2019
19.531 de mayo de 2019
19.37 de marzo de 2019
18.111 de noviembre de 2018