<repositories>
   <repository>
      <id>repository.groupdocs.com</id>
      <name>GroupDocs Repository</name>
      <url>https://releases.groupdocs.com/java/repo/</url>
   </repository>
</repositories>

<dependencies>
   <dependency>
      <groupId>com.groupdocs</groupId>
      <artifactId>groupdocs-search</artifactId>
      <version>22.11</version>
   </dependency>
</dependencies>
copied!  
repositories {
    maven {
        url 'https://releases.groupdocs.com/java/repo/'
    }
}

compile(group: 'com.groupdocs', name: 'groupdocs-search', version: '22.11')
copied!  
<ivysettings>
    <settings defaultResolver="chain"/>
    <resolvers>
        <chain name="chain">
            <ibiblio name="GroupDocs Repository" m2compatible="true" root="https://releases.groupdocs.com/java/repo/"/>
        </chain>
    </resolvers>
</ivysettings>

<dependency org="com.groupdocs" name="groupdocs-search" rev="22.11">
   <artifact name="groupdocs-search" ext="jar"/>
</dependency>
copied!  
resolvers += Resolver.url("GroupDocs Repository", url("https://releases.groupdocs.com/java/repo/"))

libraryDependencies += "com.groupdocs" % "groupdocs-search" % "22.11"
copied!  

API Java de código alto a los documentos de índice y búsqueda

main-banner

Página del producto | Documentos | Población | Referencia de API | Ejemplos | Blog | Soporte gratuito | Licencia temporal

GroupdocsSearch para Java es una API Java local para ayudar a indexar el contenido y los metadatos del documento, realizar búsquedas (booleanos, facetados, difusos, caseros) y extracción de texto personalizado, aplicar filtros de búsqueda y resaltar resultados.

Search & Index Java Funciones de API locales

Las características de la API de indexación

  • Cree el índice de búsqueda, aplique la configuración del índice y suscríbase a los eventos de índice.

  • Admite documentos de indexación desde el archivo, la transmisión o una estructura de datos.

  • Fusionar múltiples índices de búsqueda en uno.

  • Support is available for:

    • Campos Adicionales
    • Caracteres regulares (separadores y letras)
    • Caracteres combinados (estos caracteres especiales se indexan como separadores y letras, por ejemplo, guión)
    • caracteres indexados como una palabra completa
    • Reemplazo de personajes durante la indexación
    • Extractores de texto personalizados
  • Index files protected with password

  • Proporciona las opciones de índice compacto y de metadatos.

  • Admite un nivel diferente de compresión para guardar el texto extraído en el índice.

  • Capacidad para filtrar documentos durante la indexación.

  • Opción para eliminar rutas indexadas del índice.

  • Mientras indexa, convierta todos los caracteres en minúsculas o elimine a los diacríticos del texto utilizando el reemplazo de caracteres.

  • Capacidad para especificar el conjunto deseado de caracteres como letras.

  • Implemente el soporte para un extractor de texto personalizado y luego use ese extractor personalizado para la indexación.

  • Eliminar o eliminar los documentos deseados del índice de búsqueda.

  • Eliminar o eliminar carpetas y archivos indexados del índice.

  • Marque documentos indexados con etiquetas de texto sin volver a indicar.

  • Filtrar documentos durante la búsqueda a través de atributos del documento aplicado.

  • Aplicar varios tipos de filtros mientras se indexan, such as:

    • Filtro de tiempo de creación (es decir, omitir archivos creados antes/más tarde que una fecha determinada, o fuera del rango de fechas proporcionado)
    • Filtro de tiempo de modificación (igual que el filtro de tiempo de creación pero funciona en la fecha de modificación del documento)
    • Filtro de ruta de archivo (aplique regex para omitir los archivos con rutas completas que no coinciden con el patrón especificado)
    • Filtro de longitud de archivo (especifique el límite inferior/superior, o el rango de longitud de archivo aceptable en bytes)
    • Filtro de extensión de archivo (solo se indexarán los archivos que coinciden con la lista de extensiones de archivo especificadas)
    • lógico no filtro (invertir la lógica de un filtro interno)
    • Lógico y filtro (filtro compuesto que requiere que todos los filtros internos tengan éxito)
    • lógico o filtro (filtro compuesto que requiere al menos un filtro interno para tener éxito)
  • Rename any indexed document without requiring it to reindex during the update

  • Agregue campos adicionales a documentos indexados para asociar más metadatos.

  • Capacidad para guardar el texto del documento en el índice.

Buscando características de API

  • Supports various types of searches, such as:

  • Obtenga el texto de documentos indexados en el formato HTML.

  • Apply various filters while searching documents, such as:

    • Filtro de ruta de archivo (aplique Regex para obtener los archivos con rutas completas que coincidan con el patrón especificado)
    • Filtro de extensión de archivo (devuelve los archivos que coinciden con la lista de extensiones de archivo especificadas)
    • Filtro de atributos (devuelve los archivos con los que están asociados los atributos especificados)
    • Filtros combinados (aplique filtros compuestos y, o no para componer consultas complejas)
  • Después de la búsqueda, se pueden resaltar las palabras y frases resultantes dentro del contenido del documento.

  • Habilite la opción Corrección del diseño del teclado para reemplazar los caracteres de palabras clave no compatibles con los caracteres reales.

  • Buscar diferentes formularios de palabras, como, sustantivo, adjetivo, formas de verbos, etc.

Características de la API de gestión del diccionario de búsqueda

  • Various types of diccionarios can be used & managed, such as:
    • Diccionario de alias
    • Diccionario de alfabeto
    • Diccionario de reemplazos de personajes
    • Diccionario de documentos de contraseñas
    • Diccionario de homófono
    • Corrector de ortografía
    • Diccionario de parada de palabras
    • Diccionario de sinónimo
    • Proveedor de formularios de palabras

formatos de archivo de búsqueda de documentos compatibles

La operación de contenido de indexación es compatible con los siguientes formatos de archivo: Microsoft Word & Reg ;: doc/dot/docx/docm/dotx/dotm/rtf/txt
OpenOffice Writer & Reg ;: ODT/OTT
Microsoft Excel & Reg ;: xls/xlt/xlsx/xlsm/xlsb/xltx/xltm/xla/xlam
OpenOffice Calc & Reg ;: ODS/OTS/CSV/TSV/STARPSheetMl
Microsoft PowerPoint & Reg ;: PPT/PPS/POT/PPTX/PPTM/POTX/POTM/PPSX/PPSM
OpenOffice Impress & Reg;: ODP
Microsoft Outlook & Reg ;: PST/OST/EML/MSG
Apple & Reg; Mensaje de correo: EMLX
Microsoft OneNote & Reg;: One
Markup: html/xhtml/mhtml/md/xml
Ebook: CHM/EPUB/FB2
Archivo: Zip
Diseño fijo: PDF La operación de metadatos de indexación es compatible con los siguientes formatos de archivo: Microsoft Word & Reg ;: doc/dot/docx/docm/dotx/dotm/rtf/txt
OpenOffice Writer & Reg ;: ODT/OTT
Microsoft Excel & Reg ;: xls/xlt/xlsx/xlsm/xlsb/xltx/xltm/xla/xlam
OpenOffice Calc & Reg ;: ODS/OTS/CSV/TSV/STARPSheetMl
Microsoft PowerPoint & Reg ;: PPT/PPS/POT/PPTX/PPTM/POTX/POTM/PPSX/PPSM
OpenOffice Impress & Reg;: ODP
Microsoft Outlook & Reg ;: PST/OST/EML/MSG
Apple & Reg; Mensaje de correo: EMLX
Microsoft OneNote & Reg;: One
Microsoft Project & Reg ;: MPP
Microsoft Visio & Reg ;: VSD/VSS
Markup: html/xhtml/mhtml/md/xml
Ebook: CHM/EPUB/FB2
Archivo: Zip
audio: mp3/wav
Video: avi/mov/qt/flv/asf
Imagen: bmp/gif/jp2/png/webp/tiff/jpg/djvu
Adobe Photoshop & Reg ;: PSD
Imágenes médicas: DCM/DICOM
Metadatos: EMF/WMF
Diseño fijo: PDF
bitTorrent: torrent

Para obtener detalles y limitaciones, visite Formatos de documento compatibles.

Requisitos del sistema

  • Microsoft Windows: Windows Desktop & Server (x86, x64), Microsoft Azure
  • macOS: Mac OS X
  • Linux: Ubuntu, OpenSuse, CentOS y otros
  • Versiones Java: J2SE 7.0 (1.7), J2SE 8.0 (1.8) o superior (por ejemplo Java 10)

Groupdocs.Search para Java no requiere que se instale ningún software externo o herramienta de terceros. Simplemente siga una de las formas como se describe en Instalacion y configuracion.

Empezar

Groupdocs aloja todas las API de Java en el Repositorio de grupos. Puede usar fácilmente Groupdocs.Search para Java API directamente en sus proyectos Maven con configuraciones simples. Para las instrucciones detalladas, visite la página de documentación Instalación desde el repositorio de Groupdocs utilizando Maven.

Ejemplo de código Java para usar los caracteres combinados en la indexación de búsqueda

String indexFolder = "c:\\MyIndex\\";
String documentFolder = "c:\\MyDocuments\\";

// Creating an index in the specified folder
Index index = new Index(indexFolder);

// Setting hyphen character type to blended
index.getDictionaries().getAlphabet().setRange(new char[] { '-' }, CharacterType.Blended);

// Indexing documents from the specified folder
index.add(documentFolder);

// Searching in the index
SearchResult result1 = index.search("Elliot-Murray-Kynynmound");
SearchResult result2 = index.search("Elliot");
SearchResult result3 = index.search("Murray");
SearchResult result4 = index.search("Kynynmound");

Página del producto | Documentos | Población | Referencia de API | Ejemplos | Blog | Soporte gratuito | Licencia temporal

VersionRelease Date
22.1130 de noviembre de 2022
22.1024 de octubre de 2022
21.225 de enero de 2022
20.825 de enero de 2022
19.225 de enero de 2022
18.1225 de enero de 2022
21.818 de agosto de 2021
21.318 de marzo de 2021
20.1119 de noviembre de 2020
20.623 de junio de 2020
20.416 de abril de 2020
19.1211 de diciembre de 2019
19.5.115 de julio de 2019
19.531 de mayo de 2019
19.37 de marzo de 2019
18.111 de noviembre de 2018