<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-search</artifactId>
    <version>24.1</version>
</dependency>
copied!  
compile(group: 'com.groupdocs', name: 'groupdocs-search', version: '24.1')
copied!  
<dependency org="com.groupdocs" name="groupdocs-search" rev="24.1">
    <artifact name="groupdocs-search" ext="jar"/>
</dependency>
copied!  
libraryDependencies += "com.groupdocs" % "groupdocs-search" % "24.1"
copied!  

API Java de Alto Controle para Indexar e Buscar Documentos

banner

Página do Produto | Documentação | Demos | Referência da API | Exemplos | Blog | Suporte Gratuito | Licença Temporária

GroupDocs.Search for Java é uma API Java local para indexar conteúdo e metadados de documentos, realizar buscas (booleana, facetada, fuzzy, homofônica), extrair texto personalizado, aplicar filtros de pesquisa e destacar os resultados.

Recursos da API de Indexação e Pesquisa em Java

Recursos da API de Indexação

  • Criar índices de pesquisa, aplicar configurações e assinar eventos do índice.
  • Indexação de documentos a partir de arquivos, fluxos ou estruturas de dados.
  • Mesclar múltiplos índices de busca em um só.
  • Suporte para:
    • campos adicionais
    • caracteres regulares (separadores e letras)
    • caracteres mistos (tratados como separadores e letras, ex: hífen)
    • caracteres indexados como palavra inteira
    • substituição de caracteres durante a indexação
    • extratores de texto personalizados
  • Indexação de arquivos protegidos por senha.
  • Opções de índice compacto e baseado em metadados.
  • Níveis de compressão variados para armazenar texto extraído.
  • Filtro de documentos durante a indexação.
  • Opção para deletar caminhos indexados.
  • Substituição de caracteres: converter para minúsculas ou remover diacríticos.
  • Definir quais caracteres devem ser tratados como letras.
  • Implementar e usar extratores de texto personalizados.
  • Remover documentos indexados.
  • Marcar documentos indexados com rótulos sem reindexar.
  • Aplicar filtros durante a pesquisa com base em atributos dos documentos.
  • Aplicar filtros durante a indexação, como:
    • Filtro por data de criação
    • Filtro por data de modificação
    • Filtro por caminho do arquivo (regex)
    • Filtro por tamanho do arquivo (bytes)
    • Filtro por extensão de arquivo
    • Filtros lógicos NOT, AND, OR
  • Renomear arquivos indexados sem reindexar.
  • Associar metadados adicionais aos documentos.
  • Salvar o texto dos documentos no índice.

Recursos da API de Busca

Gerenciamento de Dicionários de Pesquisa

  • Suporte a diversos tipos de dicionários:
    • Dicionário de Apelidos
    • Dicionário de Alfabeto
    • Dicionário de Substituição de Caracteres
    • Dicionário de Senhas
    • Dicionário de Homônimos
    • Corretor Ortográfico
    • Dicionário de Palavras Ignoradas (Stop Words)
    • Dicionário de Sinônimos
    • Provedor de Formas de Palavras

Formatos Suportados para Pesquisa em Documentos

Word®: DOC, DOT, DOCX, DOCM, DOTX, DOTM, RTF, TXT
OpenOffice Writer®: ODT, OTT
Excel®: XLS, XLT, XLSX, XLSM, XLSB, XLTX, XLTM, XLA, XLAM
OpenOffice Calc®: ODS, OTS, CSV, TSV, SpreadsheetML
PowerPoint®: PPT, PPS, POT, PPTX, PPTM, POTX, POTM, PPSX, PPSM
OpenOffice Impress®: ODP
Outlook®: PST, OST, EML, MSG
Apple Mail: EMLX
OneNote®: ONE
Markup: HTML, XHTML, MHTML, MD, XML
eBook: CHM, EPUB, FB2
Arquivos Compactados: ZIP
Layout Fixo: PDF

Para metadados:
Além dos formatos acima, suporte adicional para:
Project®: MPP
Visio®: VSD, VSS
Áudio: MP3, WAV
Vídeo: AVI, MOV, QT, FLV, ASF
Imagem: BMP, GIF, JP2, PNG, WEBP, TIFF, JPG, DJVU
Photoshop®: PSD
Imagem Médica: DCM, DICOM
Metadados: EMF, WMF
BitTorrent: TORRENT

Formatos Suportados - Detalhes

Requisitos de Sistema

  • Windows: Desktop e Server (x86, x64), Azure
  • macOS: Mac OS X
  • Linux: Ubuntu, OpenSUSE, CentOS, etc.
  • Java: J2SE 7.0 (1.7) ou superior (ex: Java 10)

Nenhuma dependência externa é necessária. Veja como instalar e configurar.

Primeiros Passos

GroupDocs hospeda todas as APIs Java em GroupDocs Repository. Integre facilmente via Maven. Veja como instalar com Maven.

VersionRelease Date
25.423 de abril de 2025
24.422 de abril de 2024
24.26 de fevereiro de 2024
24.115 de janeiro de 2024
23.615 de junho de 2023
23.324 de março de 2023
22.1130 de novembro de 2022
22.1024 de outubro de 2022
21.225 de janeiro de 2022
20.825 de janeiro de 2022
19.225 de janeiro de 2022
18.1225 de janeiro de 2022
21.818 de agosto de 2021
21.318 de março de 2021
20.1119 de novembro de 2020
20.623 de junho de 2020
20.416 de abril de 2020
19.1211 de dezembro de 2019
19.5.115 de julho de 2019
19.531 de maio de 2019
19.37 de março de 2019
18.111 de novembro de 2018