<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-search</artifactId>
<version>24.1</version>
</dependency>
compile(group: 'com.groupdocs', name: 'groupdocs-search', version: '24.1')
<dependency org="com.groupdocs" name="groupdocs-search" rev="24.1">
<artifact name="groupdocs-search" ext="jar"/>
</dependency>
libraryDependencies += "com.groupdocs" % "groupdocs-search" % "24.1"
API Java de Alto Controle para Indexar e Buscar Documentos
Página do Produto | Documentação | Demos | Referência da API | Exemplos | Blog | Suporte Gratuito | Licença Temporária
GroupDocs.Search for Java é uma API Java local para indexar conteúdo e metadados de documentos, realizar buscas (booleana, facetada, fuzzy, homofônica), extrair texto personalizado, aplicar filtros de pesquisa e destacar os resultados.
Recursos da API de Indexação e Pesquisa em Java
Recursos da API de Indexação
- Criar índices de pesquisa, aplicar configurações e assinar eventos do índice.
- Indexação de documentos a partir de arquivos, fluxos ou estruturas de dados.
- Mesclar múltiplos índices de busca em um só.
- Suporte para:
- campos adicionais
- caracteres regulares (separadores e letras)
- caracteres mistos (tratados como separadores e letras, ex: hífen)
- caracteres indexados como palavra inteira
- substituição de caracteres durante a indexação
- extratores de texto personalizados
- Indexação de arquivos protegidos por senha.
- Opções de índice compacto e baseado em metadados.
- Níveis de compressão variados para armazenar texto extraído.
- Filtro de documentos durante a indexação.
- Opção para deletar caminhos indexados.
- Substituição de caracteres: converter para minúsculas ou remover diacríticos.
- Definir quais caracteres devem ser tratados como letras.
- Implementar e usar extratores de texto personalizados.
- Remover documentos indexados.
- Marcar documentos indexados com rótulos sem reindexar.
- Aplicar filtros durante a pesquisa com base em atributos dos documentos.
- Aplicar filtros durante a indexação, como:
- Filtro por data de criação
- Filtro por data de modificação
- Filtro por caminho do arquivo (regex)
- Filtro por tamanho do arquivo (bytes)
- Filtro por extensão de arquivo
- Filtros lógicos NOT, AND, OR
- Renomear arquivos indexados sem reindexar.
- Associar metadados adicionais aos documentos.
- Salvar o texto dos documentos no índice.
Recursos da API de Busca
- Suporte a múltiplos tipos de busca:
- Busca Booleana: operadores AND, OR, NOT, com suporte a consultas complexas.
- Busca Sensível a Maiúsculas
- Busca por Intervalo de Datas
- Busca Facetada
- Busca Fuzzy: corrige palavras com erros ortográficos.
- Busca por Homônimos
- Extrair texto dos documentos em formato
HTML
. - Aplicar filtros durante a busca:
- Filtro por caminho (regex)
- Filtro por extensão
- Filtro por atributo
- Filtros combinados (AND, OR, NOT)
- Destacar os termos encontrados no conteúdo dos documentos.
- Correção de layout de teclado
- Busca por diferentes formas de palavras
Gerenciamento de Dicionários de Pesquisa
- Suporte a diversos tipos de dicionários:
- Dicionário de Apelidos
- Dicionário de Alfabeto
- Dicionário de Substituição de Caracteres
- Dicionário de Senhas
- Dicionário de Homônimos
- Corretor Ortográfico
- Dicionário de Palavras Ignoradas (Stop Words)
- Dicionário de Sinônimos
- Provedor de Formas de Palavras
Formatos Suportados para Pesquisa em Documentos
Word®: DOC, DOT, DOCX, DOCM, DOTX, DOTM, RTF, TXT
OpenOffice Writer®: ODT, OTT
Excel®: XLS, XLT, XLSX, XLSM, XLSB, XLTX, XLTM, XLA, XLAM
OpenOffice Calc®: ODS, OTS, CSV, TSV, SpreadsheetML
PowerPoint®: PPT, PPS, POT, PPTX, PPTM, POTX, POTM, PPSX, PPSM
OpenOffice Impress®: ODP
Outlook®: PST, OST, EML, MSG
Apple Mail: EMLX
OneNote®: ONE
Markup: HTML, XHTML, MHTML, MD, XML
eBook: CHM, EPUB, FB2
Arquivos Compactados: ZIP
Layout Fixo: PDF
Para metadados:
Além dos formatos acima, suporte adicional para:
Project®: MPP
Visio®: VSD, VSS
Áudio: MP3, WAV
Vídeo: AVI, MOV, QT, FLV, ASF
Imagem: BMP, GIF, JP2, PNG, WEBP, TIFF, JPG, DJVU
Photoshop®: PSD
Imagem Médica: DCM, DICOM
Metadados: EMF, WMF
BitTorrent: TORRENT
Formatos Suportados - Detalhes
Requisitos de Sistema
- Windows: Desktop e Server (x86, x64), Azure
- macOS: Mac OS X
- Linux: Ubuntu, OpenSUSE, CentOS, etc.
- Java: J2SE 7.0 (1.7) ou superior (ex: Java 10)
Nenhuma dependência externa é necessária. Veja como instalar e configurar.
Primeiros Passos
GroupDocs hospeda todas as APIs Java em GroupDocs Repository. Integre facilmente via Maven. Veja como instalar com Maven.
Version | Release Date |
---|---|
25.4 | 23 de abril de 2025 |
24.4 | 22 de abril de 2024 |
24.2 | 6 de fevereiro de 2024 |
24.1 | 15 de janeiro de 2024 |
23.6 | 15 de junho de 2023 |
23.3 | 24 de março de 2023 |
22.11 | 30 de novembro de 2022 |
22.10 | 24 de outubro de 2022 |
21.2 | 25 de janeiro de 2022 |
20.8 | 25 de janeiro de 2022 |
19.2 | 25 de janeiro de 2022 |
18.12 | 25 de janeiro de 2022 |
21.8 | 18 de agosto de 2021 |
21.3 | 18 de março de 2021 |
20.11 | 19 de novembro de 2020 |
20.6 | 23 de junho de 2020 |
20.4 | 16 de abril de 2020 |
19.12 | 11 de dezembro de 2019 |
19.5.1 | 15 de julho de 2019 |
19.5 | 31 de maio de 2019 |
19.3 | 7 de março de 2019 |
18.11 | 1 de novembro de 2018 |
File | Classifier | Size |
---|---|---|
groupdocs-search-24.1-javadoc.jar | javadoc | 1 MB |
groupdocs-search-24.1.jar | 417 MB | |
groupdocs-search-24.1.pom | 3 KB |