<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-search</artifactId>
<version>21.8</version>
</dependency>
compile(group: 'com.groupdocs', name: 'groupdocs-search', version: '21.8')
<dependency org="com.groupdocs" name="groupdocs-search" rev="21.8">
<artifact name="groupdocs-search" ext="jar"/>
</dependency>
libraryDependencies += "com.groupdocs" % "groupdocs-search" % "21.8"
高码Java API到索引和搜索文档
产品页面 | 文档 | 演示 | API参考 | 例子 | 博客 | 免费支持 | 临时许可
Java的GroupDocsSearch是本地Java API,可帮助索引文档内容和元数据,执行搜索(布尔值,刻面,模糊,家用电话)和自定义文本提取,应用搜索过滤器并突出显示结果。
搜索和索引Java本地API功能
索引API功能
创建搜索索引,应用索引设置并订阅索引事件。
支持文件,流或数据结构中的索引文档。
将多个搜索索引合并为一个。
可用于以下支持:
- 其他字段
- 常规字符(分隔符和字母)
- 混合字符(这些特殊字符索引为分离器和字母,例如连字符)
- 字符作为一个整个词索引
- 索引期间的角色更换
- 自定义文本提取器
用密码保护的索引文件
提供紧凑和元数据索引选项。
支持不同级别的压缩级别,以将提取的文本保存在索引中。
能够在索引期间过滤文档。
从索引删除索引路径的选项。
在索引时,将所有字符转换为小写或使用字符替换从文本中删除变节。
到指定所需的字符集作为字母的能力。
实现对自定义文本提取器的支持,然后使用该自定义提取器进行索引。
从索引中删除或删除索引文件夹和文件。
标记带有文本标签的索引文档,而无需重新索引。
通过应用文档属性在搜索过程中过滤文档。
索引时应用各种过滤器,例如:
- 创建时间过滤器(即跳过更早/晚于特定日期或在提供的日期范围之外创建的文件)
- 修改时间过滤器(与创建时间过滤器相同,但在文档修改日期工作)
- 文件路径滤波器(应用正则置于不匹配指定模式的完整路径的文件)
- 文件长度过滤器(指定下限/上限或字节中可接受的文件长度范围)
- 文件扩展过滤器(仅匹配指定文件扩展名列表的文件将被索引)
- 逻辑不是过滤器(倒置内部过滤器的逻辑)
- 逻辑和过滤器(需要所有内部过滤器成功的复合过滤器)
- 逻辑或过滤器(复合过滤器,至少需要一个内部过滤器才能成功)
重命名任何索引文档,而无需它在更新期间重新索引
将其他字段添加到索引文档中,以关联更多的元数据。
能够将文档文本保存在索引中。
搜索API功能
支持各种类型的搜索,例如:
- 支持和,或者,或者不是操作员。
- 结合多个布尔搜索Quries来组成卷曲Quries。
案例敏感搜索认为大写和小写字符是不同的。
日期范围搜索基于指定日期格式提供的日期范围的搜索。
面搜索仅在指定字段而不是整个文档中搜索。
模糊搜索使用模糊逻辑正确检测错误的拼写单词。
同型搜索搜索与搜索单词相似的单词(发音)。
以
html
格式获取索引文档的文本。在搜索文档时应用各种过滤器,例如:
- 文件路径滤波器(应用正则以匹配指定模式的完整路径获取文件)
- 文件扩展过滤器(返回匹配指定文件扩展名列表的文件)
- 属性过滤器(返回与指定属性关联的文件)
- 组合过滤器(应用复合滤波器,或者不构成复杂查询)
搜索后,可以突出显示文档内容中发现的结果和短语。
启用键盘布局校正选项将不支持的关键字字符替换为实际字符。
搜索不同的单词形式,例如,名词,形容词,动词形式等。
搜索字典管理API功能
- 可以使用和管理各种类型的字典,例如:
- 别名词典
- 字母字典
- 字符替代字典
- 文档密码词典
- 同音词典
- 拼写校正器
- 停止单词词典
- 同义词字典
- 单词表单提供商
支持的文档搜索文件格式
支持以下文件格式支持索引内容操作:
Microsoft Word&reg;: doc/dot/docx/docm/dotx/dotm/rtf/txt
OpenOffice Writer&reg;: ODT/OTT
Microsoft Excel&reg;: XLS/XLT/XLSX/XLSM/XLSB/XLTX/XLTM/XLTM/XLA/XLAM
openoffice calc&reg;: ods/ots/csv/csv/tsv/spreadsheetml
Microsoft PowerPoint&reg;: PPT/PPS/POT/PPTX/PPTM/PTM/POTX/POTM/PPSX/PPSM
OpenOffice Impress&reg;: ODP
Microsoft Outlook&reg;: PST/OST/EML/MSG
Apple&Reg;邮件: emlx
**Microsoft OneNote&reg;:**一个
标记: html/xhtml/mhtml/md/xml \
电子书: chm/epub/fb2
存档: zip
固定布局: PDF
为以下文件格式支持索引元数据操作:
Microsoft Word&reg;: doc/dot/docx/docm/dotx/dotm/rtf/txt
OpenOffice Writer&reg;: ODT/OTT
Microsoft Excel&reg;: XLS/XLT/XLSX/XLSM/XLSB/XLTX/XLTM/XLTM/XLA/XLAM
openoffice calc&reg;: ods/ots/csv/csv/tsv/spreadsheetml
Microsoft PowerPoint&reg;: PPT/PPS/POT/PPTX/PPTM/PTM/POTX/POTM/PPSX/PPSM
OpenOffice Impress&reg;: ODP
Microsoft Outlook&reg;: PST/OST/EML/MSG
Apple&Reg;邮件: emlx
**Microsoft OneNote&reg;:**一个
Microsoft Project&Reg;: MPP
Microsoft Visio&reg;: VSD/VSS
标记: html/xhtml/mhtml/md/xml \
电子书: chm/epub/fb2
存档: zip
音频: mp3/wav
视频: avi/mov/qt/flv/asf
图像: bmp/gif/jp2/png/webp/tiff/jpg/djvu \ \
Adobe Photoshop&reg;: PSD
医学成像: DCM/DICOM
元数据: emf/wmf
固定布局: pdf
bittorrent: torrent
有关详细信息和限制,请访问支持的文档格式。
系统要求
- Microsoft Windows: Windows Desktop&Server(X86,X64),Microsoft Azure
- macOS: Mac OS X
- Linux: Ubuntu,Opensuse,Centos等
- Java版本:``J2SE 7.0(1.7)
,
J2SE 8.0(1.8)`或更高(例如Java 10)
GroupDocs.Search for Java不需要安装任何外部软件或第三方工具。只需按照安装和配置中所述的方式之一即可。
开始
GroupDocs在GroupDocs存储库托管所有Java API。您可以轻松地使用groupDocs.Search在Maven项目中直接使用简单配置的Java API。有关详细说明,请访问使用Maven从GroupDocs存储库安装文档页面。
示例Java代码在搜索索引中使用混合字符
String indexFolder = "c:\\MyIndex\\";
String documentFolder = "c:\\MyDocuments\\";
// Creating an index in the specified folder
Index index = new Index(indexFolder);
// Setting hyphen character type to blended
index.getDictionaries().getAlphabet().setRange(new char[] { '-' }, CharacterType.Blended);
// Indexing documents from the specified folder
index.add(documentFolder);
// Searching in the index
SearchResult result1 = index.search("Elliot-Murray-Kynynmound");
SearchResult result2 = index.search("Elliot");
SearchResult result3 = index.search("Murray");
SearchResult result4 = index.search("Kynynmound");
Version | Release Date |
---|---|
25.4 | 2025年4月23日 |
24.4 | 2024年4月22日 |
24.2 | 2024年2月6日 |
24.1 | 2024年1月15日 |
23.6 | 2023年6月15日 |
23.3 | 2023年3月24日 |
22.11 | 2022年11月30日 |
22.10 | 2022年10月24日 |
21.2 | 2022年1月25日 |
20.8 | 2022年1月25日 |
19.2 | 2022年1月25日 |
18.12 | 2022年1月25日 |
21.8 | 2021年8月18日 |
21.3 | 2021年3月18日 |
20.11 | 2020年11月19日 |
20.6 | 2020年6月23日 |
20.4 | 2020年4月16日 |
19.12 | 2019年12月11日 |
19.5.1 | 2019年7月15日 |
19.5 | 2019年5月31日 |
19.3 | 2019年3月7日 |
18.11 | 2018年11月1日 |
File | Classifier | Size |
---|---|---|
groupdocs-search-21.8-javadoc.jar | javadoc | 753.39 KB |
groupdocs-search-21.8.jar | 259.42 MB | |
groupdocs-search-21.8.pom | 3.04 KB |