<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-search</artifactId>
<version>18.12</version>
</dependency>
compile(group: 'com.groupdocs', name: 'groupdocs-search', version: '18.12')
<dependency org="com.groupdocs" name="groupdocs-search" rev="18.12">
<artifact name="groupdocs-search" ext="jar"/>
</dependency>
libraryDependencies += "com.groupdocs" % "groupdocs-search" % "18.12"
ハイコードJava APIインデックスおよび検索ドキュメント
製品ページ | ドキュメント | デモ | APIリファレンス | 例 | ブログ | 無料サポート | 一時ライセンス
JavaのGroupDocsSearchは、ドキュメントコンテンツとメタデータのインデックス作成、検索(ブール、ファセット、ファジー、ホームフォン)およびカスタムテキスト抽出を実行し、検索フィルターを適用し、結果を強調表示するためのオンプレミスJava APIです。
検索&インデックスJavaオンプレミスAPI機能
インデックス付けAPI機能
検索インデックスを作成し、インデックス設定を適用し、インデックスイベントを購読します。
ファイル、ストリーム、またはデータ構造からのインデックスドキュメントをサポートします。
複数の検索インデックスを1つにマージします。
サポートは次のとおりです。
- 追加のフィールド
- 通常のキャラクター(セパレーターと文字)
- ブレンドキャラクター(これらの特殊文字は、文字だけでなくセパレーターとしてインデックス付けされています。たとえば、ハイフンなど)
- 単語全体としてインデックス付けされた文字
- インデックス作成中の文字交換
- カスタムテキスト抽出器
パスワードで保護されているインデックスファイル
コンパクトおよびメタデータインデックスオプションを提供します。
異なるレベルの圧縮をサポートして、抽出されたテキストをインデックスに保存します。
インデックス作成中にドキュメントをフィルタリングする機能。
インデックスからインデックス付きパスを削除するオプション。
インデックス作成中は、すべての文字を小文字に変換するか、文字置き換えを使用してテキストからディクリティックスを削除します。
必要な文字のセットを文字として指定しますへの機能。
カスタムテキスト抽出器のサポートを実装し、そのカスタム抽出器をインデックスに使用します。
-検索インデックスから目的のドキュメントを削除または削除します。
- インデックスからインデックス付きフォルダーとファイルを削除または削除します。
- 再インデックスせずにテキストラベルを使用したインデックス付きドキュメントをマークします。 -Applied Document属性を介して検索中にドキュメントをフィルタリングします。
-インデックス作成中にさまざまな種類のフィルターを適用しますなど:
- 作成タイムフィルター(つまり、特定の日付よりも早く/後に作成されたファイルをスキップする、または提供された日付範囲の外側)
- 変更時間フィルター(作成時間フィルターと同じが、ドキュメントの変更日で動作する)
- ファイルパスフィルター(正規表現を適用して、指定されたパターンと一致しないフルパスでファイルをスキップします)
- ファイル長フィルター(下/上限、またはバイトで許容可能なファイル長の範囲を指定)
- ファイル拡張フィルター(指定されたファイル拡張子のリストに一致するファイルのみがインデックス化されます) -Logical Not Filter(内部フィルターの論理を反転)
- 論理とフィルター(すべての内部フィルターが成功するために必要なコンポジットフィルター)
- 論理またはフィルター(成功するために少なくとも1つの内部フィルターを必要とする複合フィルター)
- アップデート中に再インデックスを要求することなく、インデックス付きドキュメントの名前を変更します
- インデックス付きドキュメントに追加のフィールドを追加して、より多くのメタデータを関連付けます。
- インデックスにドキュメントテキストを保存する機能。
API機能の検索
- 次のようなさまざまな種類の検索をサポートします。
-ブール検索 - サポートおよび、または、オペレーターではありません。 - 複数のブール検索クーリーを組み合わせて、comlex curiesを作成します。
-ケースに敏感な検索は、大文字と小文字の文字を明確であると考えています。
-日付範囲検索指定された日付形式の提供された日付範囲に基づいて検索。
-ファセット検索ドキュメント全体ではなく、指定されたフィールド内でのみ検索します。
-ファジー検索ファジーロジックを使用して、間違ったスペルの単語を正しく検出する検索。
-同性愛者の検索検索された単語に音(発音)が似ている単語を検索します。
- 「HTML」形式でインデックス付きドキュメントのテキストを取得します。
- 次のようなドキュメントの検索中にさまざまなフィルターを適用します。
- ファイルパスフィルター(正規表現を適用して、指定されたパターンに一致するフルパスでファイルを取得します)
- ファイル拡張フィルター(指定されたファイル拡張子のリストに一致するファイルを返します)
- 属性フィルター(指定された属性が関連付けられているファイルを返します)
- 組み合わせたフィルター(複合フィルターを適用し、または複雑なクエリを作成しないでください)
- 検索後、ドキュメント内のコンテンツ内で発見された結果の単語とフレーズを強調表示できます。
-キーボードレイアウト修正オプションを有効にして、サポートされていないキーワード文字を実際の文字に置き換えます。
-noun、形容詞、動詞の形式など、さまざまな単語形式を検索します。
辞書管理API機能を検索します
- さまざまなタイプの辞書を使用および管理することができます。
- エイリアス辞書
- アルファベット辞書
- 文字交換辞書
- パスワード辞書を文書化します
- ホモホン辞書
- スペル修正器
- 単語辞書を停止します
- 同義語辞書 -Wordフォームプロバイダー
サポートされているドキュメント検索ファイル形式
インデックス作成コンテンツ操作は、次のファイル形式でサポートされています。
Microsoft Word&Reg;: doc/dot/docx/docm/dotx/dotm/rtf/txt
OpenOffice Writer&Reg;: odt/ott
Microsoft Excel&Reg;: XLS/XLT/XLSX/XLSM/XLSB/XLTX/XLTM/XLA/XLA
OpenOffice calc&reg;: ods/ots/csv/tsv/spreadsheetml
Microsoft PowerPoint&Reg;: PPT/PPS/POT/PPTX/PPTM/POTX/POTM/PPSX/PPSM
OpenOffice Impress&Reg;: odp
Microsoft Outlook&Reg;: PST/OST/EML/MSG
Apple&Reg;メールメッセージ: emlx
Microsoft Onenote&Reg;: One
マークアップ: html/xhtml/mhtml/md/xml
電子ブック: CHM/EPUB/FB2
アーカイブ: zip
レイアウトを修正: PDF
インデックス作成メタデータ操作は、次のファイル形式でサポートされています。
Microsoft Word&Reg;: doc/dot/docx/docm/dotx/dotm/rtf/txt
OpenOffice Writer&Reg;: odt/ott
Microsoft Excel&Reg;: XLS/XLT/XLSX/XLSM/XLSB/XLTX/XLTM/XLA/XLA
OpenOffice calc&reg;: ods/ots/csv/tsv/spreadsheetml
Microsoft PowerPoint&Reg;: PPT/PPS/POT/PPTX/PPTM/POTX/POTM/PPSX/PPSM
OpenOffice Impress&Reg;: odp
Microsoft Outlook&Reg;: PST/OST/EML/MSG
Apple&Reg;メールメッセージ: emlx
Microsoft Onenote&Reg;: One
Microsoft Project&Reg;: mpp
Microsoft Visio&Reg;: vsd/vss
マークアップ: html/xhtml/mhtml/md/xml
電子ブック: CHM/EPUB/FB2
アーカイブ: zip
オーディオ: mp3/wav
ビデオ: avi/mov/qt/flv/asf
画像: bmp/gif/jp2/png/webp/tiff/jpg/djvu
Adobe Photoshop&Reg;: psd
医療イメージング: dcm/dicom
メタデータ: emf/wmf
修正レイアウト: PDF
Bittorrent: Torrent
詳細と制限については、サポートされているドキュメント形式をご覧ください。
システム要求
- Microsoft Windows Windows Desktop&Server(x86、x64)、Microsoft Azure
- macOS: Mac OS X
- linux: ubuntu、opensuse、centosなど
- Javaバージョン:
J2SE 7.0(1.7)
、J2SE 8.0(1.8)
以下(たとえばJava 10)
GroupDocs.Search for Javaでは、外部ソフトウェアまたはサードパーティのツールをインストールする必要はありません。 インストールと構成で説明されている方法の1つに従ってください。
始めましょう
GroupDocsは、GroupDocsリポジトリですべてのJava APIをホストしています。簡単な構成を使用して、MavenプロジェクトでGroupDocs.search for Java APIを簡単に使用できます。詳細な手順については、Mavenを使用したGroupDocsリポジトリからのインストールドキュメントページをご覧ください。
サンプルJavaコードは、検索インデックス作成でブレンド文字を使用します
String indexFolder = "c:\\MyIndex\\";
String documentFolder = "c:\\MyDocuments\\";
// Creating an index in the specified folder
Index index = new Index(indexFolder);
// Setting hyphen character type to blended
index.getDictionaries().getAlphabet().setRange(new char[] { '-' }, CharacterType.Blended);
// Indexing documents from the specified folder
index.add(documentFolder);
// Searching in the index
SearchResult result1 = index.search("Elliot-Murray-Kynynmound");
SearchResult result2 = index.search("Elliot");
SearchResult result3 = index.search("Murray");
SearchResult result4 = index.search("Kynynmound");
製品ページ | ドキュメント | デモ | APIリファレンス | 例 | ブログ | 無料サポート | 一時ライセンス
Version | Release Date |
---|---|
25.4 | 2025年4月23日 |
24.4 | 2024年4月22日 |
24.2 | 2024年2月6日 |
24.1 | 2024年1月15日 |
23.6 | 2023年6月15日 |
23.3 | 2023年3月24日 |
22.11 | 2022年11月30日 |
22.10 | 2022年10月24日 |
21.2 | 2022年1月25日 |
20.8 | 2022年1月25日 |
19.2 | 2022年1月25日 |
18.12 | 2022年1月25日 |
21.8 | 2021年8月18日 |
21.3 | 2021年3月18日 |
20.11 | 2020年11月19日 |
20.6 | 2020年6月23日 |
20.4 | 2020年4月16日 |
19.12 | 2019年12月11日 |
19.5.1 | 2019年7月15日 |
19.5 | 2019年5月31日 |
19.3 | 2019年3月7日 |
18.11 | 2018年11月1日 |
File | Classifier | Size |
---|---|---|
groupdocs-search-18.12-javadoc.jar | javadoc | 431 KB |
groupdocs-search-18.12.jar | 100 MB | |
groupdocs-search-18.12.pom | 702 bytes |