<repositories>
<repository>
<id>repository.groupdocs.com</id>
<name>GroupDocs Repository</name>
<url>https://releases.groupdocs.com/java/repo/</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-search</artifactId>
<version>22.11</version>
</dependency>
</dependencies>
repositories {
maven {
url 'https://releases.groupdocs.com/java/repo/'
}
}
compile(group: 'com.groupdocs', name: 'groupdocs-search', version: '22.11')
<ivysettings>
<settings defaultResolver="chain"/>
<resolvers>
<chain name="chain">
<ibiblio name="GroupDocs Repository" m2compatible="true" root="https://releases.groupdocs.com/java/repo/"/>
</chain>
</resolvers>
</ivysettings>
<dependency org="com.groupdocs" name="groupdocs-search" rev="22.11">
<artifact name="groupdocs-search" ext="jar"/>
</dependency>
resolvers += Resolver.url("GroupDocs Repository", url("https://releases.groupdocs.com/java/repo/"))
libraryDependencies += "com.groupdocs" % "groupdocs-search" % "22.11"
ハイコードJava APIインデックスおよび検索ドキュメント
製品ページ | ドキュメント | デモ | APIリファレンス | 例 | ブログ | 無料サポート | 一時ライセンス
JavaのGroupDocsSearchは、ドキュメントコンテンツとメタデータのインデックス作成、検索(ブール、ファセット、ファジー、ホームフォン)およびカスタムテキスト抽出を実行し、検索フィルターを適用し、結果を強調表示するためのオンプレミスJava APIです。
検索&インデックスJavaオンプレミスAPI機能
インデックス付けAPI機能
検索インデックスを作成し、インデックス設定を適用し、インデックスイベントを購読します。
ファイル、ストリーム、またはデータ構造からのインデックスドキュメントをサポートします。
複数の検索インデックスを1つにマージします。
Support is available for:
- 追加のフィールド
- 通常のキャラクター(セパレーターと文字)
- ブレンドキャラクター(これらの特殊文字は、文字だけでなくセパレーターとしてインデックス付けされています。たとえば、ハイフンなど)
- 単語全体としてインデックス付けされた文字
- インデックス作成中の文字交換
- カスタムテキスト抽出器
Index files protected with password
コンパクトおよびメタデータインデックスオプションを提供します。
異なるレベルの圧縮をサポートして、抽出されたテキストをインデックスに保存します。
インデックス作成中にドキュメントをフィルタリングする機能。
インデックスからインデックス付きパスを削除するオプション。
インデックス作成中は、すべての文字を小文字に変換するか、文字置き換えを使用してテキストからディクリティックスを削除します。
カスタムテキスト抽出器のサポートを実装し、そのカスタム抽出器をインデックスに使用します。
-検索インデックスから目的のドキュメントを削除または削除します。
- インデックスからインデックス付きフォルダーとファイルを削除または削除します。
- 再インデックスせずにテキストラベルを使用したインデックス付きドキュメントをマークします。 -Applied Document属性を介して検索中にドキュメントをフィルタリングします。
- インデックス作成中にさまざまな種類のフィルターを適用します, such as:
- 作成タイムフィルター(つまり、特定の日付よりも早く/後に作成されたファイルをスキップする、または提供された日付範囲の外側)
- 変更時間フィルター(作成時間フィルターと同じが、ドキュメントの変更日で動作する)
- ファイルパスフィルター(正規表現を適用して、指定されたパターンと一致しないフルパスでファイルをスキップします)
- ファイル長フィルター(下/上限、またはバイトで許容可能なファイル長の範囲を指定)
- ファイル拡張フィルター(指定されたファイル拡張子のリストに一致するファイルのみがインデックス化されます) -Logical Not Filter(内部フィルターの論理を反転)
- 論理とフィルター(すべての内部フィルターが成功するために必要なコンポジットフィルター)
- 論理またはフィルター(成功するために少なくとも1つの内部フィルターを必要とする複合フィルター)
- Rename any indexed document without requiring it to reindex during the update
- インデックス付きドキュメントに追加のフィールドを追加して、より多くのメタデータを関連付けます。
- インデックスにドキュメントテキストを保存する機能。
API機能の検索
Supports various types of searches, such as:
- サポートおよび、または、オペレーターではありません。
- 複数のブール検索クーリーを組み合わせて、comlex curiesを作成します。
-ケースに敏感な検索は、大文字と小文字の文字を明確であると考えています。
-日付範囲検索指定された日付形式の提供された日付範囲に基づいて検索。
-ファセット検索ドキュメント全体ではなく、指定されたフィールド内でのみ検索します。
-ファジー検索ファジーロジックを使用して間違ったスペルの単語を正しく検出する検索。
-同性愛者の検索検索された単語に音(発音)が似ている単語を検索します。
「HTML」形式でインデックス付きドキュメントのテキストを取得します。
Apply various filters while searching documents, such as:
- ファイルパスフィルター(正規表現を適用して、指定されたパターンに一致するフルパスでファイルを取得します)
- ファイル拡張フィルター(指定されたファイル拡張子のリストに一致するファイルを返します)
- 属性フィルター(指定された属性が関連付けられているファイルを返します)
- 組み合わせたフィルター(複合フィルターを適用し、または複雑なクエリを作成しないでください)
検索後、ドキュメント内のコンテンツ内で発見された結果の単語とフレーズを強調表示できます。
-キーボードレイアウト修正オプションを有効にして、サポートされていないキーワード文字を実際の文字に置き換えます。
-さまざまな単語形式を検索します、名詞、形容詞、動詞の形式など
辞書管理API機能を検索します
- Various types of 辞書 can be used & managed, such as:
- エイリアス辞書
- アルファベット辞書
- 文字交換辞書
- パスワード辞書を文書化します
- ホモホン辞書
- スペル修正器
- 単語辞書を停止します
- 同義語辞書 -Wordフォームプロバイダー
サポートされているドキュメント検索ファイル形式
インデックス作成コンテンツ操作は、次のファイル形式でサポートされています。
Microsoft Word&Reg;: doc/dot/docx/docm/dotx/dotm/rtf/txt
OpenOffice Writer&Reg;: odt/ott
Microsoft Excel&Reg;: XLS/XLT/XLSX/XLSM/XLSB/XLTX/XLTM/XLA/XLA
OpenOffice calc&reg;: ods/ots/csv/tsv/spreadsheetml
Microsoft PowerPoint&Reg;: PPT/PPS/POT/PPTX/PPTM/POTX/POTM/PPSX/PPSM
OpenOffice Impress&Reg;: odp
Microsoft Outlook&Reg;: PST/OST/EML/MSG
Apple&Reg;メールメッセージ: emlx
Microsoft Onenote&Reg;: One
マークアップ: html/xhtml/mhtml/md/xml
電子ブック: CHM/EPUB/FB2
アーカイブ: zip
レイアウトを修正: PDF
インデックス作成メタデータ操作は、次のファイル形式でサポートされています。
Microsoft Word&Reg;: doc/dot/docx/docm/dotx/dotm/rtf/txt
OpenOffice Writer&Reg;: odt/ott
Microsoft Excel&Reg;: XLS/XLT/XLSX/XLSM/XLSB/XLTX/XLTM/XLA/XLA
OpenOffice calc&reg;: ods/ots/csv/tsv/spreadsheetml
Microsoft PowerPoint&Reg;: PPT/PPS/POT/PPTX/PPTM/POTX/POTM/PPSX/PPSM
OpenOffice Impress&Reg;: odp
Microsoft Outlook&Reg;: PST/OST/EML/MSG
Apple&Reg;メールメッセージ: emlx
Microsoft Onenote&Reg;: One
Microsoft Project&Reg;: mpp
Microsoft Visio&Reg;: vsd/vss
マークアップ: html/xhtml/mhtml/md/xml
電子ブック: CHM/EPUB/FB2
アーカイブ: zip
オーディオ: mp3/wav
ビデオ: avi/mov/qt/flv/asf
画像: bmp/gif/jp2/png/webp/tiff/jpg/djvu
Adobe Photoshop&Reg;: psd
医療イメージング: dcm/dicom
メタデータ: emf/wmf
修正レイアウト: PDF
Bittorrent: Torrent
詳細と制限については、サポートされているドキュメント形式をご覧ください。
システム要求
- Microsoft Windows Windows Desktop&Server(x86、x64)、Microsoft Azure
- macOS: Mac OS X
- linux: ubuntu、opensuse、centosなど
- Javaバージョン:
J2SE 7.0(1.7)
、J2SE 8.0(1.8)
以下(たとえばJava 10)
GroupDocs.Search for Javaでは、外部ソフトウェアまたはサードパーティのツールをインストールする必要はありません。 インストールと構成で説明されている方法の1つに従ってください。
始めましょう
GroupDocsは、GroupDocsリポジトリですべてのJava APIをホストしています。簡単な構成を使用して、MavenプロジェクトでGroupDocs.search for Java APIを簡単に使用できます。詳細な手順については、Mavenを使用したGroupDocsリポジトリからのインストールドキュメントページをご覧ください。
サンプルJavaコードは、検索インデックス作成でブレンド文字を使用します
String indexFolder = "c:\\MyIndex\\";
String documentFolder = "c:\\MyDocuments\\";
// Creating an index in the specified folder
Index index = new Index(indexFolder);
// Setting hyphen character type to blended
index.getDictionaries().getAlphabet().setRange(new char[] { '-' }, CharacterType.Blended);
// Indexing documents from the specified folder
index.add(documentFolder);
// Searching in the index
SearchResult result1 = index.search("Elliot-Murray-Kynynmound");
SearchResult result2 = index.search("Elliot");
SearchResult result3 = index.search("Murray");
SearchResult result4 = index.search("Kynynmound");
製品ページ | ドキュメント | デモ | APIリファレンス | 例 | ブログ | 無料サポート | 一時ライセンス
GroupDocs.Total GroupDocs.Search API on premise DOC DOT DOCX DOCM DOTX DOTM RTF TXT ODT OTT XLS XLT XLSX XLSM XLSB XLTX XLTM XLA XLAM ODS OTS CSV TSV SpreadsheetML PPT PPS POT PPTX PPTM POTX POTM PPSX PPSM ODP PST OST EML MSG EMLX ONE MPP VSD VSS HTML XHTML MHTML MD XML CHM EPUB FB2 ZIP MP3 WAV AVI MOV QT FLV ASF BMP GIF JP2 PNG WEBP TIFF JPG DJVU PSD DCM DICOM EMF WMF PDF TORRENT search-index regular characters blended regular-characters blended-characters index password protected password-protected compression extract extraction diacritics extractor indexing attributes filter regex regular expression regular-expression faceted search fuzzy homophone dictionary alias alphabet synonym windows macOS Linux J2SE document automation