<repositories>
<repository>
<id>repository.groupdocs.com</id>
<name>GroupDocs Repository</name>
<url>https://releases.groupdocs.com/java/repo/</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-search</artifactId>
<version>22.11</version>
</dependency>
</dependencies>
repositories {
maven {
url 'https://releases.groupdocs.com/java/repo/'
}
}
compile(group: 'com.groupdocs', name: 'groupdocs-search', version: '22.11')
<ivysettings>
<settings defaultResolver="chain"/>
<resolvers>
<chain name="chain">
<ibiblio name="GroupDocs Repository" m2compatible="true" root="https://releases.groupdocs.com/java/repo/"/>
</chain>
</resolvers>
</ivysettings>
<dependency org="com.groupdocs" name="groupdocs-search" rev="22.11">
<artifact name="groupdocs-search" ext="jar"/>
</dependency>
resolvers += Resolver.url("GroupDocs Repository", url("https://releases.groupdocs.com/java/repo/"))
libraryDependencies += "com.groupdocs" % "groupdocs-search" % "22.11"
Kode Tinggi Java API ke Dokumen Indeks & Pencarian
Halaman produk | Dokumen | Demo | Referensi API | Contoh | Blog | Dukungan gratis | Lisensi sementara
GroupDocssearch untuk Java adalah Java API di tempat untuk membantu pengindeksan konten dokumen & metadata, melakukan pencarian (boolean, faceted, fuzzy, homephone) & ekstraksi teks khusus, menerapkan filter pencarian, dan hasil sorotan.
Cari & Indeks Fitur API On-Premise Java
Fitur API Pengindeksan
Buat indeks pencarian, terapkan pengaturan indeks, & berlangganan acara indeks.
Mendukung dokumen pengindeksan dari file, stream, atau struktur data.
Gabungkan beberapa indeks pencarian menjadi satu.
Support is available for:
- Bidang tambahan
- Karakter reguler (pemisah & huruf)
- Karakter campuran (karakter khusus ini diindeks sebagai pemisah dan juga huruf, mis. Hyphen)
- Karakter yang diindeks sebagai satu kata
- Penggantian karakter selama pengindeksan
- Ekstraktor teks khusus
Index files protected with password
Menyediakan opsi indeks kompak dan metadata.
Mendukung tingkat kompresi yang berbeda untuk menyimpan teks yang diekstraksi dalam indeks.
Kemampuan untuk memfilter dokumen selama pengindeksan.
Opsi untuk menghapus jalur yang diindeks dari indeks.
Saat mengindeks, konversi semua karakter ke huruf kecil atau hapus diakritik dari teks menggunakan penggantian karakter.
Kemampuan Tentukan kumpulan karakter yang diinginkan sebagai huruf.
Menerapkan dukungan untuk ekstraktor teks khusus dan kemudian menggunakan ekstraktor khusus untuk pengindeksan.
Hapus atau hapus dokumen yang diinginkan dari indeks pencarian.
Hapus atau hapus folder & file yang diindeks dari indeks.
Tandai dokumen yang diindeks dengan label teks tanpa mengindeks ulang.
Filter dokumen selama pencarian melalui atribut dokumen yang diterapkan.
Terapkan berbagai jenis filter saat pengindeksan, such as:
- Filter Waktu Pembuatan (mis. Lewati file yang dibuat lebih awal/lebih lambat dari tanggal tertentu, atau di luar kisaran tanggal yang disediakan)
- Filter Waktu Modifikasi (sama seperti filter waktu pembuatan tetapi berfungsi pada tanggal modifikasi dokumen)
- Filter path file (Terapkan Regex untuk melewatkan file dengan jalur lengkap yang tidak cocok dengan pola yang ditentukan)
- Filter panjang file (tentukan batas bawah/atas, atau kisaran panjang file yang dapat diterima dalam byte)
- Filter ekstensi file (hanya file yang cocok dengan daftar ekstensi file yang ditentukan akan diindeks)
- Logical not filter (membalikkan logika filter internal)
- Logis dan Filter (filter komposit yang mengharuskan semua filter internal untuk berhasil)
- Logical atau Filter (filter komposit yang membutuhkan setidaknya satu filter internal untuk berhasil)
Rename any indexed document without requiring it to reindex during the update
Tambahkan bidang tambahan ke dokumen yang diindeks untuk mengaitkan lebih banyak metadata.
Kemampuan untuk menyimpan teks dokumen dalam indeks.
Mencari fitur API
Supports various types of searches, such as:
- mendukung dan, atau, bukan operator.
- Gabungkan beberapa qual pencarian boolean untuk menyusun quran comlex.
Pencarian Sensitif Kasus menganggap karakter huruf besar & huruf kecil berbeda.
Pencarian Pencarian rentang tanggal berdasarkan kisaran tanggal yang disediakan dalam format tanggal yang ditentukan.
Pencarian faceted Pencarian hanya dalam bidang yang ditentukan, bukan seluruh dokumen.
Pencarian Pencarian fuzzy yang mendeteksi kata -kata ejaan yang salah dengan benar menggunakan logika fuzzy.
Pencarian homofon Pencarian kata -kata yang serupa dalam suara (pengucapan) dengan kata yang dicari.
Ambil teks dokumen yang diindeks dalam format
html
.Apply various filters while searching documents, such as:
- Filter path file (Terapkan Regex untuk mengambil file dengan jalur lengkap yang cocok dengan pola yang ditentukan)
- Filter ekstensi file (Mengembalikan file yang cocok dengan daftar ekstensi file yang ditentukan)
- Filter atribut (mengembalikan file dengan siapa atribut yang ditentukan terkait)
- Filter gabungan (terapkan filter komposit dan, atau, bukan untuk menyusun pertanyaan yang kompleks)
Setelah pencarian, kata & frasa yang dihasilkan yang ditemukan dalam konten dokumen dapat disorot.
Mengaktifkan opsi Koreksi tata letak keyboard untuk mengganti karakter kata kunci yang tidak didukung dengan karakter yang sebenarnya.
Cari bentuk kata yang berbeda, seperti, kata benda, kata sifat, bentuk kata kerja dll.
Fitur API Manajemen Kamus Pencarian
- Various types of Kamus can be used & managed, such as:
- Kamus alias
- Kamus Alfabet
- Kamus Penggantian Karakter
- Kamus Kata Sandi Dokumen
- Kamus Homofon
- Korektor ejaan
- Hentikan Kamus Kata
- Kamus Sinonim
- Penyedia bentuk kata
Format file pencarian dokumen yang didukung
Operasi konten pengindeksan didukung untuk format file berikut:
Microsoft Word & Reg ;: Doc/dot/docx/docm/dotx/dotm/rtf/txt
OpenOffice Writer & Reg ;: Odt/Ott
Microsoft Excel & Reg ;: XLS/XLT/XLSX/XLSM/XLSB/XLTX/XLTM/XLA/XLAM
OpenOffice Calc & Reg ;: ODS/OTS/CSV/TSV/SPREADSHEETML
Microsoft PowerPoint & Reg ;: PPT/PPS/POT/PPTX/PPTM/POTX/POTM/PPSX/PPSM
OpenOffice Impress & Reg ;: ODP
Microsoft Outlook & Reg ;: PST/OST/EML/MSG
Apple & Reg; Pesan Surat: EMLX
Microsoft OneNote & Reg ;: One
markup: html/xhtml/mhtml/md/xml
ebook: chm/epub/fb2
arsip: zip
Tata letak tetap: pdf
Operasi metadata pengindeksan didukung untuk format file berikut:
Microsoft Word & Reg ;: Doc/dot/docx/docm/dotx/dotm/rtf/txt
OpenOffice Writer & Reg ;: Odt/Ott
Microsoft Excel & Reg ;: XLS/XLT/XLSX/XLSM/XLSB/XLTX/XLTM/XLA/XLAM
OpenOffice Calc & Reg ;: ODS/OTS/CSV/TSV/SPREADSHEETML
Microsoft PowerPoint & Reg ;: PPT/PPS/POT/PPTX/PPTM/POTX/POTM/PPSX/PPSM
OpenOffice Impress & Reg ;: ODP
Microsoft Outlook & Reg ;: PST/OST/EML/MSG
Apple & Reg; Pesan Surat: EMLX
Microsoft OneNote & Reg ;: One
Microsoft Project & Reg ;: MPP
Microsoft Visio & Reg ;: VSD/VSS
markup: html/xhtml/mhtml/md/xml
ebook: chm/epub/fb2
arsip: zip
audio: mp3/wav
Video: avi/mov/qt/flv/asf
Gambar: BMP/GIF/JP2/PNG/WEBP/TIFF/JPG/DJVU
Adobe Photoshop & Reg ;: psd
Pencitraan Medis: DCM/DICOM
Metadata: EMF/WMF
Tata letak tetap: pdf
BitTorrent: torrent
Untuk detail dan batasan, silakan kunjungi, Format dokumen yang didukung.
Persyaratan sistem
- Microsoft Windows: Windows Desktop & Server (x86, x64), Microsoft Azure
- macOS: Mac OS X
- Linux: Ubuntu, OpenSuse, Centos, dan lainnya
- Versi Java:
j2se 7.0 (1.7)
,j2se 8.0 (1.8)
atau di atas (misalnya Java 10)
GroupDocs.search untuk Java tidak memerlukan perangkat lunak eksternal atau alat pihak ketiga untuk diinstal. Ikuti saja salah satu cara seperti yang dijelaskan dalam Instalasi dan Konfigurasi.
Memulai
GroupDocs menyelenggarakan semua API Java di Repositori GroupDocs. Anda dapat dengan mudah menggunakan GroupDocs.search untuk Java API secara langsung di proyek Maven Anda dengan konfigurasi sederhana. Untuk instruksi terperinci, silakan kunjungi halaman dokumentasi Instalasi dari Repositori GroupDocs Menggunakan Maven.
Contoh kode java untuk menggunakan karakter campuran dalam pengindeksan pencarian
String indexFolder = "c:\\MyIndex\\";
String documentFolder = "c:\\MyDocuments\\";
// Creating an index in the specified folder
Index index = new Index(indexFolder);
// Setting hyphen character type to blended
index.getDictionaries().getAlphabet().setRange(new char[] { '-' }, CharacterType.Blended);
// Indexing documents from the specified folder
index.add(documentFolder);
// Searching in the index
SearchResult result1 = index.search("Elliot-Murray-Kynynmound");
SearchResult result2 = index.search("Elliot");
SearchResult result3 = index.search("Murray");
SearchResult result4 = index.search("Kynynmound");
Halaman produk | Dokumen | Demo | Referensi API | Contoh | Blog | Dukungan gratis | Lisensi sementara
Version | Release Date |
---|---|
22.11 | 30 November 2022 |
22.10 | 24 Oktober 2022 |
21.2 | 25 Januari 2022 |
20.8 | 25 Januari 2022 |
19.2 | 25 Januari 2022 |
18.12 | 25 Januari 2022 |
21.8 | 18 Agustus 2021 |
21.3 | 18 Maret 2021 |
20.11 | 19 November 2020 |
20.6 | 23 Juni 2020 |
20.4 | 16 April 2020 |
19.12 | 11 Desember 2019 |
19.5.1 | 15 Juli 2019 |
19.5 | 31 Mei 2019 |
19.3 | 7 Maret 2019 |
18.11 | 1 November 2018 |
GroupDocs.Total GroupDocs.Search API on premise DOC DOT DOCX DOCM DOTX DOTM RTF TXT ODT OTT XLS XLT XLSX XLSM XLSB XLTX XLTM XLA XLAM ODS OTS CSV TSV SpreadsheetML PPT PPS POT PPTX PPTM POTX POTM PPSX PPSM ODP PST OST EML MSG EMLX ONE MPP VSD VSS HTML XHTML MHTML MD XML CHM EPUB FB2 ZIP MP3 WAV AVI MOV QT FLV ASF BMP GIF JP2 PNG WEBP TIFF JPG DJVU PSD DCM DICOM EMF WMF PDF TORRENT search-index regular characters blended regular-characters blended-characters index password protected password-protected compression extract extraction diacritics extractor indexing attributes filter regex regular expression regular-expression faceted search fuzzy homophone dictionary alias alphabet synonym windows macOS Linux J2SE document automation