<repositories>
   <repository>
      <id>repository.groupdocs.com</id>
      <name>GroupDocs Repository</name>
      <url>https://releases.groupdocs.com/java/repo/</url>
   </repository>
</repositories>

<dependencies>
   <dependency>
      <groupId>com.groupdocs</groupId>
      <artifactId>groupdocs-search</artifactId>
      <version>22.11</version>
   </dependency>
</dependencies>
copied!  
repositories {
    maven {
        url 'https://releases.groupdocs.com/java/repo/'
    }
}

compile(group: 'com.groupdocs', name: 'groupdocs-search', version: '22.11')
copied!  
<ivysettings>
    <settings defaultResolver="chain"/>
    <resolvers>
        <chain name="chain">
            <ibiblio name="GroupDocs Repository" m2compatible="true" root="https://releases.groupdocs.com/java/repo/"/>
        </chain>
    </resolvers>
</ivysettings>

<dependency org="com.groupdocs" name="groupdocs-search" rev="22.11">
   <artifact name="groupdocs-search" ext="jar"/>
</dependency>
copied!  
resolvers += Resolver.url("GroupDocs Repository", url("https://releases.groupdocs.com/java/repo/"))

libraryDependencies += "com.groupdocs" % "groupdocs-search" % "22.11"
copied!  

Kode Tinggi Java API ke Dokumen Indeks & Pencarian

main-banner

Halaman produk | Dokumen | Demo | Referensi API | Contoh | Blog | Dukungan gratis | Lisensi sementara

GroupDocssearch untuk Java adalah Java API di tempat untuk membantu pengindeksan konten dokumen & metadata, melakukan pencarian (boolean, faceted, fuzzy, homephone) & ekstraksi teks khusus, menerapkan filter pencarian, dan hasil sorotan.

Cari & Indeks Fitur API On-Premise Java

Fitur API Pengindeksan

  • Buat indeks pencarian, terapkan pengaturan indeks, & berlangganan acara indeks.

  • Mendukung dokumen pengindeksan dari file, stream, atau struktur data.

  • Gabungkan beberapa indeks pencarian menjadi satu.

  • Support is available for:

    • Bidang tambahan
    • Karakter reguler (pemisah & huruf)
    • Karakter campuran (karakter khusus ini diindeks sebagai pemisah dan juga huruf, mis. Hyphen)
    • Karakter yang diindeks sebagai satu kata
    • Penggantian karakter selama pengindeksan
    • Ekstraktor teks khusus
  • Index files protected with password

  • Menyediakan opsi indeks kompak dan metadata.

  • Mendukung tingkat kompresi yang berbeda untuk menyimpan teks yang diekstraksi dalam indeks.

  • Kemampuan untuk memfilter dokumen selama pengindeksan.

  • Opsi untuk menghapus jalur yang diindeks dari indeks.

  • Saat mengindeks, konversi semua karakter ke huruf kecil atau hapus diakritik dari teks menggunakan penggantian karakter.

  • Kemampuan Tentukan kumpulan karakter yang diinginkan sebagai huruf.

  • Menerapkan dukungan untuk ekstraktor teks khusus dan kemudian menggunakan ekstraktor khusus untuk pengindeksan.

  • Hapus atau hapus dokumen yang diinginkan dari indeks pencarian.

  • Hapus atau hapus folder & file yang diindeks dari indeks.

  • Tandai dokumen yang diindeks dengan label teks tanpa mengindeks ulang.

  • Filter dokumen selama pencarian melalui atribut dokumen yang diterapkan.

  • Terapkan berbagai jenis filter saat pengindeksan, such as:

    • Filter Waktu Pembuatan (mis. Lewati file yang dibuat lebih awal/lebih lambat dari tanggal tertentu, atau di luar kisaran tanggal yang disediakan)
    • Filter Waktu Modifikasi (sama seperti filter waktu pembuatan tetapi berfungsi pada tanggal modifikasi dokumen)
    • Filter path file (Terapkan Regex untuk melewatkan file dengan jalur lengkap yang tidak cocok dengan pola yang ditentukan)
    • Filter panjang file (tentukan batas bawah/atas, atau kisaran panjang file yang dapat diterima dalam byte)
    • Filter ekstensi file (hanya file yang cocok dengan daftar ekstensi file yang ditentukan akan diindeks)
    • Logical not filter (membalikkan logika filter internal)
    • Logis dan Filter (filter komposit yang mengharuskan semua filter internal untuk berhasil)
    • Logical atau Filter (filter komposit yang membutuhkan setidaknya satu filter internal untuk berhasil)
  • Rename any indexed document without requiring it to reindex during the update

  • Tambahkan bidang tambahan ke dokumen yang diindeks untuk mengaitkan lebih banyak metadata.

  • Kemampuan untuk menyimpan teks dokumen dalam indeks.

Mencari fitur API

  • Supports various types of searches, such as:

    • Pencarian Boolean

      • mendukung dan, atau, bukan operator.
      • Gabungkan beberapa qual pencarian boolean untuk menyusun quran comlex.
    • Pencarian Sensitif Kasus menganggap karakter huruf besar & huruf kecil berbeda.

    • Pencarian Pencarian rentang tanggal berdasarkan kisaran tanggal yang disediakan dalam format tanggal yang ditentukan.

    • Pencarian faceted Pencarian hanya dalam bidang yang ditentukan, bukan seluruh dokumen.

    • Pencarian Pencarian fuzzy yang mendeteksi kata -kata ejaan yang salah dengan benar menggunakan logika fuzzy.

    • Pencarian homofon Pencarian kata -kata yang serupa dalam suara (pengucapan) dengan kata yang dicari.

  • Ambil teks dokumen yang diindeks dalam format html.

  • Apply various filters while searching documents, such as:

    • Filter path file (Terapkan Regex untuk mengambil file dengan jalur lengkap yang cocok dengan pola yang ditentukan)
    • Filter ekstensi file (Mengembalikan file yang cocok dengan daftar ekstensi file yang ditentukan)
    • Filter atribut (mengembalikan file dengan siapa atribut yang ditentukan terkait)
    • Filter gabungan (terapkan filter komposit dan, atau, bukan untuk menyusun pertanyaan yang kompleks)
  • Setelah pencarian, kata & frasa yang dihasilkan yang ditemukan dalam konten dokumen dapat disorot.

  • Mengaktifkan opsi Koreksi tata letak keyboard untuk mengganti karakter kata kunci yang tidak didukung dengan karakter yang sebenarnya.

  • Cari bentuk kata yang berbeda, seperti, kata benda, kata sifat, bentuk kata kerja dll.

Fitur API Manajemen Kamus Pencarian

  • Various types of Kamus can be used & managed, such as:
    • Kamus alias
    • Kamus Alfabet
    • Kamus Penggantian Karakter
    • Kamus Kata Sandi Dokumen
    • Kamus Homofon
    • Korektor ejaan
    • Hentikan Kamus Kata
    • Kamus Sinonim
    • Penyedia bentuk kata

Format file pencarian dokumen yang didukung

Operasi konten pengindeksan didukung untuk format file berikut: Microsoft Word & Reg ;: Doc/dot/docx/docm/dotx/dotm/rtf/txt
OpenOffice Writer & Reg ;: Odt/Ott
Microsoft Excel & Reg ;: XLS/XLT/XLSX/XLSM/XLSB/XLTX/XLTM/XLA/XLAM
OpenOffice Calc & Reg ;: ODS/OTS/CSV/TSV/SPREADSHEETML
Microsoft PowerPoint & Reg ;: PPT/PPS/POT/PPTX/PPTM/POTX/POTM/PPSX/PPSM
OpenOffice Impress & Reg ;: ODP
Microsoft Outlook & Reg ;: PST/OST/EML/MSG
Apple & Reg; Pesan Surat: EMLX
Microsoft OneNote & Reg ;: One
markup: html/xhtml/mhtml/md/xml
ebook: chm/epub/fb2
arsip: zip
Tata letak tetap: pdf Operasi metadata pengindeksan didukung untuk format file berikut: Microsoft Word & Reg ;: Doc/dot/docx/docm/dotx/dotm/rtf/txt
OpenOffice Writer & Reg ;: Odt/Ott
Microsoft Excel & Reg ;: XLS/XLT/XLSX/XLSM/XLSB/XLTX/XLTM/XLA/XLAM
OpenOffice Calc & Reg ;: ODS/OTS/CSV/TSV/SPREADSHEETML
Microsoft PowerPoint & Reg ;: PPT/PPS/POT/PPTX/PPTM/POTX/POTM/PPSX/PPSM
OpenOffice Impress & Reg ;: ODP
Microsoft Outlook & Reg ;: PST/OST/EML/MSG
Apple & Reg; Pesan Surat: EMLX
Microsoft OneNote & Reg ;: One
Microsoft Project & Reg ;: MPP
Microsoft Visio & Reg ;: VSD/VSS
markup: html/xhtml/mhtml/md/xml
ebook: chm/epub/fb2
arsip: zip
audio: mp3/wav
Video: avi/mov/qt/flv/asf
Gambar: BMP/GIF/JP2/PNG/WEBP/TIFF/JPG/DJVU
Adobe Photoshop & Reg ;: psd
Pencitraan Medis: DCM/DICOM
Metadata: EMF/WMF
Tata letak tetap: pdf
BitTorrent: torrent

Untuk detail dan batasan, silakan kunjungi, Format dokumen yang didukung.

Persyaratan sistem

  • Microsoft Windows: Windows Desktop & Server (x86, x64), Microsoft Azure
  • macOS: Mac OS X
  • Linux: Ubuntu, OpenSuse, Centos, dan lainnya
  • Versi Java: j2se 7.0 (1.7), j2se 8.0 (1.8) atau di atas (misalnya Java 10)

GroupDocs.search untuk Java tidak memerlukan perangkat lunak eksternal atau alat pihak ketiga untuk diinstal. Ikuti saja salah satu cara seperti yang dijelaskan dalam Instalasi dan Konfigurasi.

Memulai

GroupDocs menyelenggarakan semua API Java di Repositori GroupDocs. Anda dapat dengan mudah menggunakan GroupDocs.search untuk Java API secara langsung di proyek Maven Anda dengan konfigurasi sederhana. Untuk instruksi terperinci, silakan kunjungi halaman dokumentasi Instalasi dari Repositori GroupDocs Menggunakan Maven.

Contoh kode java untuk menggunakan karakter campuran dalam pengindeksan pencarian

String indexFolder = "c:\\MyIndex\\";
String documentFolder = "c:\\MyDocuments\\";

// Creating an index in the specified folder
Index index = new Index(indexFolder);

// Setting hyphen character type to blended
index.getDictionaries().getAlphabet().setRange(new char[] { '-' }, CharacterType.Blended);

// Indexing documents from the specified folder
index.add(documentFolder);

// Searching in the index
SearchResult result1 = index.search("Elliot-Murray-Kynynmound");
SearchResult result2 = index.search("Elliot");
SearchResult result3 = index.search("Murray");
SearchResult result4 = index.search("Kynynmound");

Halaman produk | Dokumen | Demo | Referensi API | Contoh | Blog | Dukungan gratis | Lisensi sementara

VersionRelease Date
22.1130 November 2022
22.1024 Oktober 2022
21.225 Januari 2022
20.825 Januari 2022
19.225 Januari 2022
18.1225 Januari 2022
21.818 Agustus 2021
21.318 Maret 2021
20.1119 November 2020
20.623 Juni 2020
20.416 April 2020
19.1211 Desember 2019
19.5.115 Juli 2019
19.531 Mei 2019
19.37 Maret 2019
18.111 November 2018