<repositories>
   <repository>
      <id>repository.groupdocs.com</id>
      <name>GroupDocs Repository</name>
      <url>https://releases.groupdocs.com/java/repo/</url>
   </repository>
</repositories>

<dependencies>
   <dependency>
      <groupId>com.groupdocs</groupId>
      <artifactId>groupdocs-search</artifactId>
      <version>22.11</version>
   </dependency>
</dependencies>
copied!  
repositories {
    maven {
        url 'https://releases.groupdocs.com/java/repo/'
    }
}

compile(group: 'com.groupdocs', name: 'groupdocs-search', version: '22.11')
copied!  
<ivysettings>
    <settings defaultResolver="chain"/>
    <resolvers>
        <chain name="chain">
            <ibiblio name="GroupDocs Repository" m2compatible="true" root="https://releases.groupdocs.com/java/repo/"/>
        </chain>
    </resolvers>
</ivysettings>

<dependency org="com.groupdocs" name="groupdocs-search" rev="22.11">
   <artifact name="groupdocs-search" ext="jar"/>
</dependency>
copied!  
resolvers += Resolver.url("GroupDocs Repository", url("https://releases.groupdocs.com/java/repo/"))

libraryDependencies += "com.groupdocs" % "groupdocs-search" % "22.11"
copied!  

High Code Java API для индекса и поисковых документов

main-banner

Страница продукта | Док | Демо | Ссылка на API | Примеры | Блог | Бесплатная поддержка | Временная лицензия

GroupDocssearch для Java-это локальный API Java, который поможет индексировать содержание документа и метаданные, выполнять поиск (логический, огражденный, нечеткий, домашний телефон) и извлечение пользовательского текста, применить поисковые фильтры и выделять результаты.

Поиск и индекс Java Upi Features API

Индексирование функций API

  • Создать индекс поиска, применить настройки индекса и подписаться на события индекса.

  • Поддерживает индексацию документов из файла, потока или структуры данных.

  • объединить несколько индексов поиска в один.

  • Support is available for:

    • Дополнительные поля
    • обычные персонажи (разделители и буквы)
    • Смешанные символы (эти специальные символы индексируются как сепараторы, а также буквы, например, дефис)
    • символы индексированы как целое слово
    • Замена персонажа во время индексации
    • пользовательские текстовые экстракторы
  • Index files protected with password

  • Предоставляет варианты индекса компактных и метаданных.

  • Поддерживает различный уровень сжатия для сохранения извлеченного текста в индексе.

  • Способность фильтровать документы во время индексации.

  • Возможность удаления индексированных путей из индекса.

  • При индексации конвертируйте все символы в нижний регистр или удалите диаклитику из текста, используя замену символов.

  • Способность к Укажите желаемый набор символов как буквы.

  • Реализуйте поддержку пользовательского текстового экстрактора, а затем используйте этот пользовательский экстрактор для индексации.

  • Удалить или удалить желаемые документы из индекса поиска.

  • Удалить или удалить индексированные папки и файлы из индекса.

  • Отметьте индексированные документы с текстовыми метками без индексации.

  • Фильтруя документы во время поиска через атрибуты применения документа.

  • Применить различные типы фильтров во время индексации, such as:

    • Фильтр времени создания (то есть файлы пропуска, созданные ранее/позже определенной даты, или за пределами предоставленного диапазона даты)
    • Фильтр времени модификации (так же, как фильтр времени создания, но работает на дату изменения документа)
    • Фильтр пути файла (примените Regex, чтобы пропустить файлы с полными путями, не соответствующими указанному шаблону)
    • Фильтр длины файла (укажите нижнюю/верхнюю границу или диапазон приемлемой длины файла в байтах)
    • Фильтр расширения файла (будут индексированы только файлы, соответствующие списку указанных расширений файлов)
    • логично не фильтр (инвертировать логику внутреннего фильтра)
    • Логический и фильтр (композитный фильтр, который требует успеха всех внутренних фильтров)
    • Логический или фильтр (композитный фильтр, который требует как минимум одного внутреннего фильтра для успеха)
  • Rename any indexed document without requiring it to reindex during the update

  • Добавьте дополнительные поля в индексированные документы, чтобы связать больше метаданных.

  • Возможность сохранить текст документа в индексе.

Поиск функций API

  • Supports various types of searches, such as:

    • Логический поиск

      • Поддерживает и или, не операторы.
      • Объедините несколько логических поисковых ускорений, чтобы сочинять царапины Comlex.
    • Чувствительный к случаю поиск рассматривает верхние и нижние символы как отличные.

    • Поиск диапазона дат Поиск на основе предоставленного диапазона дат в указанном формате даты.

    • Окрашенные поиск Поиск только в указанных полях вместо всего документа.

    • Нечеткий поиск Поиск, который обнаруживает неправильные слова, правильно написанные словами, используя нечеткую логику.

    • Поиск гомофона Поиск слов, которые похожи по звуку (произношение) с поисковым словом.

  • Принесите текст индексированных документов в формате html.

  • Apply various filters while searching documents, such as:

    • Фильтр пути файла (примените Regex для получения файлов с полными путями, соответствующими указанной шаблоне)
    • Фильтр расширения файла (возвращает файлы, соответствующие списку указанных расширений файлов)
    • Фильтр атрибутов (возвращает файлы, с которыми связаны указанные атрибуты)
    • Комбинированные фильтры (применить композитные фильтры и не составлять сложные запросы)
  • После поиска можно выделить найденные результирующие слова и фразы в содержании документа.

  • Включите опцию Коррекция макета клавиатуры, чтобы заменить неподдерживаемые символы ключевых слов на реальные символы.

  • Поиск разных форм слов, например, существительное, прилагательное, формы глаголов и т. Д.

Поисково -словарь управления функциями API

  • Various types of словари can be used & managed, such as:
    • Словарь псевдонима
    • Словарь алфавита
    • Словарь замены персонажа
    • Документировать словарь паролей
    • Словарь гомофона
    • Корректор орфографии
    • Остановить словарь слов
    • Словарь синонима
    • Поставщик форм слов

Поддерживаемые форматы файлов поиска документов

Операция содержимого индексации поддерживается для следующих форматов файлов: Microsoft Word & Reg ;: DOC/DOT/DOCX/DOCM/DOTX/DOTM/RTF/TXT
openoffice writer & reg ;: ODT/OTT
Microsoft Excel & Reg ;: xls/xlt/xlsx/xlsm/xlsb/xltx/xltm/xla/xlam
OpenOffice Calc & Reg ;: ODS/OTS/CSV/TSV/Spreadsheetml
Microsoft PowerPoint & Reg ;: ppt/pps/pot/pptx/pptm/potx/potm/ppsx/ppsm
OpenOffice Impress & Reg ;: ODP
Microsoft Outlook & Reg ;: PST/OST/EML/MSG
Apple & Reg; Почтовое сообщение: emlx
Microsoft OneNote & Reg ;: One
markup: html/xhtml/mhtml/md/xml
Электронная книга: CHM/EPUB/FB2
Архив: Zip
Фиксированный макет: pdf Операция метаданных индексации поддерживается для следующих форматов файлов: Microsoft Word & Reg ;: DOC/DOT/DOCX/DOCM/DOTX/DOTM/RTF/TXT
openoffice writer & reg ;: ODT/OTT
Microsoft Excel & Reg ;: xls/xlt/xlsx/xlsm/xlsb/xltx/xltm/xla/xlam
OpenOffice Calc & Reg ;: ODS/OTS/CSV/TSV/Spreadsheetml
Microsoft PowerPoint & Reg ;: ppt/pps/pot/pptx/pptm/potx/potm/ppsx/ppsm
OpenOffice Impress & Reg ;: ODP
Microsoft Outlook & Reg ;: PST/OST/EML/MSG
Apple & Reg; Почтовое сообщение: emlx
Microsoft OneNote & Reg ;: One
Microsoft Project & Reg ;: MPP
Microsoft Visio & Reg ;: vsd/vss
markup: html/xhtml/mhtml/md/xml
Электронная книга: CHM/EPUB/FB2
Архив: Zip
Audio: mp3/wav
Видео: AVI/MOV/QT/FLV/ASF
Изображение: BMP/GIF/JP2/PNG/WEBP/TIFF/JPG/DJVU
Adobe Photoshop & Reg ;: psd
Медицинская визуализация: dcm/dicom
метаданные: EMF/WMF
Фиксированный макет: pdf
BitTorrent: торрент

Для получения подробной информации и ограничений, пожалуйста, посетите, Поддерживаемые форматы документов.

Системные Требования

  • Microsoft Windows: Windows Desktop & Server (x86, x64), Microsoft Azure
  • macOS: Mac OS X
  • Linux: Ubuntu, OpenSuse, Centos и другие
  • java версии: j2se 7.0 (1.7), j2se 8.0 (1.8) или выше (например, Java 10)

GroupDocs.search для Java не требует установки внешнего программного обеспечения или стороннего инструмента. Просто следуйте по одному из способов, как описано в Установка и конфигурация.

Начать

GroupDocs размещает все API Java на GroupDocs Repository. Вы можете легко использовать GroupDocs.search для Java API непосредственно в ваших проектах Maven с простыми конфигурациями. Для получения подробных инструкций, пожалуйста, посетите страницу документации Установка из репозитория GroupDocs с использованием Maven.

Образец кода Java для использования смешанных символов в индексации поиска

String indexFolder = "c:\\MyIndex\\";
String documentFolder = "c:\\MyDocuments\\";

// Creating an index in the specified folder
Index index = new Index(indexFolder);

// Setting hyphen character type to blended
index.getDictionaries().getAlphabet().setRange(new char[] { '-' }, CharacterType.Blended);

// Indexing documents from the specified folder
index.add(documentFolder);

// Searching in the index
SearchResult result1 = index.search("Elliot-Murray-Kynynmound");
SearchResult result2 = index.search("Elliot");
SearchResult result3 = index.search("Murray");
SearchResult result4 = index.search("Kynynmound");

Страница продукта | Док | Демо | Ссылка на API | Примеры | Блог | Бесплатная поддержка | Временная лицензия

VersionRelease Date
22.1130 ноября 2022 г.
22.1024 октября 2022 г.
21.225 января 2022 г.
20.825 января 2022 г.
19.225 января 2022 г.
18.1225 января 2022 г.
21.818 августа 2021 г.
21.318 марта 2021 г.
20.1119 ноября 2020 г.
20.623 июня 2020 г.
20.416 апреля 2020 г.
19.1211 декабря 2019 г.
19.5.115 июля 2019 г.
19.531 мая 2019 г.
19.37 марта 2019 г.
18.111 ноября 2018 г.