<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-search</artifactId>
    <version>21.2</version>
</dependency>compile(group: 'com.groupdocs', name: 'groupdocs-search', version: '21.2')<dependency org="com.groupdocs" name="groupdocs-search" rev="21.2">
    <artifact name="groupdocs-search" ext="jar"/>
</dependency>libraryDependencies += "com.groupdocs" % "groupdocs-search" % "21.2"High Code Java API для индекса и поисковых документов
Страница продукта | Док | Демо | Ссылка на API | Примеры | Блог | Бесплатная поддержка | Временная лицензия
GroupDocssearch для Java-это локальный API Java, который поможет индексировать содержание документа и метаданные, выполнять поиск (логический, огражденный, нечеткий, домашний телефон) и извлечение пользовательского текста, применить поисковые фильтры и выделять результаты.
Поиск и индекс Java Upi Features API
Индексирование функций API
- Создать индекс поиска, применить настройки индекса и подписаться на события индекса. 
- Поддерживает индексацию документов из файла, потока или структуры данных. 
- объединить несколько индексов поиска в один. 
- Поддержка доступна для: - Дополнительные поля
- обычные персонажи (разделители и буквы)
- Смешанные символы (эти специальные символы индексируются как сепараторы, а также буквы, например, дефис)
- символы индексированы как целое слово
- Замена персонажа во время индексации
- пользовательские текстовые экстракторы
 
- Индексные файлы, защищенные паролем 
- Предоставляет варианты индекса компактных и метаданных. 
- Поддерживает различный уровень сжатия для сохранения извлеченного текста в индексе. 
- Способность фильтровать документы во время индексации. 
- Возможность удаления индексированных путей из индекса. 
- При индексации конвертируйте все символы в нижний регистр или удалите диаклитику из текста, используя замену символов. 
- Способность Укажите желаемый набор символов как буквы. 
- Реализуйте поддержку пользовательского текстового экстрактора, а затем используйте этот пользовательский экстрактор для индексации. 
- Удалить или удалить индексированные папки и файлы из индекса. 
- Отметьте индексированные документы с текстовыми метками без индексации. 
- Фильтруя документы во время поиска через атрибуты применения документа. 
- Применить различные типы фильтров во время индексации, например: - Фильтр времени создания (то есть файлы пропуска, созданные ранее/позже определенной даты, или за пределами предоставленного диапазона даты)
- Фильтр времени модификации (так же, как фильтр времени создания, но работает на дату изменения документа)
- Фильтр пути файла (примените Regex, чтобы пропустить файлы с полными путями, не соответствующими указанному шаблону)
- Фильтр длины файла (укажите нижнюю/верхнюю границу или диапазон приемлемой длины файла в байтах)
- Фильтр расширения файла (будут индексированы только файлы, соответствующие списку указанных расширений файлов)
- логично не фильтр (инвертировать логику внутреннего фильтра)
- Логический и фильтр (композитный фильтр, который требует успеха всех внутренних фильтров)
- Логический или фильтр (композитный фильтр, который требует как минимум одного внутреннего фильтра для успеха)
 
- Переименовать любой индексированный документ, не требуя, чтобы он был реиндекс во время обновления 
- Добавьте дополнительные поля в индексированные документы, чтобы связать больше метаданных. 
- Возможность сохранить текст документа в индексе. 
Поиск функций API
- Поддерживает различные типы поисков, например: - Поддерживает и или, не операторы.
- Объедините несколько логических поисковых ускорений, чтобы сочинять царапины Comlex.
 
- Чувствительный к случаю поиск рассматривает верхние и нижние символы как отличные. 
- Поиск диапазона дат Поиск на основе предоставленного диапазона дат в указанном формате даты. 
- Окрашенные поиск Поиск только в указанных полях вместо всего документа. 
- Нечеткий поиск Поиск, который обнаруживает неправильные слова, правильно написание слова, используя нечеткую логику. 
- Поиск гомофона Поиск слов, которые похожи по звуку (произношение) с поисковым словом. 
 
- Принесите текст индексированных документов в формате - html.
- Применяйте различные фильтры во время поиска документов, например: - Фильтр пути файла (примените Regex для получения файлов с полными путями, соответствующими указанной шаблоне)
- Фильтр расширения файла (возвращает файлы, соответствующие списку указанных расширений файлов)
- Фильтр атрибутов (возвращает файлы, с которыми связаны указанные атрибуты)
- Комбинированные фильтры (применить композитные фильтры и не составлять сложные запросы)
 
- После поиска можно выделить найденные результирующие слова и фразы в содержании документа. 
- Включите опцию Коррекция макета клавиатуры, чтобы заменить неподдерживаемые символы ключевых слов реальными символами. 
- Поиск разных форм слов, например, существительное, прилагательное, формы глаголов и т. Д. 
Поисково -словарь управления функциями API
- различные типы словари могут быть использованы и управляются, например:- Словарь псевдонима
- Словарь алфавита
- Словарь замены персонажа
- Документировать словарь паролей
- Словарь гомофона
- Корректор орфографии
- Остановить словарь слов
- Словарь синонима
- Поставщик форм слов
 
Поддерживаемые форматы файлов поиска документов
Операция содержимого индексации поддерживается для следующих форматов файлов:
Microsoft Word & Reg ;: DOC/DOT/DOCX/DOCM/DOTX/DOTM/RTF/TXT
openoffice writer & reg ;: ODT/OTT
Microsoft Excel & Reg ;: xls/xlt/xlsx/xlsm/xlsb/xltx/xltm/xla/xlam
OpenOffice Calc & Reg ;: ODS/OTS/CSV/TSV/Spreadsheetml
Microsoft PowerPoint & Reg ;: ppt/pps/pot/pptx/pptm/potx/potm/ppsx/ppsm
OpenOffice Impress & Reg ;: ODP
Microsoft Outlook & Reg ;: PST/OST/EML/MSG
Apple & Reg; Почтовое сообщение: emlx
Microsoft OneNote & Reg ;: One
markup: html/xhtml/mhtml/md/xml
Электронная книга: CHM/EPUB/FB2
Архив: Zip
Фиксированный макет: pdf
Операция метаданных индексации поддерживается для следующих форматов файлов:
Microsoft Word & Reg ;: DOC/DOT/DOCX/DOCM/DOTX/DOTM/RTF/TXT
openoffice writer & reg ;: ODT/OTT
Microsoft Excel & Reg ;: xls/xlt/xlsx/xlsm/xlsb/xltx/xltm/xla/xlam
OpenOffice Calc & Reg ;: ODS/OTS/CSV/TSV/Spreadsheetml
Microsoft PowerPoint & Reg ;: ppt/pps/pot/pptx/pptm/potx/potm/ppsx/ppsm
OpenOffice Impress & Reg ;: ODP
Microsoft Outlook & Reg ;: PST/OST/EML/MSG
Apple & Reg; Почтовое сообщение: emlx
Microsoft OneNote & Reg ;: One
Microsoft Project & Reg ;: MPP
Microsoft Visio & Reg ;: vsd/vss
markup: html/xhtml/mhtml/md/xml
Электронная книга: CHM/EPUB/FB2
Архив: Zip
Audio: mp3/wav
Видео: AVI/MOV/QT/FLV/ASF
Изображение: BMP/GIF/JP2/PNG/WEBP/TIFF/JPG/DJVU
Adobe Photoshop & Reg ;: psd
Медицинская визуализация: dcm/dicom
метаданные: EMF/WMF
Фиксированный макет: pdf
BitTorrent: торрент
Для получения подробной информации и ограничений, пожалуйста, посетите, Поддерживаемые форматы документов.
Системные Требования
- Microsoft Windows: Windows Desktop & Server (x86, x64), Microsoft Azure
- macOS: Mac OS X
- Linux: Ubuntu, OpenSuse, Centos и другие
- java версии: j2se 7.0 (1.7),j2se 8.0 (1.8)или выше (например, Java 10)
GroupDocs.search для Java не требует установки внешнего программного обеспечения или стороннего инструмента. Просто следуйте по одному из способов, как описано в Установка и конфигурация.
Начать
GroupDocs размещает все API Java на GroupDocs Repository. Вы можете легко использовать GroupDocs.search для Java API непосредственно в ваших проектах Maven с простыми конфигурациями. Для получения подробных инструкций, пожалуйста, посетите страницу документации Установка из репозитория GroupDocs с использованием Maven.
Образец кода Java для использования смешанных символов в индексации поиска
String indexFolder = "c:\\MyIndex\\";
String documentFolder = "c:\\MyDocuments\\";
 
// Creating an index in the specified folder
Index index = new Index(indexFolder);
 
// Setting hyphen character type to blended
index.getDictionaries().getAlphabet().setRange(new char[] { '-' }, CharacterType.Blended);
 
// Indexing documents from the specified folder
index.add(documentFolder);
 
// Searching in the index
SearchResult result1 = index.search("Elliot-Murray-Kynynmound");
SearchResult result2 = index.search("Elliot");
SearchResult result3 = index.search("Murray");
SearchResult result4 = index.search("Kynynmound");
Страница продукта | Док | Демо | Ссылка на API | Примеры | Блог | Бесплатная поддержка | Временная лицензия
| Version | Release Date | 
|---|---|
| 25.4 | 23 апреля 2025 г. | 
| 24.4 | 22 апреля 2024 г. | 
| 24.2 | 6 февраля 2024 г. | 
| 24.1 | 15 января 2024 г. | 
| 23.6 | 15 июня 2023 г. | 
| 23.3 | 24 марта 2023 г. | 
| 22.11 | 30 ноября 2022 г. | 
| 22.10 | 24 октября 2022 г. | 
| 21.2 | 25 января 2022 г. | 
| 20.8 | 25 января 2022 г. | 
| 19.2 | 25 января 2022 г. | 
| 18.12 | 25 января 2022 г. | 
| 21.8 | 18 августа 2021 г. | 
| 21.3 | 18 марта 2021 г. | 
| 20.11 | 19 ноября 2020 г. | 
| 20.6 | 23 июня 2020 г. | 
| 20.4 | 16 апреля 2020 г. | 
| 19.12 | 11 декабря 2019 г. | 
| 19.5.1 | 15 июля 2019 г. | 
| 19.5 | 31 мая 2019 г. | 
| 19.3 | 7 марта 2019 г. | 
| 18.11 | 1 ноября 2018 г. | 
| File | Classifier | Size | 
|---|---|---|
| groupdocs-search-21.2-javadoc.jar | javadoc | 714 KB | 
| groupdocs-search-21.2.jar | 258 MB | |
| groupdocs-search-21.2.pom | 3 KB | 

