<repositories>
<repository>
<id>repository.groupdocs.com</id>
<name>GroupDocs Repository</name>
<url>https://releases.groupdocs.com/java/repo/</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-search</artifactId>
<version>22.11</version>
</dependency>
</dependencies>
repositories {
maven {
url 'https://releases.groupdocs.com/java/repo/'
}
}
compile(group: 'com.groupdocs', name: 'groupdocs-search', version: '22.11')
<ivysettings>
<settings defaultResolver="chain"/>
<resolvers>
<chain name="chain">
<ibiblio name="GroupDocs Repository" m2compatible="true" root="https://releases.groupdocs.com/java/repo/"/>
</chain>
</resolvers>
</ivysettings>
<dependency org="com.groupdocs" name="groupdocs-search" rev="22.11">
<artifact name="groupdocs-search" ext="jar"/>
</dependency>
resolvers += Resolver.url("GroupDocs Repository", url("https://releases.groupdocs.com/java/repo/"))
libraryDependencies += "com.groupdocs" % "groupdocs-search" % "22.11"
High Code Java API для индекса и поисковых документов
Страница продукта | Док | Демо | Ссылка на API | Примеры | Блог | Бесплатная поддержка | Временная лицензия
GroupDocssearch для Java-это локальный API Java, который поможет индексировать содержание документа и метаданные, выполнять поиск (логический, огражденный, нечеткий, домашний телефон) и извлечение пользовательского текста, применить поисковые фильтры и выделять результаты.
Поиск и индекс Java Upi Features API
Индексирование функций API
Создать индекс поиска, применить настройки индекса и подписаться на события индекса.
Поддерживает индексацию документов из файла, потока или структуры данных.
объединить несколько индексов поиска в один.
Support is available for:
- Дополнительные поля
- обычные персонажи (разделители и буквы)
- Смешанные символы (эти специальные символы индексируются как сепараторы, а также буквы, например, дефис)
- символы индексированы как целое слово
- Замена персонажа во время индексации
- пользовательские текстовые экстракторы
Index files protected with password
Предоставляет варианты индекса компактных и метаданных.
Поддерживает различный уровень сжатия для сохранения извлеченного текста в индексе.
Способность фильтровать документы во время индексации.
Возможность удаления индексированных путей из индекса.
При индексации конвертируйте все символы в нижний регистр или удалите диаклитику из текста, используя замену символов.
Способность к Укажите желаемый набор символов как буквы.
Реализуйте поддержку пользовательского текстового экстрактора, а затем используйте этот пользовательский экстрактор для индексации.
Удалить или удалить индексированные папки и файлы из индекса.
Отметьте индексированные документы с текстовыми метками без индексации.
Фильтруя документы во время поиска через атрибуты применения документа.
Применить различные типы фильтров во время индексации, such as:
- Фильтр времени создания (то есть файлы пропуска, созданные ранее/позже определенной даты, или за пределами предоставленного диапазона даты)
- Фильтр времени модификации (так же, как фильтр времени создания, но работает на дату изменения документа)
- Фильтр пути файла (примените Regex, чтобы пропустить файлы с полными путями, не соответствующими указанному шаблону)
- Фильтр длины файла (укажите нижнюю/верхнюю границу или диапазон приемлемой длины файла в байтах)
- Фильтр расширения файла (будут индексированы только файлы, соответствующие списку указанных расширений файлов)
- логично не фильтр (инвертировать логику внутреннего фильтра)
- Логический и фильтр (композитный фильтр, который требует успеха всех внутренних фильтров)
- Логический или фильтр (композитный фильтр, который требует как минимум одного внутреннего фильтра для успеха)
Rename any indexed document without requiring it to reindex during the update
Добавьте дополнительные поля в индексированные документы, чтобы связать больше метаданных.
Возможность сохранить текст документа в индексе.
Поиск функций API
Supports various types of searches, such as:
- Поддерживает и или, не операторы.
- Объедините несколько логических поисковых ускорений, чтобы сочинять царапины Comlex.
Чувствительный к случаю поиск рассматривает верхние и нижние символы как отличные.
Поиск диапазона дат Поиск на основе предоставленного диапазона дат в указанном формате даты.
Окрашенные поиск Поиск только в указанных полях вместо всего документа.
Нечеткий поиск Поиск, который обнаруживает неправильные слова, правильно написанные словами, используя нечеткую логику.
Поиск гомофона Поиск слов, которые похожи по звуку (произношение) с поисковым словом.
Принесите текст индексированных документов в формате
html
.Apply various filters while searching documents, such as:
- Фильтр пути файла (примените Regex для получения файлов с полными путями, соответствующими указанной шаблоне)
- Фильтр расширения файла (возвращает файлы, соответствующие списку указанных расширений файлов)
- Фильтр атрибутов (возвращает файлы, с которыми связаны указанные атрибуты)
- Комбинированные фильтры (применить композитные фильтры и не составлять сложные запросы)
После поиска можно выделить найденные результирующие слова и фразы в содержании документа.
Включите опцию Коррекция макета клавиатуры, чтобы заменить неподдерживаемые символы ключевых слов на реальные символы.
Поиск разных форм слов, например, существительное, прилагательное, формы глаголов и т. Д.
Поисково -словарь управления функциями API
- Various types of словари can be used & managed, such as:
- Словарь псевдонима
- Словарь алфавита
- Словарь замены персонажа
- Документировать словарь паролей
- Словарь гомофона
- Корректор орфографии
- Остановить словарь слов
- Словарь синонима
- Поставщик форм слов
Поддерживаемые форматы файлов поиска документов
Операция содержимого индексации поддерживается для следующих форматов файлов:
Microsoft Word & Reg ;: DOC/DOT/DOCX/DOCM/DOTX/DOTM/RTF/TXT
openoffice writer & reg ;: ODT/OTT
Microsoft Excel & Reg ;: xls/xlt/xlsx/xlsm/xlsb/xltx/xltm/xla/xlam
OpenOffice Calc & Reg ;: ODS/OTS/CSV/TSV/Spreadsheetml
Microsoft PowerPoint & Reg ;: ppt/pps/pot/pptx/pptm/potx/potm/ppsx/ppsm
OpenOffice Impress & Reg ;: ODP
Microsoft Outlook & Reg ;: PST/OST/EML/MSG
Apple & Reg; Почтовое сообщение: emlx
Microsoft OneNote & Reg ;: One
markup: html/xhtml/mhtml/md/xml
Электронная книга: CHM/EPUB/FB2
Архив: Zip
Фиксированный макет: pdf
Операция метаданных индексации поддерживается для следующих форматов файлов:
Microsoft Word & Reg ;: DOC/DOT/DOCX/DOCM/DOTX/DOTM/RTF/TXT
openoffice writer & reg ;: ODT/OTT
Microsoft Excel & Reg ;: xls/xlt/xlsx/xlsm/xlsb/xltx/xltm/xla/xlam
OpenOffice Calc & Reg ;: ODS/OTS/CSV/TSV/Spreadsheetml
Microsoft PowerPoint & Reg ;: ppt/pps/pot/pptx/pptm/potx/potm/ppsx/ppsm
OpenOffice Impress & Reg ;: ODP
Microsoft Outlook & Reg ;: PST/OST/EML/MSG
Apple & Reg; Почтовое сообщение: emlx
Microsoft OneNote & Reg ;: One
Microsoft Project & Reg ;: MPP
Microsoft Visio & Reg ;: vsd/vss
markup: html/xhtml/mhtml/md/xml
Электронная книга: CHM/EPUB/FB2
Архив: Zip
Audio: mp3/wav
Видео: AVI/MOV/QT/FLV/ASF
Изображение: BMP/GIF/JP2/PNG/WEBP/TIFF/JPG/DJVU
Adobe Photoshop & Reg ;: psd
Медицинская визуализация: dcm/dicom
метаданные: EMF/WMF
Фиксированный макет: pdf
BitTorrent: торрент
Для получения подробной информации и ограничений, пожалуйста, посетите, Поддерживаемые форматы документов.
Системные Требования
- Microsoft Windows: Windows Desktop & Server (x86, x64), Microsoft Azure
- macOS: Mac OS X
- Linux: Ubuntu, OpenSuse, Centos и другие
- java версии:
j2se 7.0 (1.7)
,j2se 8.0 (1.8)
или выше (например, Java 10)
GroupDocs.search для Java не требует установки внешнего программного обеспечения или стороннего инструмента. Просто следуйте по одному из способов, как описано в Установка и конфигурация.
Начать
GroupDocs размещает все API Java на GroupDocs Repository. Вы можете легко использовать GroupDocs.search для Java API непосредственно в ваших проектах Maven с простыми конфигурациями. Для получения подробных инструкций, пожалуйста, посетите страницу документации Установка из репозитория GroupDocs с использованием Maven.
Образец кода Java для использования смешанных символов в индексации поиска
String indexFolder = "c:\\MyIndex\\";
String documentFolder = "c:\\MyDocuments\\";
// Creating an index in the specified folder
Index index = new Index(indexFolder);
// Setting hyphen character type to blended
index.getDictionaries().getAlphabet().setRange(new char[] { '-' }, CharacterType.Blended);
// Indexing documents from the specified folder
index.add(documentFolder);
// Searching in the index
SearchResult result1 = index.search("Elliot-Murray-Kynynmound");
SearchResult result2 = index.search("Elliot");
SearchResult result3 = index.search("Murray");
SearchResult result4 = index.search("Kynynmound");
Страница продукта | Док | Демо | Ссылка на API | Примеры | Блог | Бесплатная поддержка | Временная лицензия
Version | Release Date |
---|---|
22.11 | 30 ноября 2022 г. |
22.10 | 24 октября 2022 г. |
21.2 | 25 января 2022 г. |
20.8 | 25 января 2022 г. |
19.2 | 25 января 2022 г. |
18.12 | 25 января 2022 г. |
21.8 | 18 августа 2021 г. |
21.3 | 18 марта 2021 г. |
20.11 | 19 ноября 2020 г. |
20.6 | 23 июня 2020 г. |
20.4 | 16 апреля 2020 г. |
19.12 | 11 декабря 2019 г. |
19.5.1 | 15 июля 2019 г. |
19.5 | 31 мая 2019 г. |
19.3 | 7 марта 2019 г. |
18.11 | 1 ноября 2018 г. |
GroupDocs.Total GroupDocs.Search API on premise DOC DOT DOCX DOCM DOTX DOTM RTF TXT ODT OTT XLS XLT XLSX XLSM XLSB XLTX XLTM XLA XLAM ODS OTS CSV TSV SpreadsheetML PPT PPS POT PPTX PPTM POTX POTM PPSX PPSM ODP PST OST EML MSG EMLX ONE MPP VSD VSS HTML XHTML MHTML MD XML CHM EPUB FB2 ZIP MP3 WAV AVI MOV QT FLV ASF BMP GIF JP2 PNG WEBP TIFF JPG DJVU PSD DCM DICOM EMF WMF PDF TORRENT search-index regular characters blended regular-characters blended-characters index password protected password-protected compression extract extraction diacritics extractor indexing attributes filter regex regular expression regular-expression faceted search fuzzy homophone dictionary alias alphabet synonym windows macOS Linux J2SE document automation