Просмотрите наши продукты

If so you can download any of the below versions for testing. The product will function as normal except for an evaluation limitation. At the time of purchase we provide a license file via email that will allow the product to work in its full capacity. If you would also like an evaluation license to test without any restrictions for 30 days, please follow the directions provided here.

Загрузите JAR для извлечения и анализа текста через Java High Code API

GroupDocs.Parser для Java — это увлекательный API для извлечения текста из документов. Он извлекает текст и метаданные из Microsoft Word, Excel, PowerPoint, сообщений электронной почты, файлов-контейнеров, содержащих другие файлы, такие как ZIP-архивы, текстовые файлы и HTML, без установки какой-либо из этих программ для чтения документов. API извлечения текста выполняет операции с беспрецедентной точностью и скоростью. API также предоставляет удобные инструменты для определения кодировки, такой как UTF32 LE, UTF32 BE, UTF16 LE, UTF16 BE и другие.


Начать

GroupDocs.Parser для Java не требует установки какого-либо внешнего программного обеспечения или сторонних инструментов. Просто следуйте одному из способов, как описано в Установка и настройка.

Вы можете легко использовать GroupDocs.Parser для API Java непосредственно в своем проекте на основе Maven, добавив следующие конфигурации в файл pom.xml.

<репозиторий>
    groupdocs-artifacts-repository
    Репозиторий артефактов GroupDocs
    https://releases.groupdocs.com/java/repo/

<зависимость>
    com.groupdocs
    групповой анализатор документов
    <версия>22.6


{{ГИПЕРССЫЛКА1}} | {{ГИПЕРССЫЛКА2}} | {{ГИПЕРССЫЛКА3}} | {{ГИПЕРССЫЛКА4}} | {{ГИПЕРССЫЛКА5}} | {{ГИПЕРССЫЛКА6}} | {{ГИПЕРССЫЛКА7}} | {{ГИПЕРССЫЛКА8}}

Зачем скачивать GroupDocs.Parser для Java?

GroupDocs.Parser for Java – это локальный API, который позволяет вашим Java-приложениям анализировать и извлекать данные из различных форматов файлов. Он позволяет извлекать гиперссылки, таблицы, штрих-коды, текст, изображения, а также извлекать данные из ZIP-архивов, почтовых архивов, PDF-портфолио и баз данных. GroupDocs.Parser для Java можно использовать для определения определяемых пользователем шаблонов, содержащих фиксированные, регулярные выражения и связанные позиции полей для точного извлечения данных.

Извлечение текста и анализ функций Java On-Premise API

  • Разбор документов по пользовательскому шаблону
    • Создайте пользовательский шаблон с определениями полей данных и таблиц.
    • Анализировать документы через user-defined templates и извлекать данные, такие как счета, таблицы и т. д.
  • Поддерживает извлечение различных текстовых элементов, таких как:
    • Извлечение обычного текста
    • Извлечение форматированного текста в виде простого текста, HTML или Markdown (MD)
    • Извлечение структурированного текста в формате XML
    • Извлечение текстовой области по определенным координатам, стилю текста
    • Извлечение текста вокруг (в контексте) определенного слова
  • Поддерживает различные режимы извлечения, такие как:
    • Режим точного извлечения текста: режим извлечения текста по умолчанию с максимально возможным качеством текста.
    • Режим извлечения необработанного текста: режим извлечения с лучшей производительностью, но качество текста не такое точное, как в вышеупомянутом режиме.
  • Извлеките текст всего документа или извлеките только нужную страницу документа.
  • Возможность поиска документов по определенным ключевым словам или с помощью регулярных выражений.
  • Поддерживает извлечение метаданных и изображений из документов Microsoft Word®, Excel®, PowerPoint®, PDF® и других типов.
  • Извлечение оглавления (TOC) из форматов электронных книг Microsoft Office® Word® и EPUB.
  • Возможность извлечения данных из контейнеров (архивов), таких как ZIP, PDF-портфолио, OST-контейнеры и т. д.
  • Возможность перебирать поля формы и извлекать данные формы PDF.
  • Extract data from databases (например, Sqlite) через JDBC.
  • Извлечение информации из блокнотов Microsoft OneNote®.
  • Извлечь все гиперссылки из всего документа или с определенной страницы или только из определенной области страницы.

Поддерживаемые форматы файлов парсера документов

Microsoft Word®: DOC/DOT/DOCX/DOCM/DOTX/DOTM/RTF/TXT
OpenOffice Writer®: ODT/OTT/ Microsoft Excel®: XLS/XLT/XLSX/XLSM/XLSB/XLTX/XLTM/XLA/XLAM
OpenOffice Calc®: ODS/OTS/CSV
Apple® iWork: НОМЕРА
Microsoft PowerPoint®: PPT/PPS/POT/PPTX/PPTM/POTX/POTM/PPSX/PPSM
OpenOffice Impress®: ODP/OTP
Microsoft Outlook®: PST/OST/EML/MSG
Почтовое сообщение Apple®: EMLX
Microsoft OneNote®: ОДИН
Фиксированный макет: PDF
Постскриптум: PS
Разметка: XHTML/MHTML/MD/XML
Электронная книга: CHM/EPUB/FB2
Архив: ZIP/RAR/TAR/GZ/BZ2
Изображение: BMP/GIF/JPG/JPEG/JPE/JP2/PNG/TIF/TIFF/DJVU/J2K/WEBP
Вектор: SVG/SVGZ
Adobe Photoshop®: PSD
Медицинская визуализация: DICOM
Метаданные: EMF/WMF
База данных: JDBC

Подробности и ограничения см. на странице Supported Document Formats.

Системные Требования

  • Microsoft Windows®: Windows Desktop & Server (x86, x64), Microsoft Azure
  • macOS: Mac OS X
  • Linux: Ubuntu, OpenSUSE, CentOS и др.
  • Версии Java: J2SE 7.0 (1.7), J2SE 8.0 (1.8) или выше (например, Java 10)

{{ГИПЕРССЫЛКА1}} | {{ГИПЕРССЫЛКА2}} | {{ГИПЕРССЫЛКА3}} | {{ГИПЕРССЫЛКА4}} | {{ГИПЕРССЫЛКА5}} | {{ГИПЕРССЫЛКА6}} | {{ГИПЕРССЫЛКА7}} | {{ГИПЕРССЫЛКА8}}



Прямая загрузка

GroupDocs.parser для Java 19.5

Этот zip -файл содержит только сборки для GroupDocs.parser для Java 19.5

Добавлен: 5/29/2019 Загрузки:

Скачать

Размер файла: 102.8 MB

GroupDocs.parser для Java 22.6

Этот zip -файл содержит только сборки для GroupDocs.parser для Java

Добавлен: 6/7/2022 Загрузки:

Скачать

Размер файла: 137.8 MB

GroupDocs.parser для Java 22.3

Этот zip -файл содержит только сборки для GroupDocs.parser для Java

Добавлен: 3/18/2022 Загрузки:

Скачать

Размер файла: 137.8 MB

GroupDocs.parser для Java 21.2

Этот zip -файл содержит только сборки для GroupDocs.parser для Java

Добавлен: 2/27/2021 Загрузки:

Скачать

Размер файла: 123.8 MB

GroupDocs.parser для Java 20.12

Этот zip -файл содержит только сборки для GroupDocs.parser для Java

Добавлен: 12/30/2020 Загрузки:

Скачать

Размер файла: 117.7 MB

GroupDocs.parser для Java 20.8

Этот zip -файл содержит только сборки для GroupDocs.parser для Java 20.8

Добавлен: 8/19/2020 Загрузки:

Скачать

Размер файла: 118.0 MB

Groupdocs.parser для Java 20.6

Этот zip -файл содержит только сборки для GroupDocs.parser для Java 20.6

Добавлен: 6/30/2020 Загрузки:

Скачать

Размер файла: 113.4 MB

GroupDocs.parser для Java 20.5

Этот zip -файл содержит только сборки для GroupDocs.parser для Java 20.5

Добавлен: 5/14/2020 Загрузки:

Скачать

Размер файла: 101.2 MB

Groupdocs.parser для Java 20.3

Этот zip -файл содержит только сборки для GroupDocs.parser для Java 20.3

Добавлен: 4/1/2020 Загрузки:

Скачать

Размер файла: 101.0 MB

GroupDocs.parser для Java 20.1

Этот zip -файл содержит только сборки для GroupDocs.parser для Java 20.1

Добавлен: 2/4/2020 Загрузки:

Скачать

Размер файла: 101.0 MB

Groupdocs.parser для Java 19.11

Этот zip -файл содержит только сборки для GroupDocs.parser для Java 19.11

Добавлен: 12/3/2019 Загрузки:

Скачать

Размер файла: 104.4 MB

Groupdocs.parser для Java 18.12

Этот zip -файл содержит только сборки для GroupDocs.parser для Java 18.12

Добавлен: 12/11/2018 Загрузки:

Скачать

Размер файла: 97.9 MB

Groupdocs.parser для Java 18.11

Этот zip -файл содержит только сборки для GroupDocs.parser для Java 18.11

Добавлен: 11/8/2018 Загрузки:

Скачать

Размер файла: 96.9 MB


 Русский