製品を閲覧する

If so you can download any of the below versions for testing. The product will function as normal except for an evaluation limitation. At the time of purchase we provide a license file via email that will allow the product to work in its full capacity. If you would also like an evaluation license to test without any restrictions for 30 days, please follow the directions provided here.

Java High Code API を介してテキスト抽出および解析用の JAR をダウンロードする

GroupDocs.Parser for Java は、魅力的なドキュメント テキスト抽出 API です。 Microsoft Word、Excel、PowerPoint、電子メール メッセージ、ZIP アーカイブなどの他のファイルを含むコンテナ ファイル、プレーン テキスト ファイル、およびこれらのドキュメント リーダーがインストールされていない HTML からテキストとメタデータを抽出します。テキスト抽出 API は、これまでにない正確さと速度で操作を実行します。 API は、UTF32 LE、UTF32 BE、UTF16 LE、UTF16 BE などのエンコーディングを検出するための便利なツールも提供します。


始めましょう

GroupDocs.Parser for Java では、外部ソフトウェアやサードパーティ ツールをインストールする必要はありません。で説明されている方法のいずれかに従ってください インストールと構成.

以下の構成を pom.xml に追加することで、Maven ベースのプロジェクトで GroupDocs.Parser for Java API を直接簡単に使用できます。

<リポジトリ>
    groupdocs-artifacts-repository
    GroupDocs Artifacts リポジトリ
    https://releases.groupdocs.com/java/repo/

<依存関係>
    com.groupdocs
    groupdocs-parser
    <バージョン>22.6


Product Page | Docs | Demos | API Reference | Examples | Blog | Free Support | {{ハイパーリンク8}}

GroupDocs.Parser for Java をダウンロードする理由

GroupDocs.Parser for Java は、Java アプリケーションがさまざまな種類のファイル形式からデータを解析および抽出できるようにするオンプレミス API です。ハイパーリンク、テーブル、バーコード、テキスト、画像、および ZIP アーカイブ、電子メール アーカイブ、PDF ポートフォリオ、およびデータベースからのデータ抽出を抽出できます。 GroupDocs.Parser for Java を使用して、正確なデータ抽出のための固定、正規表現、およびリンクされたフィールド位置を含むユーザー定義のテンプレートを定義できます。

テキスト抽出と解析 Java オンプレミス API 機能

  • ユーザー定義のテンプレートによるドキュメントの解析
    • データ フィールドとテーブルの定義を含むユーザー定義のテンプレートを作成します。
    • user-defined templates を介してドキュメントを解析し、請求書、表などのデータを抽出します。
  • 次のようなさまざまなテキスト要素の抽出をサポートします。
    • 平文抽出
    • 単純なテキスト、HTML、または Markdown (MD) としてフォーマットされたテキストの抽出
    • XML形式での構造化テキスト抽出
    • 特定の座標、テキスト スタイルによるテキスト エリアの抽出
    • 特定の単語の周囲 (のコンテキスト) のテキストを抽出する
  • 次のようなさまざまな抽出モードをサポートします。
    • 正確なテキスト抽出モード: 最高のテキスト品質を備えたデフォルトのテキスト抽出モード。
    • Raw Text Extraction Mode: より優れたパフォーマンスの抽出モードですが、テキストの品質は前述のモードほど正確ではありません。
  • ドキュメント全体のテキストを抽出するか、目的のドキュメント ページのみを抽出します。
  • 特定のキーワードまたは正規表現を使用してドキュメントを検索する機能。
  • Microsoft Word®、Excel®、PowerPoint®、PDF® およびその他のドキュメント タイプからのメタデータ抽出と画像抽出をサポートします。
  • Microsoft Office® Word® & EPUB eBook 形式から目次 (TOC) を抽出します。
  • ZIP、PDF ポートフォリオ、OST コンテナーなどのコンテナー (アーカイブ) からデータを抽出する機能。
  • フォーム フィールドを繰り返し処理し、PDF フォーム データを抽出する機能。
  • Extract data from databases (例: Sqlite) JDBC 経由。
  • Microsoft OneNote® ノートブックから情報を抽出します。
  • ドキュメント全体、特定のページ、または特定のページ領域のみからすべてのハイパーリンクを抽出します。

サポートされているドキュメント パーサー ファイル形式

Microsoft Word®: DOC/DOT/DOCX/DOCM/DOTX/DOTM/RTF/TXT
OpenOffice Writer®: ODT/OTT/ Microsoft Excel®: XLS/XLT/XLSX/XLSM/XLSB/XLTX/XLTM/XLA/XLAM
OpenOffice Calc®: ODS/OTS/CSV
Apple® iWork: NUMBERS
Microsoft PowerPoint®: PPT/PPS/POT/PPTX/PPTM/POTX/POTM/PPSX/PPSM
OpenOffice Impress®: ODP/OTP
Microsoft Outlook®: PST/OST/EML/MSG
Apple® メール メッセージ: EMLX
Microsoft OneNote®: 1
固定レイアウト: PDF
追記: PS
マークアップ: XHTML/MHTML/MD/XML
電子書籍: CHM/EPUB/FB2
アーカイブ: ZIP/RAR/TAR/GZ/BZ2
画像: BMP/GIF/JPG/JPEG/JPE/JP2/PNG/TIF/TIFF/DJVU/J2K/WEBP
ベクトル: SVG/SVGZ
Adobe Photoshop®: PSD
医用画像処理: DICOM
メタデータ: EMF/WMF
データベース: JDBC

詳細と制限事項については、Supported Document Formats をご覧ください。

### システム要求

  • Microsoft Windows®: Windows デスクトップ & サーバー (x86、x64)、Microsoft Azure
  • macOS: Mac OS X
  • Linux: Ubuntu、OpenSUSE、CentOS など
  • Java バージョン: J2SE 7.0 (1.7)J2SE 8.0 (1.8) 以降 (Java 10 など)

Product Page | Docs | Demos | API Reference | Examples | Blog | Free Support | {{ハイパーリンク8}}



直接ダウンロード

GroupDocs.Parser for Java 19.5

このzipファイルには、groupdocs.parser for java 19.5のアセンブリのみが含まれています

追加した: 5/29/2019 ダウンロード:

ダウンロード

ファイルサイズ: 102.8 MB

GroupDocs.Parser for Java 22.6

このzipファイルには、groupdocs.parser用のアセンブリのみがJavaに含まれています

追加した: 6/7/2022 ダウンロード:

ダウンロード

ファイルサイズ: 137.8 MB

GroupDocs.Parser for Java 22.3

このzipファイルには、groupdocs.parser用のアセンブリのみがJavaに含まれています

追加した: 3/18/2022 ダウンロード:

ダウンロード

ファイルサイズ: 137.8 MB

GroupDocs.Parser for Java 21.2

このzipファイルには、groupdocs.parser用のアセンブリのみがJavaに含まれています

追加した: 2/27/2021 ダウンロード:

ダウンロード

ファイルサイズ: 123.8 MB

GroupDocs.Parser for Java 20.12

このzipファイルには、groupdocs.parser用のアセンブリのみがJavaに含まれています

追加した: 12/30/2020 ダウンロード:

ダウンロード

ファイルサイズ: 117.7 MB

GroupDocs.Parser for Java 20.8

このzipファイルには、groupdocs.parser for java 20.8のアセンブリのみが含まれています

追加した: 8/19/2020 ダウンロード:

ダウンロード

ファイルサイズ: 118.0 MB

GroupDocs.Parser for Java 20.6

このzipファイルには、groupdocs.parserのアセンブリのみがJava 20.6に含まれています

追加した: 6/30/2020 ダウンロード:

ダウンロード

ファイルサイズ: 113.4 MB

GroupDocs.Parser for Java 20.5

このzipファイルには、groupdocs.parser for java 20.5のアセンブリのみが含まれています

追加した: 5/14/2020 ダウンロード:

ダウンロード

ファイルサイズ: 101.2 MB

GroupDocs.Parser for Java 20.3

このzipファイルには、groupdocs.parser for java 20.3のアセンブリのみが含まれています

追加した: 4/1/2020 ダウンロード:

ダウンロード

ファイルサイズ: 101.0 MB

GroupDocs.Parser for Java 20.1

このzipファイルには、groupdocs.parser for java 20.1のアセンブリのみが含まれています

追加した: 2/4/2020 ダウンロード:

ダウンロード

ファイルサイズ: 101.0 MB

GroupDocs.Parser for Java 19.11

このzipファイルには、groupdocs.parserのアセンブリのみがJava 19.11を含みます

追加した: 12/3/2019 ダウンロード:

ダウンロード

ファイルサイズ: 104.4 MB

GroupDocs.Parser for Java 18.12

このzipファイルには、groupdocs.parserのアセンブリのみがJava 18.12に含まれています

追加した: 12/11/2018 ダウンロード:

ダウンロード

ファイルサイズ: 97.9 MB

GroupDocs.Parser for Java 18.11

このzipファイルには、groupdocs.parserのアセンブリのみがJava 18.11に含まれています

追加した: 11/8/2018 ダウンロード:

ダウンロード

ファイルサイズ: 96.9 MB


 日本