<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-redaction</artifactId>
<version>20.7</version>
</dependency>
compile(group: 'com.groupdocs', name: 'groupdocs-redaction', version: '20.7')
<dependency org="com.groupdocs" name="groupdocs-redaction" rev="20.7">
<artifact name="groupdocs-redaction" ext="jar"/>
</dependency>
libraryDependencies += "com.groupdocs" % "groupdocs-redaction" % "20.7"
高码Java API隐藏和编辑敏感数据
产品页面 | 文档 | 演示 | API参考 | 例子 | 博客 | 免费支持 | 临时许可
Java的GroupDocsredaction是本地API,它使您的Java应用程序可以隐藏和编辑任何敏感或分类的数据,内容,信息或元数据,以使其完全不可读和不可搜索。
文档REDACTION JAVA本地API功能
通过以
jpeg',
png’或bmp
映像格式渲染来预览文档。- 更换或隐藏分类文本
- 搜索一个精确的短语并在其上应用重新处理。
- 支持对病例敏感和不敏感的搜索。
- 支持使用正则表达式(REGEX)搜索。
- 选项使用彩色框以及替换字符串进行修订。
- 重复全部或特定的元数据值空(空白 /最小值)
- 编辑元数据值
- 应用过滤器以获取所需的元数据进行修复
- 使用正则表达式(REGEX)过滤出所需的元数据进行修复
- 能够检测重新进行失败,跳过或拒绝的元数据项目
- 编辑注释文本或删除注释
- 从文档中删除所有或特定的评论
- 在评论中搜索特定字符串,然后将重新付诸而换新
- 能够从评论中编辑特定文本,而不是编辑/删除整个评论
- 将修订应用于特定的Microsoft Excel&Reg;工作表或列
- 能够应用过滤器以识别和指定要编辑的列
- 图像中的编辑分类和敏感信息
- 在包含分类信息的区域上应用一个彩色盒子
- 能够通过充当“ Exif”擦除器来更改图像元数据
- 通过OCR检测图像中的文本,然后编辑该文本
- 通过OCR使用正则表达式(REGEX)在图像中搜索要在图像中删除的特定文本
- 在文档中嵌入的图像上应用区域修订或文本修订
OCR在图像上进行修复
对扫描文档执行OCR
对嵌入Microsoft Word&reg中的图像执行OCR;或PDF文件
使用图像修复创建PDF文件
即使在删除(修订)敏感数据之后,保持文档格式完整
您还可以为当前不支持的文件格式实施自定义格式处理程序。
支持的文档修复文件格式
对于以下文件格式,支持文档主体和元数据上的重新操作:
Microsoft Word&reg;: doc/dot/docx/docm/dotx/dotm/rtf \
Microsoft Excel&reg;: XLSX/XLSM/XLTX/XLTM/XLS/XLT/CSV \
Microsoft PowerPoint&reg;: PPTX/PPT/PPT/PPSX/POT/PPS/PPTM/PPSM/POTM
图像: jpeg/tif/tiff/png/bmp/gif
固定布局: PDF
为以下文件格式支持文档注释(注释)上的重新操作:
Microsoft Word&reg;: doc/dot/docx/docm/dotx/dotm/rtf \
Microsoft Excel&reg;: XLSX/XLSM/XLTX/XLTM/XLS/XLT/CSV \
Microsoft PowerPoint&reg;: PPTX/PPT/PPT/PPSX/POT/PPS/PPTM/PPSM/POTM
固定布局: PDF
对于以下文件格式,支持文档嵌入图像的修复操作:
Microsoft Word&reg;: doc/dot/docx/docm/dotx/dotm/rtf \
Microsoft PowerPoint&reg;: PPTX/PPT/PPT/PPSX/POT/PPS/PPTM/PPSM/POTM
固定布局: PDF
对于以下文件格式,支持文档OCR(光学字符识别)上的重新操作:
Microsoft Word&reg;: doc/dot/docx/docm/dotx/dotm
Microsoft PowerPoint&reg;: PPTX/PPT/PPT/PPSX/POT/PPS/PPTM/PPSM/POTM
图像: jpeg/tif/tiff/png/bmp
固定布局: PDF
有关详细信息和限制,请访问支持的文档格式。
系统要求
- Microsoft Windows: Windows Desktop&Server(X86,X64),Microsoft Azure
- macOS: Mac OS X
- Linux: Ubuntu,Opensuse,Centos等
- Java版本:``J2SE 7.0(1.7)
,
J2SE 8.0(1.8)`或更高(例如Java 10)
Java的GroupDocs.REDACTION不需要安装任何外部软件或第三方工具。只需按照安装和配置中描述的方式之一。
开始
GroupDocs在GroupDocs存储库托管所有Java API。您可以在Maven项目中直接使用简单配置的Maven项目中的Java API来轻松使用groupDocs.redaction。有关详细说明,请访问使用Maven从GroupDocs存储库安装文档页面。
示例Java代码将DOCX转换为Rasterized&Readacted PDF
ByteArrayInputStream inputStream = null;
// Rasterize the document before applying redactions
final Redactor raterizer = new Redactor("C:\\Temp\\sample.docx");
try
{
// Perform annotation and textual redactions, if needed
ByteArrayOutputStream stream = new ByteArrayOutputStream();
RasterizationOptions options = new RasterizationOptions();
options.setEnabled(true);
raterizer.save(stream, options);
inputStream = new ByteArrayInputStream(stream.toByteArray());
stream.close();
}
finally { raterizer.close(); }
if (inputStream != null)
{
// Re-open the rasterized PDF document to redact its pages as images
final Redactor redactor = new Redactor(inputStream);
try
{
RedactorChangeLog result = redactor.apply(new ImageAreaRedaction(new java.awt.Point(1160, 2375),
new RegionReplacementOptions(java.awt.Color.BLUE, new java.awt.Dimension(1050, 720))));
if (result.getStatus() != RedactionStatus.Failed)
{
final FileOutputStream fileStream = new FileOutputStream("C:\\Temp\\sample_docx_Raster.pdf");
try
{
RasterizationOptions options = new RasterizationOptions();
options.setEnabled(false);
redactor.save(fileStream, options);
}
finally { fileStream.close(); }
}
}
finally { redactor.close(); inputStream.close(); }
}
File | Classifier | Size |
---|---|---|
groupdocs-redaction-20.7-javadoc.jar | javadoc | 381 KB |
groupdocs-redaction-20.7.jar | 122 MB | |
groupdocs-redaction-20.7.pom | 2 KB |