|
@@ -1,11 +1,11 @@
|
|
|
#KdanAuto 使用帮助
|
|
|
|
|
|
-##一、为什么要做这玩意?
|
|
|
+##一、为什么要开发KdanAuto?
|
|
|
QA 做为 ComPDFKit_Conversion(以下统称 SDK) 交付品质把关最后一环,人力投入不足,无法满足SDK 内容***随测***、以及每个版本的***通测***,更加没有人力去做每次提测版本的全文档、各种情况覆盖测试,SDK 交付品质难以得到保障。同时,如果品质出现问题,整个团队又需要消耗掉更多的时间和精力去应对各种突发状况。
|
|
|
|
|
|
SDK 测试大致工作量如下:
|
|
|
|
|
|
- - 转档SDK支持14种格式,每种格式又分别涉及注释、签名、表单等各情况测试;
|
|
|
+ - 转档SDK支持14种格式,每种格式又分别涉及注释、签名、表单等各种情况测试;
|
|
|
|
|
|
- 命令行工具各种参数组合保守估计多达300-400种,每一种参数组合按一个 PDF 文档(一页)算
|
|
|
|
|
@@ -21,15 +21,26 @@ KdanAuto 里面直接集成转换 SDK,能够对指定目录内的文档,进
|
|
|
|
|
|
同时可以对【命令行工具 注释、高亮、加水印、提取等编辑功能自动化执行生成的结果文档】做对照,粗过滤出存在差异的内容,供 QA 精准测试。
|
|
|
|
|
|
-具体功能有
|
|
|
+具体功能有:
|
|
|
|
|
|
-- KdaAuto对照工具 -> 导入文档到不同格式转档目录 -> 执行一键转档 -> 自动对照转档结果(与之前版本结果的差别)->生成对照报告
|
|
|
+- KdaAuto对照工具 -> 导入文档到不同格式转档目录 -> 执行一键转档 -> 自动对照转档结果(与之前版本结果的差别)->生成对照报告 (第三条,第3功能点中详细介绍)
|
|
|
|
|
|
-- KdanAuto字符对比工具 -> 导入文档到不同格式转档目录 -> 执行一键转档/OCR(RTF、TXT) -> 自动对比转档结果(与对照文档的字符差别)->生成字符对比报告
|
|
|
+ 需要将原PDF文档 导入到KdanAuto;(参考第三条,第3点)
|
|
|
+
|
|
|
+- KdanAuto字符对比工具 -> 导入文档到不同格式转档目录 -> 执行一键转档/OCR(RTF、TXT) -> 自动对比转档结果(与对照文档的字符差别)->生成字符对比报告 (第三条,第5功能点中详细介绍)
|
|
|
|
|
|
-- 命令行对照工具->任意平台,命令行批量编辑(注释、加水印、高亮等)->将结果文档导入 KdanAuto -> 一键(与之前版本结果进行)快照对照->生成对照报告
|
|
|
+ 需要将原PDF文档、原TXT/RTF 对照文档导入到KdanAuto;
|
|
|
+ 需要注意这2个目录(Origin Files、Check Files)内的文档结构、文档名字要一致
|
|
|
|
|
|
-- 跨平台字符对比工具->任意平台,批量转换/OCR RTF/TXT->将转档结果文档导入 KdanAuto -> 自动对比转档结果(与对照文档的字符差别)->生成字符对比报告
|
|
|
+- 命令行对照工具->任意平台,命令行批量编辑(注释、加水印、高亮等)->将结果文档导入 KdanAuto -> 一键(与之前版本结果进行)快照对照->生成对照报告 (第三条,第4功能点中详细介绍)
|
|
|
+
|
|
|
+ 需要将原PDF文档、以及不同平台转档后的文档导入到KdanAuto;
|
|
|
+ 需要注意这2个目录(Origin Files、Result Files)内的文档结构、文档名字要一致
|
|
|
+
|
|
|
+- 跨平台字符对比工具->任意平台,批量转换/OCR RTF/TXT->将转档结果文档导入 KdanAuto -> 自动对比转档结果(与对照文档的字符差别)->生成字符对比报告 (第三条,第6功能点中详细介绍)
|
|
|
+
|
|
|
+ 需要将原PDF文档、原TXT/RTF 对照文档、以及不同平台转档/OCR后的文档导入到KdanAuto;
|
|
|
+ 需要注意这3个目录(Origin Files、Check Files、Result Files)内的文档结构、文档名字要一致
|
|
|
|
|
|
- 可考虑作为工程师自测工具,确保开发的功能块,不会对其它的功能模块产生影响
|
|
|
|
|
@@ -45,8 +56,9 @@ KdanAuto 里面直接集成转换 SDK,能够对指定目录内的文档,进
|
|
|
|
|
|
// 其它参数
|
|
|
- Use Old Lib: 是否是使用老库,用于切换 ComPDFKit 新库和之前徐建伟那套库
|
|
|
- - Allow OCR:转 TXT 时,SDK 中提供的参数,是否开启 OCR
|
|
|
- - OCR Language:转 TXT 时,SDK 中对应指定的 OCR 识别语言
|
|
|
+ - Allow OCR:PDF转 TXT 格式时,转档SDK 中提供的参数设置,设置是否开启 OCR
|
|
|
+ 开启 OCR 后,图片中的文字也会被识别出
|
|
|
+ - OCR Language: PDF转TXT 格式时,转档SDK 中对应指定的 OCR 识别语言
|
|
|
|
|
|
|
|
|
Note: 测试类型说明
|
|
@@ -92,158 +104,255 @@ KdanAuto 里面直接集成转换 SDK,能够对指定目录内的文档,进
|
|
|
|
|
|
// 其它参数
|
|
|
- Use Old Lib: 是否是使用老库,用于切换 ComPDFKit 新库和之前徐建伟那套库
|
|
|
- - Content Options:转 Excel 时,SDK 中提供的参数
|
|
|
- - Worksheet Options:转 Excel 时,SDK 中提供的参数
|
|
|
- - Allow OCR:转 Excel 时,SDK 中提供的参数,是否开启 OCR
|
|
|
- - Contain OCR BGImage:转 Excel 时,SDK 中提供的参数,OCR 是否包含背景图片
|
|
|
- - OCR Language:转 Excel 时,SDK 中对应指定的 OCR 识别语言
|
|
|
- - Contain Annotations:转 Excel 时,SDK 中提供的参数,是否包含 Annotations
|
|
|
- - Contain Images:转 Excel 时,SDK 中提供的参数,是否 包含图片
|
|
|
+ - Content Options:PDF转 Excel 格式时,SDK 中提供的参数,
|
|
|
+ 参数具体解释及用法参考转档 SDK 文档
|
|
|
+ - Worksheet Options:PDF转 Excel 格式时,SDK 中提供的参数,
|
|
|
+ 参数具体解释及用法参考转档 SDK 文档
|
|
|
+ - Allow OCR:PDF转 Excel 格式时,SDK 中提供的参数,是否开启 OCR识别,
|
|
|
+ 参数更详细用法参考转档 SDK 文档
|
|
|
+ - Contain OCR BGImage:PDF转 Excel 格式时,SDK 中提供的参数,OCR 是否包含背景图片,
|
|
|
+ 参数更详细用法参考转档 SDK 文档
|
|
|
+ - OCR Language:PDF转 Excel 格式时,SDK 中对应指定的 OCR 识别语言,
|
|
|
+ 参数更详细用法参考转档 SDK 文档
|
|
|
+ - Contain Annotations:PDF转 Excel 格式时,SDK 中提供的参数,是否包含 Annotations,
|
|
|
+ 参数更详细用法参考转档 SDK 文档
|
|
|
+ - Contain Images:PDF转 Excel 格式时,SDK 中提供的参数,是否 包含图片,
|
|
|
+ 参数更详细用法参考转档 SDK 文档
|
|
|
|
|
|
修改相关属性设置好后,点击右上角【保存】。(如下图)
|
|
|
|
|
|
![](0.0.2.png)
|
|
|
|
|
|
|
|
|
-###3、设置测试文件夹目录、建立文件夹、导入文件
|
|
|
-
|
|
|
-点击 App 右下角“更多...” 按钮,在弹出的设置菜单中,设置自动化测试文件根目录(如下图所示)。
|
|
|
+###3、自动化(转档)对照测试
|
|
|
|
|
|
-![](3.1.0.png)
|
|
|
+**自动化对照测试**,用于将 PDF 自动化转换成对应目标格式,并将转出结果文件,同此前(版本)SDK转出结果进行截图对照,以确认当前版本,所修改/增加的内容,与此前(SDK)版本的差异。
|
|
|
|
|
|
-其中根文件目录中的子文件,可以手动创建,App 也能根据实际情况自动创建(从 App 导入文件时)
|
|
|
+目前ComPDFKit支持 PDF 转 PPT、Excel、BMP、CSV、GIF、RTF、JPEG、HTML、Word、TGA、TXT、JPEG2000、PNG、TIFF 14种。
|
|
|
|
|
|
-####【自动创建】
|
|
|
+新库支持PDF 转 PPT、Excel、BMP、CSV、JPEG、HTML、Word、TXT、PNG 9种格式。
|
|
|
|
|
|
-通过 App 给不同转档类型导入文件(支持文件复制 或 超链接导入),自动生成“Origin Files” 目录;在转档过程中,再自动生成“Result Files” 和 “Check Files”目录结构,如下演示操作
|
|
|
+对于快照,PPT、Excel、BMP、CSV、HTML、Word、TXT 这7种格式只会截取第一页进行快照对比。BMP、JPEG、PNG、CSV、TGA、JPEG2000、TIFF 这7种 格式,会对每一页进行快照对照测试。
|
|
|
|
|
|
- Note:
|
|
|
- - PDF文档格式对照测试,还需要导入 Result Files
|
|
|
- - RTF/TXT 本地转档对比测试,还需要导入 Check Files
|
|
|
- - RTF/TXT 跨平台对比测试,还需要导入 Result Files 和 Check Files
|
|
|
+具体使用流程如下:
|
|
|
|
|
|
-![](3.1.3.gif)
|
|
|
+- S1:设置测试根目录(,执行任何测试功能前,均需要先设定好测试根目录;) 例子中,以PDF 转 【PPT】 格式,【快照对比】 测试项进行举例,新建 【PPT 】格式【快照对比】 测试项
|
|
|
|
|
|
+![](./3.3.0.png)
|
|
|
|
|
|
-####【手动创建】(已采用配置自动化,已弃用,采用自动生成目录方案)
|
|
|
+- S2:选中对应测试项,勾选该测试项 【快照】 测试功能 勾选项
|
|
|
|
|
|
-在根目录内,手动创建如下图所示目录结构(每种文件,对照测试)目录结构类似。
|
|
|
+![](./3.3.1.png)
|
|
|
|
|
|
-![](3.1.1.png)
|
|
|
+- S3:点击 在右侧详情面板 右下角 “+” 按钮,进行 Origin Files 导入,建议(默认)以 '超链接' 形式导入(,能减小文档在 Mac 中的磁盘空间消耗)
|
|
|
|
|
|
-上述列表中,相关目录中的转档类型,留意与 App 配置目录保持一致
|
|
|
+![](./3.3.2.png)
|
|
|
|
|
|
-![](3.1.2.png)
|
|
|
+- S4:导入文件后,点击下方 “Start” ,启动转档 + 快照生成( + 快照对照,由于是第一测试,没有对照图,所以对照结果为 0%)
|
|
|
|
|
|
-接着再可以考虑手动或自动往各类型的 “Origin Files” 测试(原)文档目录中拷贝(/导入)测试文档
|
|
|
+![](./3.3.3.png)
|
|
|
|
|
|
-####【导入对比文件】
|
|
|
-对于PDF、RTF(字符对比)、TXT(字符对比)功能,需要手动从外部导入对比(参照)文档,以 TXT 格式跨平台 OCR 字符对比为例:导入“Result Files” 和 “Check Files”
|
|
|
+- S5:点击详情面板 右上角 “更新对照图”,将当前版本生成的快照作为对照图(,以后 SDK 有更新,会拿此次版本转档效果作为对照)
|
|
|
|
|
|
-导入命令行、其他平台转换/OCR 结果文件,不是快照对照测试(快照是 KdanAuto 自动生成,并保存备用),就需要导入
|
|
|
-![](0.1.0.png)
|
|
|
+- S6:再次点击下方“Start”,验证看 相同的文档(进行转档 )、相同的转档 SDK,对照验证结果是否为 100%
|
|
|
|
|
|
-导入后效果,留意文件夹结构跟 Origin Files 目录文件夹结构保持一致
|
|
|
-![](0.1.1.png)
|
|
|
+![](./3.3.4.png)
|
|
|
|
|
|
-导入对照文件,不是使用 KdanAuto 进行转换/OCR得到的文件 进行 对照/对比,就需要导入
|
|
|
-![](0.1.2.png)
|
|
|
+- S7:(SDK 当前版本为 1.6.0,)更新 SDK 版本到 1.7.0,再次点击“Start” 按钮,启动转档 + 快照生成 + 快照对照,验证 转档 SDK,V1.7.0 和 V1.6.0 版本 将相同的 PDF 文档,转换成 PPT 文档,结果差异。
|
|
|
|
|
|
-导入后效果,留意文件夹结构跟 Origin Files 目录文件夹结构保持一致
|
|
|
-![](0.1.3.png)
|
|
|
+ 需要 替换 SDK版本,参见第三条,功能7中,切换 SDK 功能
|
|
|
+
|
|
|
+![](./3.3.5.png)
|
|
|
|
|
|
+- S8:点击 测试项 右侧 或 详情面板中文件列表 右侧 “完成 xx%”, 按钮,查看 自动化对照测试 图片 结果报告;在 'S1' 中设置的根目录下面,会产生一份 rtf 字符串报告
|
|
|
|
|
|
+测试 图片 报告
|
|
|
+![](./3.3.6.png)
|
|
|
|
|
|
-###4、执行对照测试 & 更新对照文档
|
|
|
+测试 文字 报告
|
|
|
+![](./3.3.8.png)
|
|
|
|
|
|
-第一次测试,由于没有对照文件,所以测试对照结果均会为0%(模拟SDK第一轮发版),这个时候是需要 QA 人力对所有文档做确认,看有哪些功能是有完善的,哪些是有欠缺的。
|
|
|
+- S9:在弹出的图片执行窗口中,可分别进行 横向结果对比,以及覆盖结果对比,并可点击窗口右上角 “Export” 按钮,导出 PDF 转 PPT 自动化对照测试结果;
|
|
|
|
|
|
-![](3.2.1.gif)
|
|
|
+测试结果横向对照
|
|
|
+![](./3.3.6.png)
|
|
|
|
|
|
+测试结果覆盖对照
|
|
|
+![](./3.3.7.png)
|
|
|
|
|
|
-第一次测试的结果,可以存为对照结果(例如,我们可以拿线上已经发布上线的版本转档快照用作对照结果)。
|
|
|
|
|
|
-在后续每轮次测试的时候,(之前已经有生成对照结果文档的测试档,)就会对应地对比出结果,如下演示
|
|
|
+###4、PDF 格式对照测试(命令行编辑工具对照测试)
|
|
|
|
|
|
+**PDF 格式对照测试**,用于将 其它平台或工具(如命令行编辑,Saas 在线编辑)生成的 PDF 文档,同之前(版本)SDK编辑导出的结果文档 进行逐页截图对照,以确认当前(命令行/Saas SDK)版本,所增加/修改的功能效果 和 之前(命令行/Saas SDK)版本功能效果的差异。
|
|
|
|
|
|
-![](3.2.2.gif)
|
|
|
+目前 PDF 格式对照测试,原文档*Origin Files* 和 *Result Files* 都需要从外部导入,会对 PDF 文档每一页进行快照对照测试。
|
|
|
|
|
|
+具体使用流程如下:
|
|
|
|
|
|
-接着用将 PDF 库替换成新版本(例如从1.5.0 -> 1.6.0)(**演示视频中的效果,是用 Pro Mac 将原文档进行适当的编辑,来模拟得出不同的结果进行演示**)
|
|
|
+- S1:设置测试根目录(,执行任何测试功能前,均需要先设定好测试根目录;)例子中,以PDF 类型【命令行结果对比】 测试项进行举例,新建 【PDF】格式【命令行结果对比】 测试项
|
|
|
|
|
|
-![](3.2.3.gif)
|
|
|
|
|
|
- Note:
|
|
|
- - 第一次测试演示,没有对照快照,所以对照结果相似度为0%
|
|
|
- - 第二次测试演示,相同的3份文档,相同的库,对照会是完全一致的;
|
|
|
- - 第三次测试演示,对比出来有差异的项,是用 PDF Reader Pro,将原文档进行一定的修改,
|
|
|
- 模拟不同 SDK 版本,转档出来的内容有差异时,会是怎样的对照效果
|
|
|
+ - 设置根目录参考 【自动化对照测试】流程中的 S1 步骤;
|
|
|
+ - 新建 【PDF】格式【命令行结果对比】 测试项,参考 第三条,功能1 【新建测试项】
|
|
|
|
|
|
|
|
|
+- S2:选中对应测试项,勾选该测试项 【快照】 测试功能 勾选项
|
|
|
|
|
|
-###5、勾选测试选项
|
|
|
+![](./3.4.0.png)
|
|
|
|
|
|
-常规格式,目前暂时只支持预览对照,后续再可以逐步添加对文档内容做更精准的对比测试,例如可以直接读取 Word 文档,看 PDF 转 word 文档的内容准确度。
|
|
|
+- S3:点击 在右侧详情面板 右下角 “+” 按钮,进行 **Origin Files** 导入,建议(默认)以 **超链接** 形式导入(,能减小文档在 Mac 中的磁盘空间消耗)
|
|
|
|
|
|
-目前可以支持从 每种类型选项中,按需逐个【勾选】或【取消】,也可以从菜单中,点击【全选】和【全部取消】
|
|
|
+![](./3.4.1.png)
|
|
|
|
|
|
-![](3.3.0.png)
|
|
|
+- S4:导入 **命令行工具** 版本(如 1.6.0)编辑生成的结果文档,到 **Result Files** 目录中,留意跟 **Origin Files** 目录中的文件结构和文件名保持一致
|
|
|
|
|
|
+ 在右侧详情面板中,选择一个文件,然后右键,点击菜单中的 ’在访达中显示[原文件]‘,
|
|
|
+ 会打开对应的文件目录, 在 Origin Files 同级目录中,
|
|
|
+ 创建 Result Files,再将 '命令行工具' 编辑结果文件导入 Result Files 目录
|
|
|
|
|
|
-###6、导出测试报告
|
|
|
+![](./3.4.2.png)
|
|
|
|
|
|
-文字报告,在原本选择的测试目录(*文档五*)下,会生成文字报告;
|
|
|
+- S5:导入文件后,点击下方 “Start” ,启动转档成 JPG + 快照生成( + 快照对照,由于是第一测试,没有对照图,所以对照结果 均为 0%)
|
|
|
|
|
|
-对照图报告导出如下
|
|
|
|
|
|
-![](3.4.0.png)
|
|
|
+- S6:点击详情面板 右上角 “更新对照图”,将当前版本生成的快照作为对照图(以后 替换 **命令行工具** 新版本<如 1.7.0> 编辑生成的结果文档,再次进行转档成 JPG + 快照生成 + 快照对照,将能获得 *相同 PDF 文档*、*相同转档 SDK*、*不同命令行工具* 编辑产生的结果文件,与对照文档进行对照测试的结果情况)
|
|
|
|
|
|
-![](3.4.1.gif)
|
|
|
+![](./3.4.3.png)
|
|
|
|
|
|
- Note:
|
|
|
- - 对照报告导出,可以只指定导出有差异的项;
|
|
|
- - 对照报告导出,可以只导出某个文件,可以只导出某种格式,也可以全部导出
|
|
|
+- S7:再次点击下方“Start”,验证看 (同一份*命令行工具*编辑生成的)相同的文档进行逐页快照对照验证,看结果是否均为 100%
|
|
|
|
|
|
-###7、命令行转档对照测试
|
|
|
+![](./3.4.4.png)
|
|
|
|
|
|
-- S1、左侧列表中,选择 PDF 子选项,在右侧内容面板中添加文件,(留意最好添加软链接 ,原文档在 命令行工具中,只是做为识别文件索引)
|
|
|
+- S8:参考 S4 步骤,将**Result Files** 目录中的文件,替换成新版本(如1.7.0)*命令行工具*编辑导出的 PDF 文档,再次点击“Start” 按钮,启动转JPG + 快照生成 + 快照对照,验证 不同*命令行工具*版本,编辑生成的文档,用同一个转档 SDK 转成 JPG,再进行逐页对比得出的结果差异。
|
|
|
|
|
|
-![](3.5.0.png)
|
|
|
|
|
|
-![](3.5.1.png)
|
|
|
+- S9:点击 测试项 右侧 或 详情面板中文件列表 右侧 “完成 xx%”, 按钮,查看 PDF对照测试 图片 结果报告;在 'S1' 中设置的根目录下面,会产生一份 rtf 字符串报告
|
|
|
|
|
|
+ 具体报告效果及报告位置参考 【自动化对照测试】流程中的S8步骤;
|
|
|
|
|
|
-- S2、将命令行工具编辑生成的文件,复制到 “Result Files”目录中,留意保持与 Origin Files 中文件结构一致(包括名称和后缀)
|
|
|
+- S10:在弹出的图片结果中,可分别进行 横向结果对比,以及覆盖结果对比,并可点击窗口右上角 “Export” 按钮,导出 PDF对照测试结果;
|
|
|
|
|
|
+ 具体报告效果及报告位置参考 【自动化对照测试】流程中的S9步骤;
|
|
|
|
|
|
-![](3.5.2.png)
|
|
|
+###5、(PDF转RTF/TXT 文档)字符对比测试
|
|
|
|
|
|
-- S3、执行对照测试,第一次测试,对照结果会全为0%;
|
|
|
+**PDF转RTF/TXT 文档)字符对比测试**,简称 字符对比测试,用于将 PDF 自动化转换/OCR识别成 RTF/TXT 格式,再用转换(/OCR识别)出的 RTF/TXT 结果文档,同标准(无差错)的 RTF/TXT 对照文档 进行逐字符对比,以确认当前转档/OCR SDK版本,对于PDF 文档中的字符 进行转档/OCR识别处理的准确度。
|
|
|
|
|
|
+目前字符对比支持 PDF 转 RTF、TXT 2种,其中 RTF(新版本 SDK 导出的)框排 和 (徐建伟那套老版本 SDK 导出的)流排模式均支持。同时,结果文档中的空格和换行将过滤不做识别,但(目前)部分空格可能会影响到准确率计算;在导出的对比报告中,会完整呈现字符排版;
|
|
|
|
|
|
-![](3.5.3.png)
|
|
|
+具体使用流程如下:
|
|
|
|
|
|
+- S1:设置测试根目录(,执行任何测试功能前,均需要先设定好测试根目录;) 例子中,以PDF 转 【TXT】 格式,【中文字符对比】 测试项进行举例,新建 【TXT】格式【中文字符对比】 测试项
|
|
|
|
|
|
-- S4、查看对照结果,及导出测试报告(注:将内容更新作为对照后,第二次测试,会得到实际的对照结果,有版本更新后,将能得到相同文档,不同命令行库版本转换出来的内容差异;差异效果同转档对照)
|
|
|
+ 测试项参数设置中,测试类型选择 【字符对比测试】,相关设置参考 第三条,功能1、功能2
|
|
|
|
|
|
-![](3.5.4.png)
|
|
|
|
|
|
-横向对照效果,如果只是改变了文字,比较难发现有差异
|
|
|
+- S2:选中对应测试项,勾选该测试项 【字符】 测试功能 勾选项
|
|
|
|
|
|
-![](3.5.5.png)
|
|
|
+![](./3.5.0.png)
|
|
|
|
|
|
-覆盖对比能比较好发现,中间有多了什么,少了什么,以及文字有位移的情况
|
|
|
+- S3:点击 在右侧详情面板 右下角 “+” 按钮,进行 Origin Files 导入,建议(默认)以 '超链接' 形式导入(,能减小文档在 Mac 中的磁盘空间消耗)
|
|
|
|
|
|
-![](3.5.6.png)
|
|
|
+![](./3.5.1.png)
|
|
|
|
|
|
-###8、字符串对比测试
|
|
|
-通过第4点导入的原(PDF)文件,以及导入 准备测试资料时准备的(标准)对照文件(,以及导入Windows、Saas、命令行工具等 转换/OCR 得到的结果文档),接着就可以进行字符串对比测试
|
|
|
+- S4:导入原始精准的 对照 RTF/TXT文档(示例中是 TXT 文档),到 **Check Files** 目录中,留意跟 **Origin Files** 目录中的文件结构和文件名保持一致
|
|
|
|
|
|
-TXT、RTF 格式字符对比测试报告效果如下
|
|
|
-![](0.1.4.png)
|
|
|
+ 在右侧详情面板中,选择一个文件,然后右键,点击菜单中的 ’在访达中显示[原文件]‘,
|
|
|
+ 会打开对应的文件目录, 在 Origin Files 同级目录中,
|
|
|
+ 创建 Check Files,再对照 RTF/TXT文档(示例中是 TXT 文档)导入 Check Files 目录
|
|
|
|
|
|
-
|
|
|
-###9、类型及参数配置(以下参数不再需要手动配置,通过高级设置界面进行设置)
|
|
|
+![](./3.5.2.png)
|
|
|
+
|
|
|
+- S5:导入文件后,点击下方 “Start” ,启动转档/OCR识别 + 字符对比,将得到 相应文件,转换/OCR 识别出来的文档(示例中是 TXT 文档)中字符 处理精准度,以及具体哪些字符有出错状况
|
|
|
+
|
|
|
+- S6:点击 测试项 右侧 或 详情面板中文件列表 右侧 “完成 xx%”, 按钮,预览查看 字符对比 结果报告;在 'S1' 中设置的根目录下面,会产生一份 rtf 字符串报告
|
|
|
+
|
|
|
+![](./3.5.3.png)
|
|
|
+
|
|
|
+- S7:在弹出的对比结果预览窗口中,并可点击窗口右上角 “Export” 按钮,导出 字符对比测试报告;
|
|
|
+
|
|
|
+![](./3.5.4.png)
|
|
|
+
|
|
|
+###6、跨平台字符对比测试
|
|
|
+
|
|
|
+**跨平台字符对比测试**,用于将 其他平台(如 Windows、Android、Saas 等)批量转换/OCR识别成的 RTF/TXT 格式文档,同标准(无差错)的 RTF/TXT 对照文档 进行逐字符对比,以相应平台转档/OCR SDK版本,对于PDF 文档中的字符 进行转档/OCR识别处理的准确度。
|
|
|
+
|
|
|
+目前字符对比支持 RTF、TXT 2种,其中 RTF(新版本 SDK 导出的)框排 和 (徐建伟那套老版本 SDK 导出的)流排模式均支持。同时,结果文档中的空格和换行将过滤不做识别,但(目前)部分空格可能会影响到准确率计算;在导出的对比报告中,会完整呈现字符排版;
|
|
|
+
|
|
|
+具体使用流程如下:
|
|
|
+
|
|
|
+- S1:设置测试根目录(,执行任何测试功能前,均需要先设定好测试根目录;) 例子中,以PDF 转 【TXT】 格式,【Windows平台 OCR 对比】 测试项进行举例,新建 【TXT】格式【Windows平台 OCR 对比】 测试项
|
|
|
+
|
|
|
+ 测试项参数设置中,测试类型选择 【跨平台字符对比测试】,相关设置参考 第三条,功能1、功能2
|
|
|
+ 其它参数勾选不起作用,因为不走本地转档
|
|
|
+
|
|
|
+- S2:选中对应测试项,勾选该测试项 【字符】 测试功能 勾选项
|
|
|
+
|
|
|
+![](./3.6.0.png)
|
|
|
+
|
|
|
+- S3:点击 在右侧详情面板 右下角 “+” 按钮,进行 Origin Files 导入,建议(默认)以 '超链接' 形式导入(,能减小文档在 Mac 中的磁盘空间消耗)
|
|
|
+
|
|
|
+![](./3.6.1.png)
|
|
|
+
|
|
|
+- S4:导入原始精准的 对照 RTF/TXT文档(示例中是 TXT 文档),到 **Check Files** 目录中,留意跟 **Origin Files** 目录中的文件结构和文件名保持一致
|
|
|
+
|
|
|
+ 在右侧详情面板中,选择一个文件,然后右键,点击菜单中的 ’在访达中显示[原文件]‘,
|
|
|
+ 会打开对应的文件目录,在 Origin Files 同级目录中,
|
|
|
+ 创建 Check Files,再对照 RTF/TXT文档(示例中是 TXT 文档)导入 Check Files 目录
|
|
|
+
|
|
|
+![](./3.6.2.png)
|
|
|
+
|
|
|
+- S5:在每次对比测试前,导入从其它平台批量转换/OCR 识别得到的 RTF/TXT 文档(此处是 TXT 文档),到 **Result Files** 目录中,留意跟 **Origin Files**、**Check Files** 目录中的文件结构和文件名保持一致
|
|
|
+
|
|
|
+ 在右侧详情面板中,选择一个文件,然后右键,点击菜单中的 ’在访达中显示[原文件]‘,
|
|
|
+ 会打开对应的文件目录, 在 Origin Files 同级目录中,创建Result Files,
|
|
|
+ 再对照 RTF/TXT文档(示例中是 TXT 文档)导入 Result Files 目录(
|
|
|
+ 如果之前旧版本的文件存在,则先删除 Result Files 目录中的文件)
|
|
|
+
|
|
|
+![](./3.6.3.png)
|
|
|
+
|
|
|
+- S5:导入文件后,点击下方 “Start” ,启动 字符对比,将得到 Windows平台 导入的文档,字符 转换/OCR识别处理的精准度,以及具体哪些字符有出错状况
|
|
|
+
|
|
|
+- S6:点击 测试项 右侧 或 详情面板中文件列表 右侧 “完成 xx%”, 按钮,预览查看 跨平台字符对比 结果报告;在 'S1' 中设置的根目录下面,会产生一份 rtf 跨平台字符串报告
|
|
|
+
|
|
|
+![](./3.6.4.png)
|
|
|
+
|
|
|
+- S7:在弹出的对比结果预览窗口中,并可点击窗口右上角 “Export” 按钮,导出 跨平台字符对比测试报告;
|
|
|
+
|
|
|
+![](./3.6.5.png)
|
|
|
+
|
|
|
+###7、其它附加功能
|
|
|
+#### 【a】测试项批量勾选和取消勾选
|
|
|
+
|
|
|
+![](./3.7.0.png)
|
|
|
+
|
|
|
+#### 【b】Origin Files、Result Files、Check Files 清除操作
|
|
|
+
|
|
|
+![](./3.7.1.png)
|
|
|
+
|
|
|
+![](./3.7.2.png)
|
|
|
+
|
|
|
+#### 【c】删除测试项
|
|
|
+
|
|
|
+![](./3.7.3.png)
|
|
|
+
|
|
|
+#### 【d】显示 原文件、显示对照文件、显示结果文件
|
|
|
+
|
|
|
+![](./3.7.4.png)
|
|
|
+
|
|
|
+#### 【e】取消正在转档中的文件
|
|
|
+
|
|
|
+![](./3.7.5.png)
|
|
|
+
|
|
|
+#### 【f】删除测试项中测试原文档
|
|
|
+
|
|
|
+![](./3.7.6.png)
|
|
|
+
|
|
|
+#### 【g】切换转档 SDK 版本,留意切换后,KdanAuto App 重启后生效
|
|
|
+
|
|
|
+![](./3.7.7.png)
|
|
|
+
|
|
|
+##四、类型及参数配置(以下参数不再需要手动配置,通过高级设置界面进行设置)
|
|
|
####配置表中,目前有预置 *PDF、RTF、Word、PPT、Excel、CSV、HTML、TXT、JPEG、PNG、GIF、TIFF、TGA、BMP、JPEG2000*格式类型,其中PDF 暂时考虑用作命令行注释编辑工具,批量执行文档结果对照测试项;而*RTF、Word、PPT、Excel、CSV、HTML、TXT、JPEG、PNG、GIF、TIFF、TGA、BMP、JPEG2000*为自动化转档测试对照测试项;
|
|
|
|
|
|
- PDF
|
|
@@ -411,7 +520,7 @@ TXT、RTF 格式字符对比测试报告效果如下
|
|
|
- password, 所导入文档的密码
|
|
|
- KMPDFConvertOptionsKeyImageDPI: 老转档库 DPI 参数,常规设置有50、72、96、144、300、600,String类型,默认72
|
|
|
|
|
|
-###9、问题备注
|
|
|
+##五、问题备注
|
|
|
- PPT、Word、HTML、TXT、RTF 只有第一页能展示
|
|
|
- 交互式表单,新库解析看起来有问题
|
|
|
- 老库注释会丢失
|