有些文字类的pdf为什么看着和扫图类的一样

天气姐姐 发表于 2019-8-19 15:27

就是这种的明明有背面的阴影，歪歪斜斜的，字体也不是黑的，很像是扫描版的，为什么文字都能复制？
我感觉不是图像识别，因为同样的PDF软件，更清晰的扫图版PDF是不能选择文字的。

superchenxx02 发表于 2019-8-19 15:30

就是扫描的吧，能复制文字应该是软件自带的OCR功能

红左手 发表于 2019-8-19 15:34

这种是类似于一层文字一层图像的格式……

宅男的爱 发表于 2019-8-19 15:56

双层PDF，OCR完了还能人工校对
——知道Google的验证码干嘛用去了吧……

天气姐姐 发表于 2019-8-19 15:58

还有这种双层的pdf，真有爱。。。

那么能把文字版单独提取出来吗？

—— 来自 OPPO PCCM00, Android 9上的 S1Next-鹅版 v2.1.2

独孤发表于 2019-8-19 16:07

OCR吧，

这种其实就是扫描实体出来的吧

宅男的爱 发表于 2019-8-19 16:33

天气姐姐发表于 2019-8-19 15:58
还有这种双层的pdf，真有爱。。。

那么能把文字版单独提取出来吗？

直接转doc啊

点点杠 发表于 2019-8-19 16:33

天气姐姐 发表于 2019-8-19 17:08

点点杠发表于 2019-8-19 16:33
这种高质量的电子版在哪找的啊，求私信

网上搜的，就找到这一种，图片还不清楚

—— 来自 OPPO PCCM00, Android 9上的 S1Next-鹅版 v2.1.2

dvd6 发表于 2019-8-19 17:21

acrobat本身就带ocr识别，貌似是识别完了保存，以后再打开就可以直接选中和查找文本

madbird302 发表于 2019-8-19 17:30

bigheadnotbig 发表于 2019-8-19 17:50

有好点的可以复制文字或者不能复制也无所谓能不能质量好点的教材电子书网站吗正版收费都可以我实在是不想翻书了又厚又重

win8 发表于 2019-8-19 18:18

双层pdf啊，与扫描档排版完全相同，文字会比扫描档清晰，而且方便用搜索功能

页: [1]

Stage1st's Archiver