这两天,研究了如果导出 PDF 标注。没搞定,大致列一些关键的点,供大家参考:
总的来看,PDF 还是一小撮玩家在玩的小游戏。既得利益者,牢牢把握着市场;后来者,不太可能进入并有所作为。标准本身,也缺乏与时俱进的动力。我并不看好。
不过,我还是基于 Apple 的 PDFKit 做了个简单的小工具,可以将 PDF 中的标注导出为 csv 文本。需要的朋友,可以单独联系我。
1
ossphil 2017-11-08 23:04:18 +08:00
psPDFkit 是 PDFKit 的替代,开发挺活跃。Master PDF Editor 是免费的,windows, macos, linux 下都有,可以标注。福昕的阅读器也可以,奇怪的是在 Ubuntu 下一打开就是 50%的 cpu 占用
|
2
Meli55a 2017-11-09 08:29:57 +08:00
我用 知之阅读
|
3
XiaoFaye 2017-11-09 09:24:49 +08:00
直接截图然后 OCR 识别行不?当然效率可能不太好。
|
4
picone 2017-11-09 09:56:44 +08:00
MigrateNote
|
5
picone 2017-11-09 09:57:10 +08:00
MarginNote
|
6
quietjosen OP @ossphil 好,去了解下。
|
7
quietjosen OP @XiaoFaye 并不是 OCR,但要涉及字体、编码等信息,才能正确解析。
|
8
quietjosen OP @picone 恩,这个算是替代方案,但并不能解决已有 PDF 标注的问题。
|
10
cuitor 2017-12-11 13:47:26 +08:00
研究过 Cabinet( https://itunes.apple.com/us/app/pdf-cabinet-read-annotate-collaborate/id764366087?mt=8)的标注实现,采用的是非内嵌式的 xml 形式,优点是无需修改 pdf 文件,利于同步。
|
11
quietjosen OP @cuitor 好,记下了,有空去瞧瞧。
|