想提取目录内容请问有什么好的方法?工具?
求大佬明示?
1
colewp 2019-05-10 12:27:41 +08:00 via iPhone 2
iText 或者 Apache PDFBox,之前毕设做过类似项目
|
2
dsg001 2019-05-10 12:31:54 +08:00 2
以前用 python 写过,zipfile 打开 epub,lxml 解析 toc.ncx
|
5
zeroze OP 自己研究了下,比较好的方法貌似是使用 mupdf 自带工具 mutool,具体操作有 stackoverflow 的帖子,自行搜索下
另外有坑 mutool 提取出来还需要洗 编码是 utf16 的 |