尝试过在 win 上使用 office 的 com 接口来处理文件,虽然方法可行,但是个别情况下会出现弹窗(输入密码,选择打印机之类的),excel,ppt 的文档 两个并发以上的话,会出现其中一个失败。。
想问问各位大佬有什么好的方案来做 office 转 pdf 的 api,如果能在 linux 下更好
1
windpinw 2019-10-11 13:29:51 +08:00
Libreoffice, 可以看看
|
2
ungrown 2019-10-11 13:36:56 +08:00
pdf 虚拟打印机啊
|
3
jamesxu 2019-10-11 13:37:35 +08:00 via iPhone
使用 jodconverter 配合 libreoffice
|
5
lycx5360 2019-10-11 13:45:39 +08:00
itext+jodconverter+libreoffice
|
6
cz5424 OP |
7
sethverlo 2019-10-11 14:02:15 +08:00
之前做过类似的事情,但是太久远了大概说下…
libreoffice unoconv 这类工具的问题在于出来的格式不太稳定,pdfkit 这类工具的问题在于可能没啥人维护了… 还听说过 abiword, 我忘了为什么后来没有用了 其实我想推荐 ms 自己的服务,好像是要自己搭个服务器什么的,那个应该是最稳定的 |
8
mhycy 2019-10-11 14:11:26 +08:00
开一堆虚拟机生成 PDF 并返回资源信息,搞个队列排队处理
|
9
cz5424 OP @mhycy 这个不是问题,目前也是这样处理,这个方案最烦的是,部分情况下会弹窗,比如文件带了密码。弹窗之后所有请求都处理不了,直接报错
|
13
Vegetable 2019-10-11 15:10:58 +08:00
office 自家 webapp,然后按照爬虫逻辑处理。
|
15
zzl22100048 2019-10-11 17:04:21 +08:00
我这边用的是 collabora code 效率还可以。https://github.com/zzl221000/Docker-CODE.
|