V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
ethanlu
V2EX  ›  问与答

有没有什么语言可以对 PDF 有这样的操作?

  •  
  •   ethanlu · 2017-06-17 15:48:14 +08:00 · 1702 次点击
    这是一个创建于 2701 天前的主题,其中的信息可能已经有所发展或是发生改变。
    查找 PDF 里面的内容,比如 date:2017-6-16,找到 date 然后把 2017-6-16 提取出来?
    5 条回复    2017-06-17 17:51:02 +08:00
    xycool
        1
    xycool  
       2017-06-17 16:44:29 +08:00 via iPhone
    用正则都行吧?
    ethanlu
        2
    ethanlu  
    OP
       2017-06-17 17:05:05 +08:00
    If AVDoc.FindText(TextToFind, True, True, False) = False Then
    。。。。。

    TextToFind 就是要找的内容,正则需要 API 支持吗?
    Kirscheis
        3
    Kirscheis  
       2017-06-17 17:05:07 +08:00
    这和语言没有关系,随便什么语言都可以。有 pdf 解析库的语言方便一些,比如 java、python。
    当然,也可以先调用 poppler-utils 之类东西 extract,再用任何语言处理
    jugelizi
        4
    jugelizi  
       2017-06-17 17:13:31 +08:00
    首先你得把文件内容解析出来
    语言都是放风筝的事
    ethanlu
        5
    ethanlu  
    OP
       2017-06-17 17:51:02 +08:00
    我公司能让我用的编程工具只有 Excel VBA,我需要在 VBA 里面调用 adobe acrobat reader 的 API 去查找,TextToFind 变成\d{4}-\d{2}-\d{2}这样的正则就能行?
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   916 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 21:44 · PVG 05:44 · LAX 13:44 · JFK 16:44
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.