mcutown 最近的时间轴更新
mcutown

mcutown

V2EX 第 74351 号会员,加入于 2014-09-18 17:18:57 +08:00
今日活跃度排名 27532
AI创业中,聚焦于用AI解决切实的小场景需求

爱折腾
mcutown 最近回复了
统一回复楼上各位。

目前市面上 PDF 内容结构化做的比较好的除了 markitdown 外,还有 Mineru 、docling 。以上这些项目因为工作关系,我都有比较深入的体验,对比我这里贴出的小工具来说,工程化的项目可能在某些场景下无疑更具有稳定性。

但我个人觉得,对于非深度或者非工程化人员,轻量脚本级的应用在使用上应该是更加灵活的

但是,这些工具都存在一个不可能三角,即效率、成本、质量,任何一个产品都无法同时具备;如果有需要,我可以单开一个帖子对以上 PDF 内容结构化项目进行综合评测
@2han9wen71an
因为目前的处理逻辑是对可能为文章插图的内容进行智能识别并以占位符替代。这样方便后续对附图使用 pymupdf 提取后并插入还原
@2han9wen71an
用这个呢,额度 200 页
b22b6a4bb7df446a9efb48c54321861e
@windamin 实测下来,用 gemini2.0flash 6000 页的成本约 5 刀左右,gemini2.5pro 的话价格应该在 10 倍
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   939 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 13ms · UTC 20:26 · PVG 04:26 · LAX 13:26 · JFK 16:26
Developed with CodeLauncher
♥ Do have faith in what you're doing.