V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
AlanWang3
V2EX  ›  分享创造

基于 llama_index 开源了一个类似 chatpdf 的应用

  •  
  •   AlanWang3 · 2023-03-30 21:29:09 +08:00 · 1957 次点击
    这是一个创建于 635 天前的主题,其中的信息可能已经有所发展或是发生改变。

    这是一个使用 Python 和 React 开发的应用,可以让 ai 帮你阅读文档,目前只支持 markdown ( pdf 不太好处理),并且支持了原文高亮的功能。 代码都是下班后空闲时间写的,之前没写过 Python ,后端代码大部分都是在 chatgpt 的帮助下完成的。

    Demo 地址: https://chat-markdown.alanwang.site/

    Github 地址: https://github.com/3Alan/chat-markdown

    大家觉得不错的话点个 star⭐ 支持下

    6 条回复    2023-04-01 11:54:40 +08:00
    billzhuang
        1
    billzhuang  
       2023-03-30 23:11:41 +08:00 via iPhone
    准确度如何?
    lovestudykid
        2
    lovestudykid  
       2023-03-31 00:55:28 +08:00
    试用了下 llama_index 读 pdf ,基本处于一问三不知的水平
    AlanWang3
        3
    AlanWang3  
    OP
       2023-03-31 10:16:38 +08:00
    @billzhuang
    @lovestudykid 目前来看有些问题确实回答不是很好,不过 llama_index 更新还是挺频繁的,我觉得准确度应该会慢慢提上去的
    billzhuang
        4
    billzhuang  
       2023-03-31 13:55:17 +08:00
    @AlanWang3 本质上是两个向量余弦相似度问题,我不觉得现有的代码下,准确度会随着 llama_index 更新而上升哎
    lovestudykid
        5
    lovestudykid  
       2023-04-01 00:02:15 +08:00
    @billzhuang 如果 32k 或更大的 context 能普及,这样瞎猫逮着死耗子的概率大一些
    billzhuang
        6
    billzhuang  
       2023-04-01 11:54:40 +08:00 via iPhone
    @lovestudykid 那就不是用 embedding 了,直接全文怼进去
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3527 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 05:03 · PVG 13:03 · LAX 21:03 · JFK 00:03
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.