V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
doujiangjiyaozha
V2EX  ›  程序员

开发了一个浏览器插件,一个本地知识库 AI 助手,关于 RAG 的,希望各位大佬帮我指定下,给点建议,产品本身以及推广都可以,谢谢

  •  
  •   doujiangjiyaozha · 18 小时 50 分钟前 · 614 次点击

    具体的介绍都在官网这里 guanzhangai.cn

    14 条回复    2024-12-21 23:13:59 +08:00
    RotkPPP
        1
    RotkPPP  
       18 小时 10 分钟前
    网站打不开
    ospider
        2
    ospider  
       16 小时 52 分钟前   ❤️ 1
    搞笑呢,cn 域名和 AI 是互斥的,你有牌照吗?就敢大模型
    doujiangjiyaozha
        3
    doujiangjiyaozha  
    OP
       16 小时 40 分钟前
    @RotkPPP 再试下老哥,我改了下 DNS,测了下全国网速,应该没问题了
    doujiangjiyaozha
        4
    doujiangjiyaozha  
    OP
       16 小时 35 分钟前
    @ospider em, cn 域名和 AI 是互斥的, 这话我有点不太理解, 麻烦老哥帮忙解释下; 至于牌照与大模型,我也不太理解,我全程都用的第三方的开源 LLM 模型或者 api 调用,跟牌照有什么关系吗?
    hefish
        5
    hefish  
       15 小时 34 分钟前
    我也想做个类似的东西,不知道如何下手,op 大佬能指点一二吗?比如需要哪些基础知识,基于哪个开源模型来搞之类的。。。
    doujiangjiyaozha
        6
    doujiangjiyaozha  
    OP
       14 小时 22 分钟前
    @hefish 我想想哈, 如果是你要做服务端的话, 可以去看下 langchain, 它里面有提供 python 和 nodejs(我已知的)的库,基本上是可以帮你直接从清理文本,到存入向量数据库,到搜索匹配,直接一条龙完成了的,很方便; 如果你要是像我一样做客户端的话, web 端我调研的方案, 基本上就是 transformjs 处理向量,加 indexdb 存储, 复杂的点主要是中间的一些优化, 我当初弄我这玩意时候,内存老是爆;向量模型的话,就是 huggingface 上找找 embeding 的, 目前国外很多人用的是 nomic-embed-text-v1,不过我测了中文效果不咋地,我就换成了 jina-embeddings-v2-base-zh,目前测试还不错,后面有时间我应该会更新一些我碰到的坑写到我那个博客里(官网里有挂,才刚弄), 希望能帮到你
    smallparking
        7
    smallparking  
       13 小时 38 分钟前 via Android
    @xiaoyuan9816 https://www.cac.gov.cn/2024-04/02/c_1713729983803145.htm
    有备案吗? 还用国外 api ?符合 "坚持社会主义核心价值观" 吗?
    https://www.cac.gov.cn/2023-07/13/c_1690898327029107.htm
    doujiangjiyaozha
        8
    doujiangjiyaozha  
    OP
       13 小时 30 分钟前
    @smallparking 我去 我还真不知道这玩意 感谢老哥提醒;我找时间研究下,不过 api 我只用我们国内的,支持我们国产模型 qianwen 之类的 hh
    RotkPPP
        9
    RotkPPP  
       12 小时 32 分钟前
    这个功能有点不太明白哈,意思就是,用户将需要收藏的网站提交给你开发的插件,然后服务端会通过爬虫的方式将内容爬下来,输入到 llm 中,类似于一个 rag 的过程,然后就可以通过对话的形式来获取内容
    kneo
        10
    kneo  
       12 小时 23 分钟前
    你这是违法的,赶紧关了。
    ospider
        11
    ospider  
       12 小时 15 分钟前
    @doujiangjiyaozha #4 有别的老哥已经说过了,我就不再赘述了。反正不建议在国内搞这些,即使政策允许,国内的付费意愿也太弱,没有任何意义,直接出海是唯一的选择。
    amlee
        12
    amlee  
       10 小时 27 分钟前
    没必要前怕虎后怕狼,做不做的起来还不一定

    先上车后补票例子多了去了

    不过还是建议从国外市场做,国内付费意愿太低,而且乱七八糟浏览器多,你这又是插件。
    国外基本上 chrome ,firfox ,safari 支持了就够了
    gaobh
        13
    gaobh  
       10 小时 23 分钟前 via iPhone
    cn 域名做好进去的准备
    hefish
        14
    hefish  
       10 小时 17 分钟前
    @doujiangjiyaozha 谢谢大佬!
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2164 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 21ms · UTC 01:31 · PVG 09:31 · LAX 17:31 · JFK 20:31
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.