V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
LeeReamond
V2EX  ›  自然语言处理

博客根据文章内容跑自然语言分析自动识别关键字,有什么廉价的实现方法吗?

  •  
  •   LeeReamond · 2022-03-02 14:42:41 +08:00 · 2776 次点击
    这是一个创建于 1026 天前的主题,其中的信息可能已经有所发展或是发生改变。

    如题,需求是想给个人博客加个关联推荐,类似于 V2 这种给每个文章自动加上关键字 tag 的方式感觉就挺好的。个人小站不需要推荐的太精准,大概差不多就行,有什么计算开销和实现成本都比较低的方案吗?

    谢谢大家,不知道站长能不能分享下 v2 实现思路。 @Livid

    7 条回复    2022-03-02 15:38:11 +08:00
    westoy
        1
    westoy  
       2022-03-02 14:44:18 +08:00
    人肉打标啊, 个人博客一个月能有几篇文章啊......
    westoy
        2
    westoy  
       2022-03-02 14:45:06 +08:00
    我记得 V 站好像是用的结巴分词提取的关键词? 可能还带人肉修正的.....
    LeeReamond
        3
    LeeReamond  
    OP
       2022-03-02 14:51:19 +08:00
    @westoy 目前一百多吧。。确实不多,但是人肉打也太 low 了。。
    Livid
        4
    Livid  
    MOD
       2022-03-02 14:55:34 +08:00
    之前用过这个:

    https://github.com/fxsjy/jieba

    理论有可能也可以用 Swift + Core ML 做,跑在你的任何一台 iOS 或者 macOS 设备上。
    LeeReamond
        5
    LeeReamond  
    OP
       2022-03-02 15:18:50 +08:00
    @Livid 感谢,仔细看了一下结巴好像自带 tfidf 抽取,如果我想用这个分词结果做个近似推荐应该怎么做呢,没啥思路
    soislom
        6
    soislom  
       2022-03-02 15:24:35 +08:00
    @LeeReamond 既然已经拿到一篇文章的 TF-IDF 值,感觉可以直接做基于内容的协同过滤了
    westoy
        7
    westoy  
       2022-03-02 15:38:11 +08:00
    @LeeReamond

    一百多不多啊, 你自己写的文章一两个钟头就够了吧,

    而且你看你这篇

    关键词应该是 文章内容 自然语言分析 自动识别 关键字 关联推荐 tag 方案

    而 V 站提取出的是 博客 小站 实现 文章

    不能说和主题表达关联不大吧, 只能说毫无关系

    还是人肉吧......
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2788 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 12:02 · PVG 20:02 · LAX 04:02 · JFK 07:02
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.