V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
pdog18
V2EX  ›  问与答

关于开源输入法的「云联想」,能否只下载数据不上传数据?

  •  
  •   pdog18 · 2023-04-15 21:32:58 +08:00 · 1664 次点击
    这是一个创建于 586 天前的主题,其中的信息可能已经有所发展或是发生改变。

    关于输入法的云联想功能,前段时间那个微信键盘,一次按键一次网络请求,我看似乎很多人反应激烈,我是不在乎的。

    但是这个云联想的功能,可能是一部分 Rime 输入法用户期待的功能。

    如果我是一个愿意牺牲一点点硬盘空间,并且不考虑热词的维护,每天固定时间一次性拉取当天的热词,作为「云联想」功能的词库。

    是否能变相实现 Rime 输入法的「云联想」并且不会让玩家觉得有侵犯隐私的风险?

    (除开可能的云联想需要脱敏统计所有用户每天的新的自造词。)

    8 条回复    2023-04-16 09:25:07 +08:00
    honeycomb
        1
    honeycomb  
       2023-04-15 21:38:23 +08:00 via Android
    这个东西最后要搞差分隐私才能比较好解决既要不上传数据又要下载词库之间的矛盾。
    iOS 已经在特定功能里(比如键盘)用了好几年了,接下来广告也会逐渐上或者已经用上了。
    0o0O0o0O0o
        2
    0o0O0o0O0o  
       2023-04-15 22:02:56 +08:00
    MossFox
        3
    MossFox  
       2023-04-16 06:54:34 +08:00
    云联想不全是关于新词热词,也存在模糊输入的推测,比如这种:


    这种推测远比模糊拼音要复杂。要说靠拉数据到本地的话,还有一个问题就是:不收集用户输入,这种数据从何来。
    Yzh361
        4
    Yzh361  
       2023-04-16 08:39:44 +08:00 via Android
    沒有上傳的話 服務器怎麽知道你要請求數據?
    你如果想問別人問題,你不提出來人家怎麽知道你要問什麼…
    pdog18
        5
    pdog18  
    OP
       2023-04-16 08:42:32 +08:00
    @MossFox 谢谢。
    不过 `li'oul => 浏览` 这个模糊推测,似乎也没有必须要收集用户输入啊?
    pdog18
        6
    pdog18  
    OP
       2023-04-16 08:47:04 +08:00
    @Yzh361
    不好意思我没有解释的很明白。
    「沒有上傳」指的是,沒有上傳「本次」輸入按鍵(或者說是预编辑码)。
    云联想在我的认知里面就好似在服务器维护了一个热词词库,如果仅仅是一个词库的话,那么只要预下载合并至 Rime 的词库,不也可以使得 Rime 实现云联想的功能吗?
    相对于每次将「预编辑码」上传至云端服务器的行为,转变成了仅下载词库,不上传「预编辑码」,这个角度来看,说「没有上传」似乎也没有不太合适。
    pdog18
        7
    pdog18  
    OP
       2023-04-16 08:52:04 +08:00
    @honeycomb 感谢,似乎「差分隐私」比脱敏强大的多,那这样输入法似乎更加大有可为。
    即使有「预编辑码」上传到服务器,只要确保上传的数据是经过「差分隐私」处理的,也是可以保护隐私的,服务器似乎只能获取到无法反推信息的数据。
    那么用户端无需考虑服务器是由谁搭建的,都是可以不担心数据泄露的云联想目标服务器了?
    honeycomb
        8
    honeycomb  
       2023-04-16 09:25:07 +08:00 via Android
    @pdog18 差分隐私提供了能对脱敏程度的多少进行了定义的工具。

    再回到上传数据的问题,去掉一部分用户的上传数据,不会影响云端词库的性能(显然这里不涉及到差分隐私),因此对隐私要求高的情况下,只下载词库,不上传数据的做法是合理的。

    但问题是,它是否愿意?
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2434 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 28ms · UTC 16:03 · PVG 00:03 · LAX 08:03 · JFK 11:03
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.