TimePPT

TimePPT

V2EX 第 62211 号会员,加入于 2014-05-08 19:56:28 +08:00
今日活跃度排名 758
根据 TimePPT 的设置,主题列表被隐藏
二手交易 相关的信息,包括已关闭的交易,不会被隐藏
TimePPT 最近回复了
10 小时 18 分钟前
回复了 xiaohupro 创建的主题 随想 AI 大模型时代,个人隐私的获取比以前更加容易
@xiaohupro 不用客气,也不是啥普及,只是感觉最近拿着大模型锤子找钉子的人越来越多了😂

另外补充下,我第一条想表达其实是,虽然大模型能获取到更多用户主动发送的信息,但其实,这种挖掘并没有比传统方法高到哪里去。
主要原因也还在:
1. 和 LLM 对话的信息量级远少于在线推荐系统的反馈,也就是说,这类特征更加稀疏——从使用频次、时长上来说都是这样。
2. 非结构化数据挖掘整理到结构化,这个成本比直接的结构化数据要高。
3. 对普通用户来说,张口表达把问题问清楚,把 context 讲清楚,这个要求远高于让他们去点/划表达喜恶——咱们冷静想想,搜索引擎出现二十年了,真正善用搜索的人有多少?简单几个 Keyword 都数不清楚的普通人,有几个能明白现在 LLM 的那些 Prompt 技巧?
10 小时 37 分钟前
回复了 xiaohupro 创建的主题 随想 AI 大模型时代,个人隐私的获取比以前更加容易
@xiaohupro 另外,多模分析也不是今天才有的,抽帧截图做实体识别,七八年前业内就开始做了,从搜索推荐到内容审核现在广泛应用。只是现在这波让这些技术更多暴露在了非从业者眼前罢了。
10 小时 40 分钟前
回复了 xiaohupro 创建的主题 随想 AI 大模型时代,个人隐私的获取比以前更加容易
@xiaohupro 从业者表示,根本不用这么麻烦,几个大厂通过非 LLM 做的用户画像模型,精准度在 90%以上。当年我们在全国随机抽几百个用户找人做了用户调研访谈,结果中年龄、性别、职业、泛爱好这种纬度,都准得一批。
11 小时 7 分钟前
回复了 xiaohupro 创建的主题 随想 AI 大模型时代,个人隐私的获取比以前更加容易
@TimePPT 还有,绑定手机号是有关部门规定,强制实行也十多年了,跟大模型也没啥关系。反而是,有司现在要求各家 LLM 加明水印、暗水印,方便回溯来源影响会更直接。
11 小时 9 分钟前
回复了 xiaohupro 创建的主题 随想 AI 大模型时代,个人隐私的获取比以前更加容易
对广告推荐来说,从你问大模型问题里挖掘喜好搞广告,还不如你刷小红书/抖音 feed 流点击查看的反馈收集来得直接。
以及,就算输入 Query 分析的用户画像,Google / 百度都做了十几二十年了。又不是 LLM 时代才有的新鲜玩意。
不做 AI 开发的没必要知道底层原理,尽可能的在工作生活中用就行,擅长使用工具没必要都去知道工具底层是啥。

打个比方,Google ,百度这种搜索引擎出来二十多年了,不专业搞这块的。有几个人学过底层检索算法?甚至用 ES 做文本检索的都没几个。

如果要做相关 AI 应用开发的,至少知道些基本概念和算法原理也就差不多了。
2 天前
回复了 hallothere 创建的主题 问与答 媳妇要买喜马拉雅的 AI 小说写作课。
这种没办法,几年前流行学 python 时,前同事阿里技术 P8 ,他老婆买了 python 编程基础课,也 2000 多块吧……
2 天前
回复了 TimePPT 创建的主题 摄影 意大利罗马的一些随拍
@beyondgamp 谢谢!用的索尼 a7r5 ,配 24-70GM2
@TimePPT 如果是特别垂的古诗词古文生成,还需要做一些领域微调,效果才能好
@grimpil 如果是通用的文言文和诗词创作,其实中文预训练过的大模型本身就不错,你如果想仿作,要的是把想仿的诗词古文作为范例放在 prompt 里,这时候用 RAG 没问题,但单纯做文本检索或向量检索是不够的,最好是有一些额外的索引 tag ,比如「怀古」,「咏物」这种
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2969 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 11ms · UTC 14:26 · PVG 22:26 · LAX 06:26 · JFK 09:26
Developed with CodeLauncher
♥ Do have faith in what you're doing.