V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  andforce  ›  全部回复第 9 页 / 共 25 页
回复总数  495
1 ... 5  6  7  8  9  10  11  12  13  14 ... 25  
88 天前
回复了 andforce 创建的主题 程序员 约 192GB 短信样本如何标记分类?
@TimeStudy #20 4090 我家里就有,但具体怎么跑呢? https://i.imgur.com/krir4IG.png
88 天前
回复了 andforce 创建的主题 程序员 约 192GB 短信样本如何标记分类?
@ibazhx #14 https://open.bigmodel.cn/dev/howuse/batchapi 原来还有这种服务,学习了,不过第一件事确实得先选一下样本
88 天前
回复了 andforce 创建的主题 程序员 约 192GB 短信样本如何标记分类?
@syaoranex #9 感谢,不过“使用文本嵌入模型转换向量”这听起来好像有点过于专业了,不太会实际操作。https://i.imgur.com/VUWFktU.png
88 天前
回复了 andforce 创建的主题 程序员 约 192GB 短信样本如何标记分类?
@noqwerty #7 我的 app 的做法是:点击反馈跳转到网页,在网页里让用户主动粘贴。

其实 App 有了联网权限,就有了把短信自动上传的可能性,当然如果你 100%信任作者或者不关心“可能短信会被收集”这件事,就无所谓了
88 天前
回复了 andforce 创建的主题 程序员 约 192GB 短信样本如何标记分类?
@guiyumin 可能我表达不太严谨。我想要的是这个应用完全离线,连网络权限都不申请那种。

熊猫我记得提交反馈的时候会有网络权限申请
88 天前
回复了 andforce 创建的主题 程序员 约 192GB 短信样本如何标记分类?
@lozzow 经过 2 楼的数据量估算,数据量太大了。

数据条数都按亿为单位了,突然觉得没有必要全部都参与训练。

感觉可以从中根据关键字主动选取垃圾短信,和正常短信。

感觉训练数据样本再百万级别就已经很能打了
88 天前
回复了 andforce 创建的主题 程序员 约 192GB 短信样本如何标记分类?
@raycool 我粗略估算了一下,按照 utf8 编码,汉字大约占用 3 个字节。那么就是约 640 亿个汉字,假设每条短信按 30 个汉字算,大约有 21 亿条。
如果考虑到去重,就算 80%是重复的,那么还得有 4 亿条。。。。

由于大模型思考需要时间,就算 1 秒条,全部标注完也得 10 万小时起步了。。。
@v2doudou #5 完美
可以,照片位置是照片的标准属性
88 天前
回复了 andforce 创建的主题 iDev 吐槽一下神经病一样的 Apple 审核
@BeyondBouds #24 回头我也录制一个视频,告诉他们我这个跟 ChatGPT 毫无关系,看看情况咋样
88 天前
回复了 andforce 创建的主题 iDev 吐槽一下神经病一样的 Apple 审核
@Azone #22 “好的办法是你拆成两个 app ,国内版和海外版”
实际上这么做上架更困难了,会被认为是“垃圾 App”,除非重新设计 UI

“因为他们监测到了你用了 ChatGPT 的接口,你虽然说国内用的是阿里,但是鬼知道你实际是怎么操作的。”
第一版是有,后续完全去掉了。
代码中都没有 ChatGPT 注释
这个想法不错哎
已经下载,但是没还是没搞明白。

这是一个笔记类 App 吗?
@v2doudou #2 秀啊,感觉可以查找书签。体验了一下挺好的,不过有 bug 。

在中文输入法下,第一次敲回车,期望是把候选词输入到搜索框,再次敲回车切换。

现在的有问题,在候选的时候直接切换了
已经 star ,感觉挺强的
89 天前
回复了 andforce 创建的主题 iDev 吐槽一下神经病一样的 Apple 审核
@WildCat 并无卵用
89 天前
回复了 andforce 创建的主题 iDev 吐槽一下神经病一样的 Apple 审核
@sdjl 难绷
1 ... 5  6  7  8  9  10  11  12  13  14 ... 25  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2665 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 23ms · UTC 07:46 · PVG 15:46 · LAX 23:46 · JFK 02:46
Developed with CodeLauncher
♥ Do have faith in what you're doing.