V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  yanyao233  ›  全部回复第 14 页 / 共 18 页
回复总数  357
1 ... 6  7  8  9  10  11  12  13  14  15 ... 18  
2023-11-16 20:14:34 +08:00
回复了 xcatliu 创建的主题 分享创造 我的开源项目支持 gpt-4-vision-preview 啦
@maymay5 对于文字识别肯定不如 ocr 啊,gpt4v 我觉得是类似于 blip 这种图片摘要、针对某些特征提问的模型的,但 gpt4v 在文字上的识别效果已经比 blip 好很多了
2023-11-15 17:18:30 +08:00
回复了 lambdaq 创建的主题 汽车 小米汽车工信部“证件照”正式亮相 SU7 / Pro / Max
1999 交个朋友!!!!
没事,像我一样贴吧号被封就不会有这种烦恼了(笑
2023-11-15 17:16:14 +08:00
回复了 tokoy 创建的主题 OpenAI 马上上线的 GPT 商店算不算风口
这东西对于买了 plus 的用户来说门槛太低了,几乎会说话就能玩转,这东西风口在哪里?难道要通过短时间内自动化生成上百个 GPTs 来垄断掉大部分应用场景吗?那我为啥不根据自己的需求花 5 分钟自己调一个?
2023-11-15 17:03:28 +08:00
回复了 lovezww2011 创建的主题 分享创造 AI 毕业设计生成器
阿哲....太帅了!这下计算机系学生的毕设水平又要被整体拉高了...
2023-11-15 17:00:11 +08:00
回复了 shubiao 创建的主题 问与答 如何管理个人笔记和博客关系
个人笔记更多的是零碎的东西,遇到、想到就记下来,而博客是对外输出的,需要进行二次整理。不过我一般都当作一个东西来写了(反正也没人看,无所谓 hhhhh
2023-11-15 16:55:19 +08:00
回复了 344457769 创建的主题 Windows 更新了 23H2,用上了 Windows 11 新增的 Copilot
不理解为什么要缩放桌面大小...直接悬浮窗不好吗...
好耶!
2023-11-08 21:48:50 +08:00
回复了 bigboss60 创建的主题 NAS 群晖挂载阿里云为本地 WEBDEV,备份永远目的地损毁
照片这种东西我建议还是多网盘备份,毕竟丢失了就再找不回来了...我的 30 多 g 照片,就是电脑一份,nas 一份,onedrive 和 google drive 各一份
2023-11-08 21:15:13 +08:00
回复了 token10086 创建的主题 程序员 求求你们都别卷工具站了
果然,工具站、日记是所有程序员一定会做的项目
2023-11-07 22:03:37 +08:00
回复了 cuishunbiao 创建的主题 分享创造 利用 ChatGPT 开发了一个「几分钟前是几点」的网站
@bkzly83851 改名:互联网博物馆
2023-11-07 21:23:34 +08:00
回复了 amber0317 创建的主题 分享创造 做了个一站式 Bilibili 音乐下载器,以下是我的思考
哇哦,这 ui 好好看
2023-11-05 21:00:35 +08:00
回复了 yueji 创建的主题 机器学习 如何搭建一个基于聊天记录 训练的 AI 对话机器人
@yueji 没听过这个欸...看了一下似乎是英文的模型?恐怕中文不行吧
2023-11-04 19:07:32 +08:00
回复了 yueji 创建的主题 机器学习 如何搭建一个基于聊天记录 训练的 AI 对话机器人
几个月前刚训练过一个,安卓手机的话需要把微信数据库导出并解密 https://github.com/greycodee/wechat-backup
然后导出 contact 和 message 表,我先是对导出的表进行了清洗,把非目标群聊/联系人的聊天数据和大部分根本不需要的字段全部删除,删除不使用的聊天记录类型(比如图片啥)然后再清洗掉个人敏感信息

对于数据集生成,我的思路是
1.群聊: 先筛选出我发送的消息,然后向上追溯一分钟之内的其他人的消息作为一组对话(我这里没考虑引用回复),一天内的消息均作为上下文(但实际上我并不推荐使用群聊消息,现在并没有成本低且效果很好的方式来分割聊天,第三次训练时我去掉群聊的数据集,胡言乱语的情况好了很多)
2.联系人: 一问一答为一组对话,多条连续消息合并,一天内为上下文
最后总共有 8k 条聊天记录

我当时使用的 chatglm2 模型,lora 和 pt 都试了,lora 效果好太多,最终 15steps 的 loss 稳定在 1.0 左右

效果怎么说呢...确实金句频出,但记忆力明显下降,并且指令服从性几乎没有,也就仅仅能用来聊天了。

另外,我多次尝试让他认识到自己是谁,无论是通过数据集强化的方式,还是靠推理时增加 system prompt ,都无法达到效果...
2023-10-28 18:26:33 +08:00
回复了 yhtbiy 创建的主题 JetBrains 看看 jetbrains 又出了新的 IDE [writerside]
@zen1 这样高度统一的 ui 风格我觉得挺好的,降低了很多学习成本
2023-10-28 18:12:38 +08:00
回复了 Jack0 创建的主题 GitHub github 的 star 有什么用处?
@AoEiuV020JP star 还能刷的吗...
1 ... 6  7  8  9  10  11  12  13  14  15 ... 18  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1843 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 37ms · UTC 02:24 · PVG 10:24 · LAX 18:24 · JFK 21:24
Developed with CodeLauncher
♥ Do have faith in what you're doing.