前几天我关注的某公众号推荐了这个: https://writings.stephenwolfram.com/2023/02/what-is-chatgpt-doing-and-why-does-it-work/ 。扫了一下之后感觉还不够过瘾。
问这个问题的目的:最近刷哔哩哔哩首页上瘾,然后今天开始正式尝试解决这个问题。然后在尝试解决的过程中发现的第一个自己很想点击的视频是关于 ChatGPT 的。感觉想点的原因很可能是感觉自己对这个东西的了解不够,可能对 ChatGPT 了解得足够多了可能就不会被这种视频诱惑了。另外就算没尝试解决这个问题好像系统地了解 ChatGPT 也是挺必要的,只不过之前好像没意识到。
另外我手动置顶 10 分钟了,我觉得这个东西也许会有很多人感兴趣,如果感觉不爽的话请说一声。我对这个问题还没重视到愿意冒着被人屏蔽的风险去多次置顶的程度。如果没几个人表示反感的话我很可能会再置顶 10 分钟。
1
AstroNot 2023-04-09 12:33:08 +08:00 via Android 3
B 站李沐,看 Transformer 和 GPT 相关的论文精读视频
|
2
IndexOutOfBounds 2023-04-09 13:42:01 +08:00 via Android
哈哈哈,老哥问问题的方式,在心态上和我有点像
|
3
vsitebon 2023-04-09 14:29:50 +08:00 1
|
4
phobal 2023-04-09 17:32:42 +08:00 via iPhone 1
我是在极客时间上买的课程,感觉算比较全面的,http://gk.link/a/121qu
|
5
swhhaa 2023-04-09 18:09:12 +08:00 1
反正我是从《线性代数》开始看的,然后再看《机器学习》《 Deep Learning 》...准备在 Kaggle 上拿一个金牌后在去读著名的 Attention is you need...
|
6
kop1989smurf 2023-04-10 13:05:12 +08:00 1
油管的 Mu Li ,也就是 B 站的跟李沐学 AI ,读论文通俗易懂。
一般人了解机器学习,没必要了解特别基础的细节,知道大体的思路与逻辑方法即可。 毕竟大模型的训练都是屠龙之术,没有环境搞不了的。 |
7
zhaoawd 2023-04-10 13:48:01 +08:00 1
建议去推上关注相关领域的人,上面有很多相关内容的,比如 openai 的人先关注一波
|
8
LaurelHarmon 2023-04-10 14:18:37 +08:00 2
想要高质量的话,直接搜以下关键字+paper ,第一个结果点开就是,看完的话保证比博客视频通透:
Word2vec Seq2seq Seq2seq with Attention Attention is all you need GPT Prompt InstructionGPT In-Context Learning ChainOfThought GPT4 Technical Report |
9
zooo 2023-04-10 16:40:09 +08:00 1
说句扫兴的话:基于数据驱动的深度神经网络模型如果不是从事这个领域,你看再多知识都是没有用的,因为其本身太过于黑箱了,都是在非常大的数据集上训练后知道效果这么好,其次是巨大算力支撑着。对于黑箱里面为什么会产生这么好的效果,估计连训练模型的人自己都难以知道为什么,这或许就是涌现的巨大力量吧。
非该领域的人我觉得根据经验去使用就行了,深层次原理什么的,没必要看... 打击且扫兴的话,不信勿喷。 |