本人目前从事大模型工作,8 个月之前从后端工程转到做大模型,目前大模型相关技能都掌握,但是停留在操作层面,原理掌握的很浅,如果面试大模型算法岗位,有哪些方法或者资料,求大佬们分享
1
metmit 3 天前
大佬,怎么转的,自己做项目、还是公司内部给的机会?
|
2
metmit 3 天前
|
![]() |
3
yukino 3 天前
读读基础论文 Attention is all you need
再看看简单代码 nanoGPT 之后就看看 sparse attention 跟强化学习吧 |
4
gewuzhizhi OP @metmit 自己换方向找的,现在做大模型的工程方向。但是算法做的 stf 啥的都会操作,我就想针对面试学习一下
|