我的提议是学 AI ,从基本的说,就是数据分析和线代(向量运算),高数和线代有所了解即可,数据分析也只需要做到能够做一些预处理,不过也是深究起来天花板很高的学问。然后开始了解一些传统机器学习算法,后面到了深度学习也只需要系统性的学习一下那些经典架构以及各自擅长的数据类型,到了后面基本都是更偏向应用系统构建。不过我觉得直接开始深度学习也是可以,前面那些不管怎么样都会遇到,需要的时候再去学即可。
可以去了解一下 COT ,chain of thought ,是目前 NLP 领域对于大语言模型在逻辑推理上面的最新进展。举个简单例子,在原始情况下你问模型一个数学题,模型最终返回单独一个答案,在加上 COT 的提示 /模板语句(Let's think step by step...)之后,模型会返回整个推理逻辑,就像人解决数学题需要一步一步推理的步骤一样,最终能大幅提高答案的正确率。现在的结论就是大语言模型我们其实还没有摸到它的能力边界,但是仅仅是这样就已经能够做到很多事了。