如题,前几年 DL 火的时候学过一点,最近有时间想把这部分知识重新捡起来,但是遇到一个困惑。
就是我不知道大家是怎么样的,我个人有一个习惯就是学习的同时一定要做相关 demo,比如学爬虫就爬点啥,学 GUI 就做个小游戏之类的,做出来就感觉自己会了,没做出来就是不会。
最近照着文档学,遇到这样一个瓶颈,就是文档里东西感觉都看懂了,但是实际要解决一些小问题还是完全不会做。
比如我随便想到一些应用环境:
1 、已知某时某地风俗风向温度湿度等信息,预测较长一个时间段里的平均天气(比如这段时间里应是晴天多,或者雨天多)
2 、已知一个商品房所在的地段(离市中心距离),房龄,旁边配套设施情况(交通是否方便、是否有学校医院等等,所有数据已经经过量化处理),估算该商品房的房价(这是个回归问题)
3 、同上 2 号问题,把估算房价改为估算房屋价格评级,比如 ABCDEFG 级,A 级最好 G 级最差。(这是个分类问题?)
======================================================
诸如此类,感觉并不是什么复杂的需求像上述 2 、3 号问题,如果真的做出来也许可以用来盈利,如果能做出来的话会很有成就感,完全不会做就感觉很苦恼。
框架的教学文档里面比如一般结束基础教学以后都是从 CNN 开始做实际问题,比如跑 MNIST 或者 cifar,因为我想到的这些原始数据之间并没有空间的联系,似乎用 CNN 不太合适。同理,用 RNN 也不太合适,但是具体用什么合适文档里也没教啊
1
dcalsky 2020-07-20 23:59:36 +08:00 via Android
tcn
|
2
dji38838c 2020-07-21 00:03:58 +08:00
哪有这么容易盈利呀。
这两个都很简单,没有什么盈利的空间 |
3
askfermi 2020-07-21 00:29:40 +08:00 via Android
盲猜一个全连接一把梭,用不同的 loss 函数应该可以
|
4
Codelike 2020-07-21 02:44:09 +08:00
首先,盈利点是不存在的。现实世界无比复杂,就商品房为例,能够被抽出作为特征是少部分。无法完美估算价格,甚至估算的价格还可能偏差很大,别人怎么敢用。
实现方法的话,2 号问题全连接,loss 最小二乘法。3 号问题 全连接 loss 交叉熵 |
5
WinG 2020-07-21 03:00:08 +08:00
你举的这些都是传统机器学习的范畴,套库就搞定,关键的是你的逻辑和统计学。
|
6
jmc891205 2020-07-21 03:43:54 +08:00 via iPhone
现实中没有人给你提供现成的干净数据集
而自己做数据获取,数据清洗,特征提取等等,这都是很麻烦的工作。 |
7
jinsongzhao 2020-07-21 08:33:18 +08:00 via Android
方向挺好,不过天气预测例子就不用了,发展国家农业生产的必须工具,国家层面都会发力做。
|
8
594duck 2020-07-21 08:55:18 +08:00 via iPhone
第一个天气,深度学习。我就和你这么说吧,在互联网没发展起来前气象局,一直是计算资源大头黑洞。
你想要用深度学习学计算气象,你用家里的计算机搞成了提早半小时预测 99.96%精度都可以拿国家奖了。 气象局那算法你听都没听过,人家观测点就比你多。 |
9
594duck 2020-07-21 08:58:16 +08:00 via iPhone
房屋分级 ,要不要深度学习都一样。
以上海为例子,90 年代老破小学区房,7 万一平方米。邻居夏天赤膊,娘额 xb 乱骂。你服不服,什么预测不预测。不用的。 我兄弟,澳洲毕业回国写数学模型选股,亏了 50 万。应为证监会老逼样乱说话。股灾,他死都没想到过。还好开了 5 倍杠杆,设置了止损。 |
10
594duck 2020-07-21 09:00:58 +08:00 via iPhone
以股市为例子。深度学习没用的。
你要是买 19999 元的行情软件,可以看到机构动向。配合传统股市分析理论就够了。 现在 AI 和 python 是一样的。全面骗。 你要看这块,还是要看日本。日本人务实。不吹 |
11
594duck 2020-07-21 09:05:05 +08:00 via iPhone
再说回天气
就一个大气物理学,你去学吧,学完后你会发现,深度不深度没差。你首先得懂。 这就是中国 IT 界吹牛逼的恶习导致中国科学界被埋没的原因。 拿 matlab 为例子 IT 界以为自己用 Go 或者 python 开发一个科学计算软件就能打死 matlab 了。 殊不知人家的 matlab 最重要的是一堆经验库。没这个谁要你 matlab 。 但是我们 IT 行业的人不懂,就天天以为,“我开发了工具,你自己开源经验库就好了。” 屁啦,开源就是市集,科学就是大教堂。 开源,怎么可能 |
12
sigure 2020-07-21 09:37:18 +08:00 via iPhone
以你这里举的例子当然是全连接或者一维 cnn,不过还是全连接靠谱。要关联时间就上 lstm 。最简单的方法是你把数据全部连在一起拼成一个长向量丢进去。
但是最好的方法是不要用深度学习。。结构化的数据用传统机器学习不香么?我一直认为深度学习的优势是对非结构化数据的特征提取 |
13
misaki321 2020-07-21 09:45:38 +08:00
你这两个问题传统机器学习方法比较好
不是什么都深度学习一把梭的 |
14
Takizawa 2020-07-21 14:04:45 +08:00 1
深度学习其实只是新兴起的一种方法,或者说工具,而所应用的范畴却很广,不同的领域需要不同领域的理论知识做支撑,否则就只是掉包侠。国内很多 AI 初创明显企业,做了好几年了吧,论文刷榜司空见惯,模型、产品落地了一堆了吧,有哪个宣布盈利了? AI 时代最重要的其实就是数据,所谓的什么框架,什么 dl 什么包,只是服务于数据。
|