正在看《集体智慧编程》的第二章,文章中的数据集太小,最近两天爬取了豆瓣 TOP250 电影的影评数据,大约 28 万条。最近的目标是分析这些数据,学习推荐系统算法。
目前打算用的资料有:
gitbook 上的 https://wizardforcel.gitbooks.io/guide-to-data-mining/content/2.html 感谢作者和译者
《集体智慧编程》
请问 V 友有珍藏的学习资料么?能推荐一下么?先谢啦
注:
顺便提一下,爬虫系列的正则表达式部分更新了,近期不会更新爬虫系列,以后会把坑填完。本不喜欢玩爬虫,只是为了获取数据方便而学爬虫的。爬虫中的正则表达式(持续更新)
1
liprais 2017-04-10 11:43:52 +08:00 3
上 kaggle 上看,随随便便几千万数据集
|
3
goalong 2017-04-10 11:52:07 +08:00 2
我是想学但是还没开始,不过一直有关注相关的学习资源, http://www.jiqizhixin.com/article/2465 这个链接不错,而且这个网站基本是机器学习深度学习相关的,可以关注下,我自己也要抽点时间开始了,不能再拖延了。
|
4
wisefree OP @goforalong 谢谢啦,不要拖,撸起袖子就是干
|
5
954880786 2017-04-10 12:10:56 +08:00 via iPhone
楼主是学生吗
|
7
954880786 2017-04-10 12:35:20 +08:00 via iPhone 1
@wisefree 我大二的,机器学习推荐 cs229 ,深度学习 cs231n ,这两门课都有视频教案与练习,挺不错的
|
9
wisefree OP 2017 年 4 月 11 日 08:38:50 : 31 人收藏, 8 回复,这。。是不是相差有点大。。
|
10
Antidictator 2017-04-12 18:24:29 +08:00 via Android 1
@wisefree 我只收藏是因为想学 ml ,不回复是因为我不懂 ml 。。现在回复是想让你们知道不少人和我一样。。
|
11
wisefree OP @Antidictator 嗯,其实我也不太懂,正在慢慢学
|