说明:
看了一部评分很高的电影,彗星来的那一夜,发现并不好看, 实在对不起那么高的评分。于是翻了一下 IMDB 的评分,发现差距还是蛮大的, 上图为豆瓣评分,下图为 IMDB 评分.
像白日梦想家, 也是国内的评分很高,但是国外的评论差距就挺大的
你可以看到 IMDB 和豆瓣的评分差别很大,短评差距也很大 这两部电影的评分是 8.3, 而其他同样评分的电影,我就觉得挺好的,像下面这几部 再比如超人钢铁之躯, 就是我很喜欢,但是分数很低,以前周星驰的功夫也是如此,不过近几年有回升
再想到以前豆瓣出现过不存在的电影高分评分的现象,于是就想问 —— 豆瓣电影的评分真的"对"吗?会不会有人为了装逼特意打高分 /低分?
于是, 就从 IMDB 和豆瓣电影入手,比较一下两者的差异
从Movieinsider 找到了 2010-2015 国外上映的电影的榜单做了抓取,拿到豆瓣和 IMDB 的评分, 总共 822 部
豆瓣和 IMDB 的分布基本相似,而且有高分有低分,大致呈现正态分布,说明拿到的数据量基本是够的
顺便拿到了 Metacrtic 的评分,他们的评分经过了人工的调整,维持均值在 5 左右, 所以和 IMDB 和豆瓣评分差别很大
具体见notebook
这是因为一些电影国内没什么人看过,评分很少, 所以做了剔除,具体分析见notebook
接下来,我们直接选取豆瓣和 IMDB 评分人数同时大于 2000 的,这个评分就会比较客观, 不会受人数太少评分可能不客观的影响
散点图可以很方便的做出两者的比较,横坐标是豆瓣评分,纵坐标是 IMDB 评分。这个图表是交互式的,大家可以自己看看,地址
这里我们做了一条 IMDB - 豆瓣的回归线,并且画出了 1:1 的线。可以发现
两者斜率不同,而且分数越高,差别越大。个人推测原因,可能是打分制的缘故
IMDB: 10 星制。没有人会打 10 星
豆瓣: 5 星制。 4 星以上都会打 5 星
豆瓣的打分制概念简单,不需要太精确,体验更好
IMDB 比豆瓣要齐整得多。豆瓣确实有一些电影,偏离回归线较大, 集中在 4, 6 分区间
具体做成了交互式的图表,大家可以玩一玩,看看有什么发现
根据豆瓣和 IMDB 的电影评分的差距,可以做绝对分差、相对分差排名的排名, 具体见notebook
仔细看排名,发现像 Eat, Pray, Love, 疯狂原始人, 蓝精灵, 冰川世代的评价差别是很大的
那么,有没有可能因为豆瓣上的用户比较文艺、小清新,所以对于爱情、动画类的电影,评价会偏高。我们可以按分类来画散点图来比较
这里,大家可以把关注点主要放在回归折线和 1:1 直线的关系上。可以发现,对于动作、爱情、喜剧等等类别的电影回归直线的斜率都有不同,但总体相差不大, 而动画类则很明显,都已经平行了。
在 IMDB 的低分区,确实有不少电影被高估了,具体地址散点图
另外一个现象,是国内电影的差距似乎较大. 比如少林,让子弹飞,一代宗师
我们同样也可以画出一条散点图比较
然而其图和之前的并没有太大差别。当然也有可能是样本比较少的原因。
这次特地补充一下恶意差评的现象, 其实这才是现在大家关注的点。这里,我觉得举一个例子就够了
请猜一下,这部电影的 IMDB 评分是多少?
1
peartail 2016-12-29 18:01:59 +08:00 via iPhone
不会打分,喜欢的电影就五星,不喜欢的就一星。对我个人来讲赞和踩的评分机制更适合我。
|
2
SpicyCat 2016-12-29 18:11:31 +08:00
IMDb 上 7 分以上就很不容易了,不能跟豆瓣 7 分比。
|
3
pi1ot 2016-12-29 18:16:58 +08:00 1
我的豆瓣打分标准:
3 、能看完 3 分; 4 、能被强烈吸引着看完 4 分; 5 、能够不断的重看回味的 5 分, 2 、看完感觉上当的 2 分; 1 、一般没有打 1 分的,因为这样的作品根本没机会让我看完打分,只有那些找不到比 1 分更低的选项来泄愤的,才会打 1 分。 |
4
riaqn 2016-12-29 18:42:29 +08:00 via Android 1
我还以为你发明了深度学习算法能识别装逼行为。
单纯拿豆瓣和 IMDB 比没太大意义啊,评分算法不同,文化差异,用户群。 |
5
LU35 2016-12-29 18:43:32 +08:00
IMDB 上分高的不一定好看(大众口味),分低的一定不好看.
还有 IMDB 上不少印度电影明显被刷分了,非常多出来就是接近 9 分的水平.比如 http://www.imdb.com/title/tt2631186/ 可以看看评论区. |
6
yexm0 2016-12-29 18:48:26 +08:00 1
动物城 9.2 总觉得有些高...
|
7
undeflife 2016-12-29 18:53:49 +08:00
最开始在豆瓣上给电影打分是因为当时的豆瓣猜挺靠谱的,当然也有可能是当时看的电影少.
后来有段时间豆瓣几乎把豆瓣猜这个功能给弄没了 基本都是当前上映新片 现在又有豆瓣猜了,但是累计打分超过 1000 部, 豆瓣猜里出现的电影似乎并不能吸引我... |
8
jedicxl 2016-12-29 18:56:47 +08:00 6
一本正经的无用功
看电影是非常个人的事情,看的就是个性化。 国内外观影人群由于文化传统、知识背景等大背景,以及个人喜好、生活经历等小背景,都会产生对同一部电影不同的评价,这再正常不过。 IMDB 也不过是一个全球影迷做公众评分的平台,中国影迷只占其中经常打分的人的一小部分,两个平台间出现评分差异简直不能再正常。早年说 IMDB 不客观的也多了去了,可这又如何?本来就不是一本正经的所谓官媒,想那么多干嘛 看电影这东西就和喝饮料一样,彼之蜜糖,我之砒霜,这有什么问题?只要是负责的平台,都会把激动之余的夸张评分、理性思考后的冷静评分的评价机制考虑进去,最终让评分呈现一个尽量客观的结果。机制在,那就不会让最终结果偏的离谱。人为的干预即没必要也很滑稽。 豆瓣比 IMDB 分高,不代表我们高估,相反亦然。这么简单的道理真搞不明白为啥还要这样严肃的说出来才能理解似的 |
9
gdtv 2016-12-29 18:57:05 +08:00
我不知大家看电影是为了训练思考能力还是为了消遣放松.
我是为了后者,所以我一般看显浅易懂的电影,我懒得思考. 拿<彗星来的那一夜>来说,如果是为了后面,这部电影就是一部情节狗屁不通的电影,评 1 分都高了. 但如果是为了前者,那么观看者可能会运用大脑最强的处理能力,从自己的角度把它自圆其说,评 10 分都觉得低. 同样的问题还存在于文学作品中. "大约孔乙己的确死了"这句话,有人觉得这是矛盾的病句,有人会自圆其说给出各种看似合理的解释. |
10
jedicxl 2016-12-29 18:59:42 +08:00
@yexm0 疯狂动物城在国外评价高,是因为他们有反对歧视的“政治正确”的舆论导向,以及切切实实的非常丰富悠久的歧视历史。
咱们国家没有过那么深刻难忘的歧视历史,现在的社会虽然歧视遍地但大家似乎都习以为常,所以其实国内评分本来不该这么高。不过嘛,不打高分怎么表现自己是反歧视的呢,面子大过天的国家,增加自己形象分的动作是一定要做的 |
11
jedicxl 2016-12-29 19:01:54 +08:00 1
@gdtv 每个人的爽点不同。我看《彗星》很爽,打了高分,这很正常。有的人看它觉得好闷好无聊,打了低分。这都再正常不过了。其实什么问题都说明不了,只是总有人喜欢挖空心思找找这个差异背后的东西。
|
12
taine 2016-12-29 19:39:08 +08:00
什么样的叫恶意差评?
|
14
ianva 2016-12-29 21:18:26 +08:00 2
豆瓣的评分其实很大众的
因为本人对欧洲电影,艺术电影看的非常多,一年能看个一二百部,基本上看电影不太会在乎评分, 因为评分太大众化了,会把很多好片子的分数稀释到 7 分左右,而 8-9 分的片子大部分也不一定好,因为观众对人文关怀,莫名敢动之类的片子评分还是会高,当然大片是另一个类型,所以只会关注好的影评人或对口的影评人对他们的评分 从以上来说其实豆瓣的评分很不文艺,很大众 |
15
bluecrow 2016-12-29 21:36:23 +08:00 via iPhone
还真有把豆瓣评分当回事的,我都不知道说啥了。
|
17
xujinkai 2016-12-29 22:12:09 +08:00
评分这个东西,还是开心就好。
动画类高分是因为会去看动画的就是喜欢动画的那批人。 给不同类型的电影打分,我自己都能感觉到自己的评分标准是不一样的。爆米花电影只要看的开心我就给 4 分,国产好电影一般都会比国外的多打一星作鼓励,一些奇奇怪怪的电影我反而会给五星,比如陈导的《无极》.... |
18
kindjeff 2016-12-29 22:25:45 +08:00
好文。最后结论和我直觉有相符的,就是豆瓣的动画电影打分都偏高。
|
19
grimpil 2016-12-29 22:26:53 +08:00 via Android
刚看了一篇文章,里面说二者的评分算法有很大不同
豆瓣、猫眼和 IMDb 的电影评分是怎么得出来的? http://app.s-reader.com/article/getInfo/3308113?l=4bb7bccef6b7a1fea92af2785f0cdbf9&site_id=703 |
20
fatestigma 2016-12-29 22:32:29 +08:00
评分这种东西啊,主要是看这个片是否符合大众喜好,评分的本身更多是「你自己对这个电影的喜好程度」,从而推荐系统可以根据你个人的喜欢来推荐。通常来说容易受大众喜欢的片, IMDB 8.0 以上的,而 8.0 以下可能也会有你个人喜欢的片。有点片我看完给了一分,而别人给了五分,可能对方真心喜欢,而我真觉得糟心。我平时喜欢自己发现式看片,而如果和别人一起看的,才会挑一个高分的(除非知道对方的喜好)。
而 IMDB 和豆瓣评分之间的差别,我觉得 IMDB 作为一个国际性的影评(可能北美用户偏多?),而豆瓣基本都是中国用户,文化差异导致电影分数上的差异也很正常,有些片有些梗,你不知道人家那背景,国产的老外也不一定能懂这设定,光看动作了。 当然, LZ 这个分析感觉还是非常有意义的,明天再好好研究研究。 |
21
helloSwift 2016-12-29 22:32:40 +08:00
你还真是较真😂,每部作品都有自己的看法吧
要说装不装逼,不好说。反正我既看不出来别人有没有演技,也看不出来导演编剧工地到底如何。 我只知道,我只要看这部片子难受,我就关视频。一言不发,该干嘛干嘛去😐 |
22
ynyounuo 2016-12-29 22:32:54 +08:00 via iPhone
数据呈现看起来非常好
但是对于数据的分析和洞见则并不是很有意思 |
23
zingl 2016-12-29 23:57:41 +08:00
IMDB 里随机取 2 组不同的电影,可以做同样的分析,也是同样的没有意义
|
24
jedicxl 2016-12-30 00:12:08 +08:00
@lxy IMDB8.1 晓得啥含义不? 8 分以上的商业片有几部呢?前面已经有人说过了, IMDB 上 7 分已经很难(指的至少首映 3 个月以后的稳定期的打分)
|
25
cydysm 2016-12-30 00:47:01 +08:00 via Android
你这提出的问题和给出的结论 对不上啊
|
26
5night 2016-12-30 02:00:05 +08:00
辛苦了。
是否“装逼”就是指和 IMDB 评分差距大 /小么?好像不对吧,标题改为对比分析还是可以的。 豆瓣有防卫水军和恶意差评的机制的。 最后,《彗星》这部片子我很喜欢。 |
27
DiamondbacK 2016-12-30 02:24:44 +08:00
楼主为什么把两部电影的 IMDB 和豆瓣评分直接相比呢?楼主不可能不明白这是不可比的啊,而且接下来列出的评分分布数据更直接显示了两个站的分数基准相差明显啊。
|
28
DiamondbacK 2016-12-30 02:29:54 +08:00
@lxy IMDb Top 250 里面只有 Top 3 上 9.0 分,而排名第 250 的 Queen 是 8.0 分。
|
29
DiamondbacK 2016-12-30 02:34:55 +08:00
|
30
cqcn1991 OP @DiamondbacK 其实就是说的这点,具体比较的时候也按电影的“分位数”做了比较。只是 v 站不能更新主贴,没办法按大家的反馈更新…
|
31
DuckJK 2016-12-30 09:08:16 +08:00
自打看了两部豆瓣评分很高其实很渣渣的电影,我再也不信豆瓣了。
|
32
mufeng 2016-12-30 09:15:36 +08:00
推荐你去看看《 The Man from Earth 》这片,就知道为什么豆瓣是这口味了,手动 doge 。
|
34
linxiaolin 2016-12-30 10:36:15 +08:00
@DuckJK 希望能分享一下片名 .
|
35
Mbin 2016-12-30 11:32:27 +08:00
无聊的时候看了豆瓣 N 多影评,觉得豆瓣就是有相当一群装逼犯-_-
|
37
Perry 2016-12-30 11:57:53 +08:00 via iPhone
有没有考虑过豆瓣打分都是偶数打分
2 , 4 , 6 , 8 , 10 这样,所以九分会比较常见 如果豆瓣给十颗星很多电影打五分的我也会打八分 |
38
rekulas 2016-12-30 12:06:20 +08:00
一直怀疑豆瓣对国产电影带有歧视但没有确凿证据,可以把所有国产电影数据抓来分析,根据分布图分析,如果跟全种类分布图差异较大,基本可以确认。
|
40
Geeker 2016-12-30 12:24:29 +08:00
哈哈哈哈,知乎笔法
不过楼主较真的精神还是值得肯定 |
41
cqcn1991 OP @rekulas 有高也有低。例子:让子弹飞,一代宗师,太极,英雄
有文化差异的因素,也有情怀的因素。当然最直接的影响因素是影片的质量,总体来说,一代宗师分数再低,也比某些片会高 |
42
buckyRRRR 2016-12-30 12:27:39 +08:00 via Android 1
《彗星来的那一夜》不好看?这么屌的电影你一句不好看就否定掉了
|
43
forgetandnew 2016-12-30 12:33:00 +08:00 via iPhone
豆瓣不都是文青情节吗?不装逼那还怎么叫文青
|
44
aitaii 2016-12-30 12:33:28 +08:00
大数据也得有个背景,国内外的文化环境不同啊。
|
45
buckyRRRR 2016-12-30 12:39:32 +08:00 via Android 1
有些人真好笑,看翻译过来的书的人下面评论大多数翻译的不好,推荐去看原版,那你直接去看原版好了,非得看一下翻译的恶心一下自己,然后又跑网上说看原版好,你要英语那么好还需要这么折腾吗?说豆瓣评分不好,那你找一个更好更高效的方式呀。多少人所谓的客观批评都只是为了小透明们刷存在感,知乎上的小透明,豆瓣上的小透明,生活中的小透明,说白了都是一群可怜虫
|
47
hotStrip 2016-12-30 12:51:27 +08:00
100 个人看电影, 99 个人喜欢,给了高分,我是那 1 个人,不喜欢,给了 1 分,我算恶意差评吗?看电影就图爽快吧,毕竟专业影评人少,吃瓜群众多,评分大多数吃瓜群众还是看自己喜好。
|
48
levn 2016-12-30 13:06:55 +08:00
希望电影公司不要在豆瓣上养那么多水军号了,把好好的一个网站给搞得乱七八糟。也不要花钱在报纸上乱发垃圾文章了。
|
49
gfexfizv 2016-12-30 13:12:57 +08:00 via iPhone
这部电影我打了四星,挺好看的觉得…楼主举这个例子不好,这部片可能根本就没在大陆上映过(电影院上映),大家去看就是口口传的(网络)
|
50
DuckJK 2016-12-30 13:14:42 +08:00
@linxiaolin 《机动部队》,另外还有个电影刘青云的《神探》,《这个男人来自地球》看得想睡觉。
|
51
d7101120120 2016-12-30 13:25:55 +08:00
豆瓣其实挺可怜的,也没赚到什么钱,以前文艺青年扎堆被大众嘲讽,现在大众扎堆人们又觉得他没有逼格了,还天天被各路水军刷分,结果大家还觉得他不客观了。
|
52
SeptimusX 2016-12-30 13:39:20 +08:00
@buckyRRRR 对于有能力看原版的人来说,也许他会因为节省时间等考虑而选择翻译版,有些出过不止一版的书也会因为译者不同而质量差别较大,由此发现问题没什么不正常的,这某种意义上说是“排雷”。
|
53
fyl00 2016-12-30 14:19:15 +08:00
豆瓣的正确使用方式是友邻评分
另外楼主的文章,分析和结论我没办法连接起因果关系 orz |
54
c0878 2016-12-30 14:30:13 +08:00
imdb 用户和豆瓣用户区别肯定不小 文化差异导致的 imdb 分数其实参考性不大 豆瓣的评分更符合国内观众口味
这里指的是外国电影 国产电影的评分豆瓣完全没有可参考性,国内没有任何一家可以参考,因为都是水军 |
55
Domains 2016-12-30 14:32:18 +08:00
要是豆瓣评分都要和 IMDb 一致的,那还要豆瓣做什么? 不干脆 IMDb ?就那张中文外皮? IMDb 现在没和谐吧
电影那么多,有文艺的,有低俗搞笑的,有爆米花的,有深度的,每个人的观赏能力都不一样,甚至每个人看电影的心情都不一样。 ------ 好消息,据路边社报道,因《摆渡人》评分过低,阿里影业将收购豆瓣,以后通通实名制,凭淘宝 ID 登陆打分,以后凡看国产片,对照淘宝好评均能返现,标准:票根截图+5 星+20 字以上好评。恶意差评者将扣芝麻分,情节严重的将开启专项一对一的电话关怀。 我是认真的。 |
56
KidRoland 2016-12-30 14:33:19 +08:00
豆瓣一堆打三星标记三星半的呢其实
|
58
cocacold 2016-12-30 14:50:18 +08:00
感谢 LZ 做的对比和分析。实际上我看豆瓣的时候也会点去 IMDB 看,没有发现差距很大的情况。虽然看电影与个人口味有关。但好电影和烂电影还是有区别的。
|
59
ppwangs 2016-12-30 14:56:17 +08:00
不禁让我想起了《即使变成甲壳虫卡夫卡还是进不了城堡》
|
60
ppwangs 2016-12-30 15:03:01 +08:00
|
62
jakiepaper 2016-12-30 15:14:06 +08:00
首先亮个平台的评分机制是不一样的,你这样的简单比较得不出任何结论。例如在 IMDb 上 7 就是佳片,豆瓣要上 8 才算好。
|
63
hoythan 2016-12-30 15:45:46 +08:00
外国人拍啥都是好的啊,你试试吐槽国外的电影真的会被喷的.喷子喷不过就会拿国内的和国外的作对比,国内确实烂翻天,所以你也没啥话说.
|
64
xxdd 2016-12-30 15:58:00 +08:00
彗星来的那一夜 这个我喜欢。
看来是个人口味问题 |
65
guotie 2016-12-30 17:01:59 +08:00
老外的平均智商较低,科幻片评分低有情可原
|
66
arfaWong 2016-12-30 17:32:36 +08:00
《豆瓣电影水军价曝 20 元一次:影评就这么刷的》
http://news.mydrivers.com/1/513/513916.htm |
68
est 2016-12-31 00:06:47 +08:00
jupyter 赞!
|
69
vix 2016-12-31 10:37:26 +08:00
为什么我觉得挺好, 又不是写论文, 写成论文了估计也没人高兴看.
LZ 可以尝试再挖点有趣的东西出来. |
70
alangz 2016-12-31 20:29:42 +08:00
俩网站面对的用户群体不同,应该没有可比性。
|
71
yuchting 2017-01-01 11:10:15 +08:00 via Android 1
楼上有人说是“一本正经的无用功”,我反对,因为卤煮分析问题的思路和方法都是非常可取的,这个和我当年做的用牛顿插值函数预估学校食堂的成本是一样的道理,有人说只是无用论,可是再高级的知识不能应用于最普通的生活之中,那就真的是无用了。
保持好奇心,卤煮我挺你! |
72
ytlie27 2017-01-06 18:27:25 +08:00
请问类似正态图是用什么工具做出来的?
|