V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
adhoc123
V2EX  ›  分享发现

射手、农场主、台球,《三体》里探讨的数据科学

  •  
  •   adhoc123 · 2016-11-23 13:07:04 +08:00 · 1651 次点击
    这是一个创建于 2922 天前的主题,其中的信息可能已经有所发展或是发生改变。

    射手、农场主、台球,《三体》里探讨的数据科学

    《三体》是一本深探宇宙本源以及生命哲学的书,所以它对于一个小分支学科“数据科学”也有很精妙的见解。

    主人公汪淼先是告诉我们“数据运营与分析”的局限性

    在“科学边界”的学者们进行讨论时,常用到一个缩写词: SF ,它不是指科幻,而是上面那两个词的缩写。这源自两个假说,都涉及到宇宙规律的本质。

    “射手”假说:有一名神枪手,在一个靶子上每隔十厘米打一个洞。设想这个靶子的平面上生活着一种二维智能生物,它们中的科学家在对自己的宇宙进行观察后,发现了一个伟大的律:“宇宙每隔十厘米,必然会有一个洞。”它们把这个神枪手一时兴起的随意行为,看成了自己宇宙中的铁律。

    “农场主假说”则有一层令人不安的恐怖色彩:一个农场里有一群火鸡,农场主每天中午十一点来给它们喂食。火鸡中的一名科学家观察这个现象,一直观察了近一年都没有例外,于是它也发现了自己宇宙中的伟大定律:“每天上午十一点,就有食物降临。”它在感恩节早晨向火鸡们公布了这个定律,但这天上午十一点食物没有降临,农场主进来把它们都捉去杀了。

    射手和农场主的故事告诉我们一个简单的道理:采样样本要足够,但是却永远不足够。

    我们能从数据样本里得出的结论,始终只是一个统计性的结论,不是定论。从一定意义上讲,数据只反映结论成立的“机率”的大小,而不反映结论成立的“对错”。我们要时刻提醒自己:我们是在定量,而不是在定性。 《三体》中,汪淼又和另一位大牛丁仪探讨了试验数据的风险 “那好吧,打过台球吗?”丁仪走到了台球桌前。 “上学时随便玩过几下。” “我和她很喜欢打,因为这让我们想到了加速器中的粒子碰撞。” 丁仪说着拿起黑白两个球,将黑球放到洞旁,将白球放到距黑球仅十厘米左右的位置,问汪淼,“能把黑球打进去吗?” “这么近谁都能。” “试试。” 汪淼拿球杆,轻击白球,将黑球撞入洞内。

    “很好,来,我们把球桌换个位置。”丁仪招呼一脸迷惑的汪淼,两人抬起沉重的球桌,将它搬到客厅靠窗的一角。放稳后,丁仪从球袋内掏出刚才打进去的黑球,将它放到洞边,又拾起那个白球,再次放到距黑球十厘米左右的地方,“这次还能打进去吗?” “当然。” “打吧。” 汪淼再次轻而易举地将黑球打入洞内。

    “搬。”丁仪挥手示意,两人再次抬起球桌,搬到客厅的第三个角,丁仪又将黑白两个球摆放到同样的位置,“打吧。” “我说,我们……” “打吧。” 汪淼无奈地笑笑,第三次将黑球击入洞内。

    他们又搬了两次台球桌,一次搬到了客厅靠门的一角,最后一次搬回了原位。丁仪又两次将黑白球摆到洞前的位置,汪淼又两次将黑球击入洞内。这时两人都有些出汗了。

    “好了,实验结束,让我们来分析一下结果。”丁仪点上一枝烟说,“我们总共进行了五次试验,其中四次在不同的空间位置和不同的时间,两次在同一空间位置但时间不同。您不对结果震惊吗?”他夸张地张开双臂,“五次,撞击试验的结果居然都一样!”

    “你到底想表达什么?”汪淼喘着气问。 “你现在对这令人难以置信的结果做出解释,用物理学语言。” “这……在五次试验中,两个球的质量是没有变化的;所处位置,当然是以球桌面为参照系来说,也没有变化;白球撞击黑球的速度向量也基本没有变化,因而两球之间的动量交换也没有变化,所以五次试验中黑球当然都被击入洞中。”

    丁仪拿起撂在地板上的一瓶白兰地,把两个脏兮兮的杯子分别倒满,递给汪淼一杯,后者谢绝了。“应该庆祝一下,我们发现了一个伟大的定律:物理规律在时间和空间上是均匀的。人类历史上的所有物理学理论,从阿基米德原理到弦论,以至人类迄今为止的一切科学发现和思想成果,都是这个伟大定律的副产品,与我们相比,爱因斯坦和霍金才真是搞应用的俗人。”

    “我还是不明白你想表达什么。”

    “想象另一种结果:第一次,白球将黑球撞入洞内;第二次,黑球走偏了;第三次,黑球飞上了天花板;第四次,黑球像一只受惊的麻雀在房间里乱飞,最后钻进了您的衣袋;第五次,黑球以接近光速的速度飞出,把台球桌沿撞出一个缺口,击穿了墙壁,然后飞出地球,飞出太阳系,就像阿西莫夫描写的那样。这时您怎么想?”

    丁仪盯着汪淼,后者沉默许久才问:“这事真的发生了,是吗?”

    汪丁两人做的台球试验并不是一个精心设计的科学试验,但是它和大多数我们在现实中做的试验一样,简单,高效,目标明确。这个试验的结论非常符合“常识”和“预期”,但是和“真实”天差地别。科学边界的科学家们,做了更加精细的更加科学的试验,然后得到了完全不一样的结果。从某种角度来看,科学边界的试验结果更接近“真实”。

    如何能够让我们平常做的简单试验的结果更加准确,更加贴近“真实”,是一个不容易的事情。在不断提高“真实”的标准的情况下,会越来越难。做一个好的试验工具来帮助我们降低试验数据的风险,这是一个很有意义的探索,值得我们去不断尝试。

    有幸,我们一直在朝这个方向做着努力。

    最后,看着现在疯狂的政治题材的韩剧和美剧,我们是不是应该欢迎《三体》降临?

    本文作者:吆喝科技来自三体的 Sando

    2 条回复    2023-07-04 15:01:23 +08:00
    21grams
        1
    21grams  
       2016-11-23 19:40:36 +08:00
    搬五次台球桌,这是有病吧,直接说不就行了。
    freepoint
        2
    freepoint  
       2023-07-04 15:01:23 +08:00
    波普尔认为归纳法不是科学的方法,既不能给人们以未来的必然性知识,也不能给人们以未来的或然性知识,人们应把它拒斥于科学研究领域之外。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   989 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 19:59 · PVG 03:59 · LAX 11:59 · JFK 14:59
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.