4

随机致富的傻瓜:“菜鸟”股经 作者:纳西姆·塔勒布 2007-06-13 11:12

  已故天文学家萨根(Carl Sagan)致力于提倡科学思想,十分厌恶不科学的行为。他曾经调查人们到法国卢尔德(Lourdes)去,只要触摸圣水便可治疗癌症的传闻。他发现一件有趣的事实:造访该地的全部癌症患者,治愈率低于自发性复原的统计数字,也低于未曾前往卢尔德的患者的平均治愈率!难道统计学家可以据此推论,癌症患者到过卢尔德之后,存活率反而更低?

  皮尔森教授到蒙地卡罗:随机现象看起来不随机!

  二十世纪初,学者开始发展各种技术来处理随机结果的概念。有几种方法被人设计出来,用以察觉异常现象(anomalies)。皮尔森(Karl Pearson)教授设计出第一种非随机检定方法。上过统计学入门课程的人都知道奈曼∣皮尔森(Neyman-Pearson)检定法。皮尔森教授设计的非随机检定方法,其实是做偏离正常值的检定,但就目的来说,属同一回事。一九○二年七月,他调查了数百万个所谓的蒙地卡罗(轮盘的旧称)结果,发现这些结果并非完全随机,而且具有很高的统计重要性,其误差低于十亿分之一。什么?轮盘转出的结果不随机?这个发现令皮尔森教授大吃一惊。但是这个结果本身并没有告诉我们什么事情;我们晓得世界上根本没有纯随机抽样这种东西,因为抽样的结果取决于设备的品质。够多的小事凑集在一起,我们就能在某些地方发现非随机现象,例如轮盘本身可能不是摆得很平,或者旋转的球不是很圆。统计学的哲学家把这叫做参考个案问题(reference case problem),用以解释实务上没办法真正取得随机,只有理论上才找得到。此外,经理人会质疑这种非随机现象能否造就真的能够赚钱的法则。如果我需要赌一万次,每次一块钱,才可望赚到一块钱,那不如兼差去当大楼管理员。

  但是这个结果还有另一个可疑的成分。这里和实务更有关系的地方,是下面所说非随机性的严重问题。连这位统计学之父也忘了随机连串序列不一定要呈现随机的模式(pattern);事实上,资料如果完美到未呈现任何模式,反倒十分可疑,让人觉得有捏造之嫌。单一的随机连串势必呈现某种模式∣∣如果我们努力去找的话,一定找得到。皮尔森教授等学者很早就对创造人为随机资料产生器很感兴趣,由此得出的随机数表,可以做为各种科学和工程仿真(蒙地卡罗仿真器的前身)的输入资料。问题出在于他们不希望这些随机数表呈现任何形式的规则性,而真正的随机现象看起来并不随机!

  癌症丛集(cancer clusters)这种现象非常有名,从这种现象的研究,可以进一步说明上述的道理。假设随机丢出十六支飞镖到一个正方形,它们插中正方形中任何一个地方的机率相同。现在把这个正方形分成十六个更小的正方形。这么一来,我们预期每个小正方形平均会有一支飞镖在上面∣∣但这只是平均值而已。十六支飞镖恰好分别插中十六个不同的正方形,这样的机率非常低。比较常见的结果是,一些正方形里面会有一支以上的飞镖,许多正方形则一支飞镖也没有。这些格子如果不出现(癌症)丛集,将是极为罕见的事。现在,把插有飞镖的格子覆盖在任何地区的地图上,一些报纸就会宣称其中某个地方(飞镖数高于平均值者)的辐射线太强,造成癌症病例显著增多,因而促使律师开始去找癌症患者,准备索赔。

  没有吠的狗:科学知识中的偏差

  同理,科学也被有害的存活者偏差给污染,而影响研究成果的发表方式,因为没有产生任何成果的研究不会见诸文字,这一点和新闻报导一样。这事听起来似乎挺合理,因为报纸不必下个耸动的标题,报导昨天没有发生什么新事情(不过圣经倒是很聪明,说「太阳底下没有新鲜事」。这句话提供的信息是一切事情如常运行)。问题出在将「发现没有事情」和「没有去发现」两者混为一谈。什么事情也没发生这个事实,可能包含重要的信息,正如福尔摩斯在《银驹事件》(Silver Blaze)一案中指出的,奇怪的事是狗并没有吠。造成更大问题的是,许多科学成果没有发表,因为它们的数据并未呈现统计上的显著差别,不过实际上它们还是提供了一些信息。

  我没有结论好下

  我常被问到这个问题:何时才是真的不靠运气?说实话,这个问题我答不上来。我只能说,某甲的运气看起来比某乙差,但我对这种知识怀有的信心很薄弱,以至于不具意义,我宁可存疑。别人经常误解我的意见。我从没说过每位富人都是傻瓜,以及每位不成功的人运气都不好。我只能说,由于缺乏更多的信息,我宁可不做任何判断。这样比较安全。

 



 

>>热点新闻