我的眼睛看世界

2016年08月17日

别用数据乱说话

Filed under: 科普 — gcd0318 @ 03:49

数据有助于增强论点的说服力,正确使用数据有助于提高论点的正确性,前者是世界观,后者是方法论。这本书重点在于前者,而绝少涉及后者,这大概是决定于这本书的定位,是畅销书而非教科书
说服力和可信度看似相关,其实未必,说服力体现为让受众相信,赢得支持,作用于主观,而正确性则是个客观的结论,可能让人无法接受,但它就是正确的。所以本书用了大量“数字是如何提高说服力”的例子来说明数字能提高说服力,但是却几乎没谈应该如何通过数字得到正确的结论。甚至实际上,巧妙的运用数字,可以让明显错误的结论也显得很有说服力
很多女权癌常提到一个结论,看似可信,因为她们也用了数字:80%的性侵害来自熟人,比如亲属,朋友,同事,同学等,只有5%的性侵害是陌生人在偏僻的地方实施的,所以那些教女人不要独自去偏僻的地方以免遭遇性侵害的说法对预防性侵害的作用很小——看上去很有道理,似乎也是在用数据说话,但是别忘了,每个人和熟人在一起的时间和活动的空间远远多于和陌生人在一起,而且也只有这时候,人会放松警惕性,所以容易遭遇侵害,所以这个80%并不能说明熟人比陌生人更危险,因为两者比较的前提就不一样。如果我们定义危险的计算公式为:
危险程度 = 侵害案件次数 / 在一起的时间
那么熟人危险程度 = 熟人侵害案件次数 / 和熟人在一起的时间
生人危险程度 = 生人侵害案件次数 / 和生人在一起的时间
根据女权癌提供的数据,熟人侵害案件次数是生人侵害案件的4倍,但是和熟人在一起的时间是和生人在一起时间的几百甚至上千倍,所以当然还是和熟人在一起更安全——这也符合我们的常识
同样的道理,某城市盗窃案统计结果表明,装防盗门的住户被盗次数多于没有防盗门的住户被盗次数,所以不装防盗门可以防盗——这个说法的荒谬之处也就很明显了,装防盗门的住户远远多于不装防盗门的,不装防盗门的住户都比较穷,所以根本没有东西可偷
还有一种流行的说法认为,随着医学科学的进步,人类的疾病越来越多,可见医学对健康有害,其实也是很扯的说法,因为我们都知道,在医学欠发达的时代,人类寿命更短,一个感冒就足以致命,所以没机会得更多的疾病
数据还说过更荒唐的话,比如:对机动车交通事故的统计表明,事故发生时有60%的车辆时速在40-90之间,5%的时速超过100,而车辆时速超过150的事故只占所有事故的不到1%,没有一起事故是时速超过280以上的车辆造成的,而肇事司机中,只有20%是酒驾,所以中速驾驶最危险,越快越不容易出事故,而且酒后驾车更安全
仅举这一类错误说明,如何正确的理解数据,是所有“用数据说话”中都要注意的,也是本书作为一本畅销书所没有讨论的。正确的使用数据,不但需要数学知识,计算技巧,还要结合产生数据的领域知识综合分析,这远远超出畅销书的容量,也远远超出畅销书读者的接受能力。所以,对于那些学不会数学,但又希望能通过数据让自己显得高大上的读者,这本书很值得细读精研
另外,书中有些翻译可能不准确,比如游戏理论,根据书中对游戏理论的描述,我估计应该是指的博弈论

Advertisements

发表评论 »

还没有评论。

RSS feed for comments on this post. TrackBack URI

发表评论

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / 更改 )

Twitter picture

You are commenting using your Twitter account. Log Out / 更改 )

Facebook photo

You are commenting using your Facebook account. Log Out / 更改 )

Google+ photo

You are commenting using your Google+ account. Log Out / 更改 )

Connecting to %s

%d 博主赞过: