2005年10月6日

[閱讀筆記] 有趣又實用的 --《別讓統計數字騙了你》

根據中國時報 2005/09/14 記者楊欣怡的報導,「台灣女性去年平均四人就有一人不想結婚,而且平均三對夫妻就有一對離婚... 」

靠,啥時台灣的離婚率已經這麼高了?

ㄟ,似乎又哪裡不太對。如果按照這種說法,那我們辦公室裡面應該有一堆等著再婚的乾柴烈火曠男怨女,根據這比例至少應該要有個四五十個吧?怎麼我完全沒有聽說最近有誰賺到贍養費?

這種連視障同胞都看的出問題的報導,居然在號稱台灣第一大報的媒體上白紙黑字的出現,還真是印了「這一夜,我們說相聲」裡面的開場「這年 ...頭都變了... 」

數字不會說謊,但是解譯數字的人常常會說謊。

這本書的原文書名《 How to Lie With Statistics 》已經告訴我們,統計數字是可以拿來說謊的,而且還非常的好用。翻開內容,裡面可謂是字字珠璣,「經實驗證明,XX 牌牙膏能有效減少 23% 的蛀牙」、「根據統計,喝牛奶的人罹患某某癌症的機會,是不喝牛奶的人的 YY 倍」、「某大學調查發現,女性碩士的未婚人數,占所有 30 到 40 歲未婚女性的一半」這種看似鐵證如山卻錯誤百出,甚至是別有居心的報導,每天都在我們的媒體上面出現,連看著稿唸都會因為不知道自己正在唸啥而斷句錯誤的 美麗女主播正忙不及地把錯誤的資訊塞到每一個愚蠢到相信她的觀眾的大腦裏。

新聞報導想要聳動一點是吧?那要不要試試看下面這個數據?

根據來自內政部戶政司 2005 年的統計資料顯示,2005 年八月份台閩地區共有 7276 對結婚,6063 對夫妻離婚。所以,每10 對結婚的新人中,就有 8.33287 對會離婚,也就是說,台灣的離婚率已經超過八成!!

天啊!!多麼大的新聞啊!!!!

這應該有資格上頭條了吧?

如果說這樣子還不夠聳動的話,換成這樣子如何,「每五對已婚夫婦中只有一對不會離婚!!」

讚吧!!有著一堆驚嘆號可以使用。

最好事情是這樣子啦。

要計算離婚率,根本就不應該拿離婚人口來除以新婚人口,應該是離婚人口來除以「已經結婚的人口」,想也知道,後面這個樣本母群體的數字大的驚人,最好是會出現那種 10 對裡面有 8 對會離婚或者三對裡面有一對會離婚的數字。耍白痴嗎?

就算哪天世界反了,真的算出來是有 33.33333% 的離婚率,那也不代表可以解釋為「每三對結婚的夫妻就有一對『即將』離婚」。唸過數學的,應該都知道有內插法跟外插法,拿過去的數字來預測未來,那是標標 準準不折不扣的外插法。書中舉了一個實際的例子,從 1947 年到 1952 年,美國家庭的電視機數目增加了約 10000%。如果把這個增長比率套用到後面五年,你會發現這玩意兒很快的增長到一二十億台,那代表什麼呢?

其實也沒有什麼,不過是每個家庭會有 40 台電視機罷了。

作者建議,如果你覺得這個數字還不夠戲劇化的話,可以把開始計算的基準年推到 1947 年以前,這樣子你就可以「證明」,每一户人家將會擁有40000 台電視機,而非只是 40 台。

雖然是 50 年前的作品,但是身為統計學家的作者使用了大量的實例來告訴我們看起來最誠實的統計數字與圖表可以怎樣的被人利用與解釋。數字是無辜的,但是解釋的人可能是有心或無意的將讀者誤導到一個錯誤的結論上。

閱讀本書,最大的感慨是,50年前所使用的技倆,現在仍然在我們的媒體上充斥著,而且隨著政黨互鬥有著更加變本加厲的趨勢。只是薄薄的一本書,總計 195 頁,但是可以幫助我們脫離這些隨處可見的陷阱。必須要寫論文的研究生、必須要唸統計的學生、整天看電視看報紙的人、想要從事競選騙選票的敗類、還有,無聊 到會想要追求真相的無聊人,強烈建議你們一定要看這本書。

保證值回票價。