有學過基礎統計,並且有碰觸到兩個變數之間的相關性這個概念,如果我們說兩個變數之間有相關性,意思就是指,當一個變數提高時,另一個變數也會相應地提高(正相關),或者相應地降低(負相關)。具體來說,假如我們發現,普遍來說,一個人學歷越高,收入也越高的話,那我們就會說學歷和收入是正相關。反過來說,如果我們發現,每週運動的時數越少,BMI就會越高,那麼某週運動時數和BMI數值就是負相關。
而在學習統計相關性時,應該也都會對一個重要觀念不陌生,那就是:
相關不等於因果
如果沒有統計學的基礎觀念,其實很多人容易將相關性直接視為因果關係,或者誤認因果關係的方向。日常生活中,我們也看到很多誤認因果的例子。
有一個很經典的例子就是,有研究發現,在一個海灘上有冰淇淋店家,而當冰淇淋銷量最高的時候,溺水事件的數量也最高,如果直接下結論說「多吃冰淇淋會造成溺水」,那恐怕會讓人傻眼,事實上,最有可能的原因是因為冰淇淋賣最好的時候,通常也是天氣最熱,最多人從事水上活動的時候,而越多人從事水上活動,自然也就會有越多溺水事件。
另外也有因果方向與直覺相反的情形,比如說籃球選手平均身高比一般人高不少,在籃球場上也很多高個子,很多人就會認為:「多打籃球可以長高」。但其實這裡我們必須考慮另一種可能性,那就是,也許是長得高在籃球場上有優勢,讓高個子打起容易取勝,一來比較容易有成就感,二來也比較容易被選為選手,於是在篩選淘汰的過程中,籃球場上留下的大多是高個子。也就是說,很可能因果關係的方向並不是「因為打籃球,所以長得高」,而是反過來「因為長得高,所以打籃球」。
我之前有一次跑地方選舉時,選前最後兩天有人提出用宣傳車做最後衝刺,我們選了一個人口比較密集的區域,在那裡多繞了幾趟。後來選票開出來,那個區域的得票比例比起其他區域來得高,於是很多人就下結論,我們最後兩天的衝刺取得明顯的成果,但我一直很懷疑這個說法,因為就我自己理解,我不認為選前兩天會有人因為宣傳車多跑幾趟就改變投票意向,何況那區域是以大樓為主,多少人會注意到我們的宣傳車都很值得懷疑。相對的,我認為那個區域的選民結構本來就會有比較多選民傾向於我們的立場,這可能才是得票比例偏高的原因。也就是說並不是我們的最後衝刺讓得票變高,而是那裡本來就是我們的票倉。
總之,人類本性上很容易將現象之間的相關,直接視為因果關係,所以我們的老祖先在科學出現之前,會發展出各種在我們現在看起來根本就是迷信的神話。
那麼,這本《「因」「果」經濟學》,就是在處理這個問題,首先,讓我們在心裡有個底,哪些我們以為可以推論為因果的關係,其實根本不具備因果關係。再來,就是告訴我們,有哪些方法可以讓我們取得可靠的證據,讓我們可以認定兩件事情之前真的有因果關係。
在這個資訊爆炸的年代,我們通常缺的不是資訊的取得,而是解讀資訊的能力,而因果關係的推論,就是其中很重要,但卻常常會出錯的其中一環。不只在日常生活中,在新聞上也常常會看到各種錯誤的因果推論。很多時候,錯誤的因果推論可能不會造成什麼大問題,那也就無妨,比如說,我們以為打籃球可以讓自己長高,就努力地打打打打打,但即便最後並沒有因此變高個子,多運動也讓我們身體強健。
但有些情況,錯誤的因果推論,則是會造成錯誤的決策,而導致資源的浪費,比如說如果一個店家因為有一次打了廣告,營業額變高,就認定打廣告對銷售有幫助,於是花了更多預算在廣告上,但實際原因卻是,剛好店家選擇打廣告的時候,經歷了一個重要節日,本來就會提高民眾的購買慾望。
所以能更精準地掌握正確的因果關係,對我們的決策來說相當重要。