2018年6月30日 星期六

數學教你不犯錯

看完了《數學教你不犯錯》,主題是數學思考與生活的關係。書中舉的第一個例子,是第二次世界大戰期間數學家沃德建議怎樣增加戰機的裝甲,沃德認為應該加固在發現彈孔數最少的引擎中,因為回來的飛機某部份彈孔多,顯示這個部位能夠承受攻擊。這種思考方式與數學家總是問假設是甚麼有關,以返航飛機的彈孔頻率,推斷飛機哪個部位較少中彈,需要假設返航飛機為所有飛機的樣本,這項假設並不正確。

兩項變項的關係不一定是線性的,非線性的思維是指,應該朝哪個方向前進,是應更多還是更少,取決於目前的狀態。例如稅收與稅率的關係是非線性,降低稅率有可能增加稅收,也有可能減少,至於應該是怎樣,需要依靠艱難的實證工作。線性思考也會令線性迴歸的推論出現問題,例如以過往肥胖人口趨勢推論未來,甚至會令某些年後肥胖人口比率超過100%。

國際新聞經常會用到在某國的多少人相當於本國多少人這種比例,但這種方式的問題是,假如用不同地方相比,就會得出不同的數字。而且,有些災難是不能互相比較的,不是一個數比另一個數大的問題。用比例來描述像美國不同州腦癌佔全州人口比例,會發現人口較少的州份較常出現在最高與最低兩端,這與「大數法則」有關,即較小樣本中個別極端情況的比重較大。

作者也提醒要記住以下的口訣︰數字會變負時,免談百分比。因為正負效果會抵消,例如就業職位在某行業會增加,另一行業會減少,使用百分比的話,就會造成「某行業創造職位佔總新增增位175%!」這種混淆的說法。在真實世界的問題,需要知道數字之外的事,作者指,「用一個數除另外一個數僅僅是計算,搞清楚你該用什麼除什麼才是數學。」

「聖經密碼」聲稱聖經蘊藏預言未來的訊息,可以用特定方式來解讀。作者指數學家對此深存懷疑,因為巧合可以是人為創造,例如巴爾的摩經紀人故事中,經紀人向10,240人發信預測股票走勢,一半說會升,一半說會跌,然後向正確的一半再寄信,一半說會升,一半說會跌,如此類推,十次之後會有十個人收到連續十次正確的訊息,好像經紀人真的料事如神。只要樣本夠大,不大可能的是也會發生。此外,聖經密碼的規則也有曖昧空間,使用總是與之吻合的拉比稱呼。假如使用不同的稱呼方式,就會找不到聖經密碼。

不大可能發生的事經常發生,也表示科學論文的統計方法可能會出問題,只看到符合結果的例子,對不符合的例子視而不見。許多科學研究都以p值來排除虛無假設,也就是研究因素沒有造成影響的假設。p值是指假如虛無假設成立,實驗結果這種情況出現的機率是多少。p值少於0.05,即二十次才會有一次,是排除虛無假設的傳統門檻。p值本身並沒有說明研究因素的影響有多大,尤其在醫療上,即使相對風險可能增加一倍,絕對風險可能仍然極低,p值也不能偵測短暫而微小的影響。

作者將以p值少於0.05排除虛無假設的做法稱為「歸渺法」,即︰假設虛無假設為真,在虛無假設為真下,觀察現象出現的可能非常低,但觀察現象的確出現,因此虛無假設不大可能為真。問題是,相當不可能不等於完全不可能,例如六合彩攪珠,每次出現的結果都是相當不可能出現,但某一結果總是會出現的。

當某種現象本身在人口中的機率就極低,通過檢定但實際上沒作用的偽陽性結果,就可能會遠比真陽性結果多。如果科學領域以統計顯著性為研究發表門檻,就會令某次因巧合成功的結果發表,其他相同做法但失敗的結果則無法公開。在政治科學、經濟學、心理學與社會學論文中,p值在0.05附近的研究竟然比其他p值的研究多,表示論文作者很可能刑求數據以取得通過門檻的p值,這對科學本身並無幫助。由p值改用信賴區間在統計方法上是同一回事,但可以顯示區間的效果程度,而在得不到統計顯著結果時,也可以知道是否有證據顯示介入沒有作用,或者搞不清楚介入帶來正向還是負向作用。

貝氏推論是指先以事前機率描述看到證據前的信心,再在看到證據後調整以得出事後機率。事後機率既會受證據影響,也會受事前機率影響。這反映出我們總是以原有知識與信念為準,再以新的證據進行調整。貝氏定理的機率,是指我們相信的程度,而我們會傾向選擇簡單、可以目前知識解釋,而不是複雜、以全新現象才能解釋的理論。我們也要注意能解釋同樣觀察結果的理論可以有很多個。有些問題,例如宗教信仰,作者認為,人們還是最好用非量化的方式處理,數學最好保持沈默。

買彩券時以機率乘上結果價值可得出期望值,這不是指我們期望結果的數值,因為彩券只有贏與輸,期望值是指同樣情況下多次下注,平均會得出的結果。通常彩券的期望值都會比售價低,平均而言會是開辦彩券一方得益。作者對投注美國威力球的建議是︰不要玩;要玩的話,待獎金極高才玩;挑別人不想挑的號碼。

也曾出現彩券期望值比售價高的情況,就像2005年美國麻省的大贏錢樂透。在期望值可加的特性下,在某些情況大量投注大贏錢樂透理論上會有賺頭,的確也有人這樣做。在這些年間,大量投注的玩家賺到錢,形同莊家,開辦樂透的州政府取得獎券稅,輸家則是其他玩家。這情況不是第一次發生,十八世紀早期,伏爾泰就靠鑽彩券空子賺了大錢。

經濟學家會用效用(utility)為生活每件事定價。在實務上,將出錯機率減至零的成本相當大,甚至更勝於獲益,也就是說有時讓錯誤出現比減少錯誤的效用高。效用也有非線性的特性,增加一單位的金錢,並不會與增加的效用成正比,已有金錢越多,增加的效用越少,甚至可能會降至零。作者也指出,預期效用理論無法分析「未知的未知」,也就是不確定性。

越有錢越能夠承擔風險能以預期效用理論來解釋,對於收入微薄的人來說損失例如十萬元就是嚴重效用損失,但對有錢人來說就不大重要。有錢人認為期望值是正值的賭局,在收入微薄的人而言會是負值。把雞蛋放進許多不同的籃子中,是較乏味但有成果的投資方法。

滿足「每一對點都恰屬於一條共有的線」,以及「每一對線都恰包含一個共有的點」兩條幾何公設的理論,後來發展成通訊的數學理論,用於更正通訊時受雜訊干擾的訊息。抵擋雜訊能力與通訊速度此消彼長,這形成通訊通道的容量。利用幾何的公設,更正碼就可以在訊號被雜訊干擾後重構原有訊息。

既然從期望值看玩樂透不是好選擇,為甚麼人們繼續玩?卡尼曼與特弗斯基的前景理論認為,人們通常會偏離效用曲線另尋出路,低機率事件會得到較大權重。更簡單的解釋時,買樂透本身就是小小快樂一下。這也可以與企業家精神類比,縱使成功機會非常小,經營生意的效用本身就是創業主要理由。

身高既受先天也受後天影響,特別高可能是先天與後天因素都發生作用,其子女只遺傳到先天的因素,因此子女雖然很可能都會比平均高,但會比父母矮,這種現象稱為向平均值迴歸。體重、企業表現、棒球員全壘打數目等,都會出現向平均值迴歸的情況。醫學治療與社會政策也應考慮向平均值迴歸,否則有機會將無用的做法誤以為有效。

兩個變項的關係可以用相關這個數字表達。在紀錄不同特徵以辨識個別紀錄時,特徵之間的相關越高,有效的辨識訊息量就越少。由於一個檔案的數位彼此相關度可能頗高,相關也可以用於壓縮資訊,讓數碼檔案儲存在較小的空間。從幾何的角度看,相關就是N維(N=個案數)空間兩個向量的夾角之餘弦(cos),夾角為0°,餘弦為1;夾角為180°,餘弦為-1;夾角少於90°,兩個變數是正相關,多於90°是負相關,等於90°,相關是0,兩者毫不相干。

相關是不可傳遞的關係,作者指有點像有血緣關係,例如父親與兒子有血緣關係,母親也與兒子有血緣關係,但父母沒有血緣關係。同樣,高濃度「好膽固醇」與降低心血管事件的風險有關,而某些藥能夠有效提升「好膽固醇」濃度,但這並不代表這些藥一定能降低心血管事件風險,當中部份可能會降低心血管事件風險,但部份不會。醫學研究的困難在於,人體極為複雜,可量度的特徵極少,而相關卻不可傳遞,意味著新藥很容易會失敗。

兩項變數不是相關也不代表沒有關係,相關只偵測到線性關係,面對像是U形的關係時,相關無法看出關係。相關也不等於因果,相關既不能指出是否有第三個因素導致相關,也不能指出兩項變數誰是因誰是果。在制定公共政策時,只能做最好的猜測然後下決策,在未完全確定就不作任何建議,原可拯救的性命就會因此喪失。

作者也提醒在非隨機的樣本中找出相關,有機會是統計的幻象,例如在醫院中抽樣,病人總是因為某些病情入院,如果他們不是因為糖尿病入院,高血壓就成為更可能的因素,這樣糖尿病與高血壓就會呈現負相關,但原因不過是所有樣本都是病人。

個人選擇集合起來有時會形成不理性的情況,在選項多於兩個時,例如有ABC三個選項,按總數計有機會出現反對A的人比反對B多,反對B的人比反對C多,反對C的人卻比反對A多這種情況,真正的民意並沒有從數字中反映出來。在兩個選項中再加入一個無關選項,也會令最後結果出現變化。不論是用優先順序計分法,還是排序複選制(IRV),都有可能出現每個選項在一對一競爭下,輸給其他兩個選項中的一個,這種情況稱為康道塞悖論,即選民偏向A甚於B,但B卻成為選民的選擇,這對B與C亦然。

作者強調,數學並不是少數孤單天才的活動天地,並不是只有最棒的人才值得做數學,而且數學主修生也並不一定需要成為數學家。數學也需要艱苦工作,到最後出現的一瞬間靈感,其實都是之前有意識及無意識工作做好心智準備的結果。總是有人會比自己超前,但即使不是每個人都是高斯,透過通力合作還是令數學得以發展,數學是群體的事業。

作者指,數學提供一條可以不確定的道路,不過是有原則的道路,斷言不確定的原因與程度。追求過份精準是問題,在差別極小的情況下,訊號已經遭雜訊淹沒,真正是甚麼已沒有意義,不應假裝自己知道。作者最後指,數學就是擴充常識的額外手段。