班佛本人

在鑑識會計與舞弊領域, 有假帳殺手之稱的「班佛定律」(Benford’s Law)非常知名,不過卻常常被神話、甚至被誤解因而誤判。

什麼是班佛定律

班佛定律的核心概念是,在自然發生(即未有人為限制)的觀察值裡面,首位數字是1的出現機率最高,約佔全體觀察值30.1%,再來是2的17.6%,其餘依序遞減。舉個例子,台灣未限制人民遷徙的自由,因此每個鄉鎮的人口數(即觀察值)符合所謂的自然發生原則。

台灣目前有368個鄉鎮,因此有368個人口數字,按照班佛定律,人口首位數字為1的鄉鎮應該約莫110個(30.1%)。而實際狀況呢?根據內政部2017年9月統計,首位數字為1的鄉鎮實際上有108個,十分接近!

誰發現的奇葩定律

天文學家Simon Newcomb(以下簡稱康康)偶然發現用來被查的對數表,數字較小的前幾頁,居然比後面幾頁破損不少,幾乎都快被翻爛了。於是在他潛心研究後,發表了班佛定律的數學公式。那這個公式怎麼不叫康康定律呢?因為在奇異電器工作的物理學家Frank Benford,廣泛地在兩萬多種數據中,測試這個定理是否適用,讓它發揚光大。

首位數字機率分布

真的有人用嗎

2002年,在美國Znetix/HMC上市詐騙案中,有七萬多筆支票跟匯款交易要查,人工全部看完交易是不太實際的事情。這時,鑑識會計專家Darrell Dorrell就用了班佛定律,找出疑似虛假或重複的交易(即那些首位數字比例明顯高於班佛定律的交易),加速了整個調查的過程。

除非舞弊犯學過班佛定律,還自己試算過,否則還真不容易被破解。

右邊就是Darrell Dorrell

那怎麼還沒流行起來

可惜的是,實際上應用的限制還不少。

一是建議資料至少1000筆以上再使用,3000筆以上效果更佳。二是一定要確認,這些數字沒有被「人工限制」。

舉例來說,如果你用班佛定律來分析2014年台北市長選舉時,柯P所公布的競選經費,你會發現居然不符合班佛定律!先別見獵心喜或是急著辯護,仔細爬梳資料你會發現,「17」開頭跟「50」開頭的交易特別多,多到讓這些資料不符合班佛定律。回頭再檢查競選經費明細,17塊多是ATM轉帳的手續費,50開頭則是表演團體的車馬費公定價5000元啦。(抱歉柯黑)

扣掉薪資的柯P2014競選經費首位數分布

參考資料

你會感興趣的相關文章
分享給更多人
免費註冊按讚,支持優質創作
0 0 votes
Article Rating
Subscribe
Notify of
guest
0 Comments
Inline Feedbacks
View all comments