魔鬼天使總在資料間

做項研究、辦件公事,即使炒個菜弄鍋湯,都有可能陷入理論與實況不符。統計上來說無論是犯第一或第二類型錯誤,結論就是成與不成、滿不滿意的問題。尤其是花費了大量人力、物力、財力、心力,飽受過程的折磨,卻盡落得悲慘結局,很多人可能都有同感,千金難買早知道啊。
過去總覺得教科書千篇一律的告訴我們:要注意理論的適切性、資料的分佈性、方法的正當性……若沒有實際範例,很難體會這些教條式的東西,都是在提醒我們:「當局者迷」,要有反身性,要記得抽離自我,要時時刻刻回到所面對事物的本質。

在資料處理的當下,有很多方法可供資料檢視之用,任何教科書都將之視為第一要務。然而,我們往往容易忽略這一段,倒果為因,先求有再求好的作法是可以快速獲得成果,但這結論真的是我們要的?試想:一筆連自己都不太相信的資料,又遑論結果貼近實況?

搞了好幾天,確認了方法與過程都沒弄錯,結果卻不甚理想。這時,碩班與博班統計老師的叮嚀如暮鼓晨鐘:別忘了回到資料裡去看看,問題通常埋藏在資料裡。

的確,無論任何統計模式的共同點,即在於驗證資料的分佈,是否符合研究者提出的架構(假設);但理論再完美,方法再複雜,還是必須取決於資料的適切與否。舉個例子,資料當中是否有乖離者(極端值)、資料是否區辨問題(共線性)、蒐集資料的工具是否可靠(信度、效度)等等。

在檢查資料的同時,看電腦螢幕更讓我搖搖欲墜的視力雪上加霜,我突然懷念起印表機這項高科技產物,難怪人家都說:報表在不要錢的情況下,能偷印、多印,用力印越好。

我猛然發現:原來最初的設定才是正確的,卻繞了一大圈回到原點……

#資料 #資料處理 #統計分析 #第一類型錯誤 #第二類型錯誤 #data #data analysis #statistic #type 1 error #type 2 error

發表迴響