量尺

       以往舊制聯考的分數都是依題目類型配分計算來的。不同類型的題目或不同題目的配分給定的標準沒有明確的理論根據。用這樣的分數來量化一個人能力的高低容易產生很大的誤差;況且不同分數之間的測量誤差也不相同。
基本學力測驗的分數,現在被我們稱做量尺,它是經由測驗學者、專家根據統計學上的實質意義所運算建立來的,不同分數點的測量誤差幾乎相等,分數比較能夠反映受測者的真實程度,使用量尺進行個體的比較或分發是比較有理論根據與實質意義的。

根據測量誤差(standard error of measurement. SEM)與測驗信度(ρ)以及群體分數標準差的(SD)關係公式:SEM = SD ×
一份 40 題左右的基本學力測驗,其測驗信度估計,其信度應該有 0.85 左右。並採用 Kelley對測量標準誤差分數的建議,他認為以 3 分為一個測量標準誤差單位較為理想,如此所計算出來的群體分數的標準差(SD)為

再根據常態分布的機率來看,正負四個標準差就能涵蓋幾乎全部( 99.99% )的人。為了涵蓋所有的群體,量尺分數就必須要有62分( 7.75×4×2 )。而為了使用上的方便,而將量尺分數定成 1~60 分,這就是基本學力測驗分數(量尺)的由來。
假若一個考生的得分基本學力分數為30,而測量標準誤(standard error of measurement)為 3 ,則 30±3(即 27到 33 )為該考生的 68% 信賴區間,也就是該考生的分數帶。在統計上,我們可以自信的說在受測者身心狀況一樣的條件之下,如果該考生重複地考那份測驗 100 次的話,約有68次的得分會在 37 到 43 分之間。也可以說,我們有自信該生的真實分數約有 68% 的機會是在 37 到 43 分之間。
當一個人的分數是36分,測量標準誤差還是3分,比30分的人多了兩倍的測量誤差,我們就有更高的自信(約為90%)認為後者的分數比前一個人高。而這樣的比較是建立在各個分數的測量誤差是相同的基礎之下。這解決了舊制聯考因每個人的測量誤差不同,無法比較出每個受測者真實能力的問題。

如何計算得知量尺分數呢?其實,必需等完成測驗後,再依各科「題數」、「全體考生平均答對題數」、「標準差 」來計算。假設某科試題共有40道題,根據測驗結果,計算出了群體平均答對數是22題,同時也算出群體的標準差是5題,而某學生答對30題,則得多少分呢?

(個標準差)

7.75(群體分數的標準差)×(1.6)+30(平均分數)=42

以下是89學年度第一次基本學力測驗數學科量尺分數和達對題數對照表。

題數 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
量尺分數 1 1 1 3 6 8 10 11 13 15 17 18 20 21 23 24
題數 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32
量尺分數 26 27 29 30 32 33 35 36 38 40 44 46 48 51 54 60



Copyright ©2001~2004昌爸工作坊 all rights reserved