何謂『心理測驗』
在型式上心理測驗就像任何一種測驗一樣,最常見到的型式就是包含一系列的問題,被評量者依這些問題逐一作答,當我們將被評量者的答案予以計算、評分後便可以得到結果,而在對該項結果加以解釋的同時,我們便對被評量者個人的某些特質有了進一步的瞭解。
心理測驗運用「行為樣本」的概念
心理學家將心理測驗的測量題目以「行為樣本」(behavior sample)的概念來說明,意即在測驗中所出現的試題僅是代表所欲測行為的樣本而非全體。
例如:若要了解一名應徵者的英語詞彙能力,我們不可能測量他是否認得所有的英語詞彙,最可行的方法就是抽出一些詞彙來測量;但在這個過程中我們所關心的並非這位應徵者是否認得這些抽出來的字,而是以他在這個測驗上的表現來推論他的整體英語詞彙程度如何。
由於測驗的題目只是代表所欲測行為的樣本而非全體,因此題目的代表性就相當重要,如果在上述的詞彙能力測試中,所測量的詞彙都是國一程度的詞彙,就很難讓人信服這個測驗測出的結果,能準確地反映出應徵者的英語詞彙程度。
所以一個好的測驗,除了提供測驗題目、計分解釋的方式外,還必須提出一些品質指標,以便讓使用者能確知其所使用的測試題目是具有足夠的品質。
心理測驗的特徵:標準化、客觀化
一個人在不同的情境下的測驗結果是可能有所不同的,假設一個人需要做一個測量「注意力集中度」的測驗,第一次是在一個安靜的環境下施測,第二次則是在一個電話、腳步聲不斷的環境下施測,則很可能產生第一次的結果優於第二次的情形,這種情況如果是發生在兩個不同的人身上,而將該測驗結果被視為錄取於否的標準,顯然對第二個人是相當不公平的。
為避免非個人特性的因素影響測驗結果,心理測驗相當強調「標準化」的概念,從測驗題目的呈現方式、時間的限制、作答說明(包含口頭及書面)、作答範例、施測環境、測驗結果的計分與解釋、到如何回答受測者的問題等,都有提供標準化的指南,供測驗使用者在施測時使用,測驗使用者在施測時,也應盡量按照標準化的程序來進行。 客觀性強調的是測驗結果不會受到任何主觀因素的影響,亦即由不同的測驗者實施,皆可獲得相同的結果。為得到客觀化的測驗結果,心理測驗通常會數字化,以分數來呈現測驗的結果。
一般來說,衡量一個測驗的品質可從信度與效度兩方面著手:
一、信度
信度所談的是測驗資料的可靠性、穩定性與一致性。為了達到可靠、穩定、一致的結果,可從多個方面來驗證測驗的信度。
再測信度:
再測信度是指同一個測驗在不同的時間施作,其結果的一致性,是一種穩定係數。一般的作法是:第一次施測 → 經過一段時間 → 第二次對同一群人施測 → 求取兩次測驗分數的相關。相關係數愈高表測驗結果的穩定性愈高。
內部一致性信度:
前面已經談過一個專業的心理測驗,會以多個試題共同測量一個心理特質,「內部一致性信度」所欲驗證的就是這些題目確實是在測量同一個心理特質。
其原理是檢驗每一個題目的作答反應與總分的相關性,相關愈高表示該題與其他測驗題目愈同質,愈是在測量同一個特質。常見的一致性信度指標為Cronbach"s α係數,其概念類似相關係數,分數介於0~1之間,係數愈高代表一致性愈高,一般而言信度係數在0.6以上是可接受的範圍。
複本信度:
複本指的是當一個測驗有二套以上的平行題本時,就需要驗證這二套題本分數的一致性。一般的作法是:受測樣本同時做二套題本,然後求取兩個測驗分數的相關,相關愈高表二個題本的測驗結果愈一致,日後不論用那一套題本的測驗結果都可以互相的比較。
二、效度
相對於信度所談的測驗分數的穩定、一致與可靠性,效度的概念則是在驗證測驗是否能真實而正確地測量到其所欲測的特質或行為,亦即是否「名實相符」。例如一個聲稱在測量領導能力的測驗,是否真正測量到領導能力而不是其他的能力,則該測驗就需要提供進一步的訊息加以驗證。
在效度上最常使用的是「效標關聯效度」,它是指以驗證性的方法,來探討測驗分數與一些外在效標之間的關係。效標是什麼,就看我們要驗證什麼樣的假設。
常見的作法有:
用已發展好測量相同特質的測驗為效標:
亦即將發展中的測驗與這個測驗同時施測在同一群人身上,然後計算這個測驗分數的相關性,理論上,既然是測相同的特質,所得到的結果應會相近。
以所要預測的某些行為或量數為效標:
例如:一測量工作能力的測驗,可能會使用工作績效、工作滿意度等為效標,一個測量學業學習潛能的測驗,可能會以學校的學期分數為效標。
收集效標分數與測驗分數後,就可求取這兩個分數的相關係數,了解測驗分數與效標分數的相關性;或者,選取在效標分數上高分的(例如前30%)與低分的(例如後30%)人,比較高分組與低分組在測驗的分數上是否真的有顯著的差異存在。總之,我們若假設測驗的分數可以預測其工作或學業的表現,就必須要提出相關的證據來證明。
效度可由多角度多層次去探討,有其特殊性及使用性,所以一個測驗可有多個效度指標,並不限於一個。
簡而言之,效度所要做的就是去「證實測驗所宣稱的事」,例如其宣稱是在測量智力,就要有證據來證明其測量到的真正的是智力,或者測驗宣稱其所測得的智力可預測學業成績,也要有證據來證明這一項假設。
最後,要提醒各位的是,信度與效度雖然關心的是不同的事,但是效度是建基在信度上的,沒有高的信度就不會有高的效度,試想一個測驗今天測一次、明天再測一次的結果相當不同,兩次的結果都會與效標有高度相關嗎?
所以檢驗測驗的品質時,若其所提供的信度指標顯示這個測驗的穩定、一致性不足,則其效度再高仍不足採信。
[圖擷取自網路,如有疑問請私訊]
| 喜歡這篇嗎?快分享吧! |
前一頁
後一頁