版權(quán)歸原作者所有,如有侵權(quán),請(qǐng)聯(lián)系我們

[科普中國(guó)]-效標(biāo)效度

科學(xué)百科
原創(chuàng)
科學(xué)百科為用戶提供權(quán)威科普內(nèi)容,打造知識(shí)科普陣地
收藏

基本概念

所謂效標(biāo)效度,就是考查測(cè)驗(yàn)分?jǐn)?shù)與效標(biāo)的關(guān)系,看測(cè)驗(yàn)對(duì)我們感興趣的行為預(yù)測(cè)得如何。因?yàn)樾?biāo)效度需要有實(shí)際證據(jù),所以又叫實(shí)證效度。1

基本分類預(yù)測(cè)效度與同時(shí)效度

根據(jù)搜集效標(biāo)的時(shí)間,可以將效標(biāo)效度分為預(yù)測(cè)效度和同時(shí)效度。

1.同時(shí)效度

同時(shí)效度的效標(biāo)資料是與測(cè)驗(yàn)分?jǐn)?shù)同時(shí)搜集的。例如大學(xué)入學(xué)考試可以用中學(xué)成績(jī)作效標(biāo)。同時(shí)效度常用的效標(biāo)是在校的學(xué)業(yè)成績(jī)、教師的等級(jí)評(píng)定、臨床檢查等。

2.預(yù)測(cè)效度

預(yù)測(cè)效度的效標(biāo)資料需要過(guò)一段時(shí)間才可搜集到。此種效度對(duì)人員的選拔和安置工作非常重要。常用的效標(biāo)是專業(yè)訓(xùn)練的成績(jī)、實(shí)際工作的表現(xiàn)等。

效標(biāo)和效標(biāo)測(cè)量

1.效標(biāo)

所謂效標(biāo)指的是衡量測(cè)驗(yàn)有效性的外在標(biāo)準(zhǔn),通常是指我們所要預(yù)測(cè)的行為。

可以用來(lái)作為效標(biāo)的變量有很多。效標(biāo)可以是連續(xù)變量(如分?jǐn)?shù)),也可以是分類變量(如 職業(yè));可以是然的現(xiàn)成的指標(biāo)(如產(chǎn)量、薪水),也可以是人為設(shè)計(jì)的指標(biāo)(如課堂測(cè)驗(yàn));可以是主觀評(píng)判,也可以是客觀測(cè)量。歸納起來(lái),常見的效標(biāo)主要有學(xué)業(yè)成就、等級(jí)評(píng)定、臨床診斷、特殊訓(xùn)練成績(jī)、實(shí)際工作表現(xiàn)、對(duì)團(tuán)體的區(qū)分、其他測(cè)驗(yàn)成績(jī)。

2.效標(biāo)測(cè)量

阿斯?。╝.w.astin)將效標(biāo)分為觀念效標(biāo)和效標(biāo)測(cè)量。觀念效標(biāo)是一個(gè)概念,效標(biāo)測(cè)量則是對(duì)觀念效標(biāo)的數(shù)量化。例如:對(duì)于大學(xué)入學(xué)考試來(lái)說(shuō),我們感興趣的是“大學(xué)學(xué)習(xí)的成功”,這是觀念效標(biāo),而大學(xué)的學(xué)習(xí)成績(jī),則是效標(biāo)測(cè)量。如果無(wú)效標(biāo)測(cè)量,觀念效標(biāo)是毫無(wú)用處的。

好的效標(biāo)測(cè)量應(yīng)符合以下幾個(gè)條件:

①效標(biāo)測(cè)量必須真實(shí)地反映觀念效標(biāo)的重要側(cè)面;

②效標(biāo)測(cè)量必須穩(wěn)定可靠;

③效標(biāo)測(cè)量必須客觀,避免偏見;

④在保證有效性的前提下,效標(biāo)測(cè)量必須盡可能簡(jiǎn)單、省時(shí)、花費(fèi)少。1

估計(jì)方法效標(biāo)效度一般可以通過(guò)統(tǒng)計(jì)分析得到一個(gè)數(shù)量指標(biāo),因此有人又叫它統(tǒng)計(jì)效度。常用的估計(jì)方法有相關(guān)法、分組法、預(yù)期表法等。

相關(guān)法

確定效標(biāo)效度最常用的方法是計(jì)算測(cè)驗(yàn)分?jǐn)?shù)與效標(biāo)測(cè)量的相關(guān)。根據(jù)變量的性質(zhì)不同,可分別采用積差相關(guān)法、等級(jí)相關(guān)法、二列相關(guān)法等。相關(guān)法的優(yōu)點(diǎn)是:

①提供了預(yù)測(cè)源與效標(biāo)間的數(shù)量關(guān)系;②可利用回歸方程式來(lái)預(yù)測(cè)每個(gè)人的效標(biāo)分?jǐn)?shù)。

相關(guān)法的缺點(diǎn)是:

①如果預(yù)測(cè)源與效標(biāo)之間不是直線關(guān)系,便會(huì)低估測(cè)驗(yàn)的效度;②不能提供關(guān)于取舍正確性的指標(biāo)。

分組法

確定效標(biāo)效度的另一種方法是看測(cè)驗(yàn)分?jǐn)?shù)能否區(qū)分由效標(biāo)測(cè)量所定義的不同團(tuán)體。例如在大學(xué)里,我們根據(jù)教師評(píng)定,把學(xué)生分為合格與不合格兩組,然后回過(guò)頭去查閱他們的高考分?jǐn)?shù),若兩組在高考分?jǐn)?shù)上有顯著差異,那就可以認(rèn)為高考是有效的,否則便認(rèn)為是無(wú)效的。

預(yù)期表法

預(yù)期表法是將預(yù)測(cè)源分?jǐn)?shù)和效標(biāo)分?jǐn)?shù)制成雙維圖表,并將每個(gè)變量按水平分成若干檔次,然后列出每個(gè)檔次上的人數(shù)百分比。從預(yù)期表我們可以看出效標(biāo)效度的高低。從右下角到左上角的對(duì)角線上各格中的數(shù)字越大,說(shuō)明效標(biāo)效度越高。

基本簡(jiǎn)介效標(biāo)效度是指測(cè)驗(yàn)分?jǐn)?shù)與效標(biāo)的相關(guān)程度。所謂效標(biāo),就是檢驗(yàn)測(cè)驗(yàn)有效性的一種參照標(biāo)準(zhǔn)。效標(biāo)常用一種公認(rèn)比較可靠或權(quán)威的測(cè)驗(yàn)結(jié)果表示。這實(shí)際上就是用一種已知的且認(rèn)為其“有效”的測(cè)驗(yàn)結(jié)果去檢驗(yàn)另一個(gè)新測(cè)驗(yàn)的有效性。之所以不直接用效標(biāo)測(cè)驗(yàn)去代替新測(cè)驗(yàn),往往是因?yàn)樾聹y(cè)驗(yàn)可能比效標(biāo)測(cè)驗(yàn)更為簡(jiǎn)單、易行。

化學(xué)教學(xué)中常用學(xué)生的實(shí)際高考成績(jī)與模擬高考試題得分之間的相關(guān)來(lái)檢驗(yàn)高考模擬試題的有效性。這里應(yīng)用的就是效標(biāo)效度的檢測(cè)方法,高考就成了模擬考試的效標(biāo)。

由于效標(biāo)效度采用測(cè)驗(yàn)分?jǐn)?shù)和效標(biāo)分?jǐn)?shù)間的相關(guān)系數(shù)來(lái)表示,可以對(duì)被檢測(cè)的測(cè)驗(yàn)進(jìn)行定量化的分析比較,相對(duì)于內(nèi)容效度而言更為客觀,其意義也較直觀,易于被理解和接受。但是,效標(biāo)效度在實(shí)際化學(xué)教育測(cè)量中應(yīng)用得并不多,這主要是因?yàn)槟壳吧形凑业奖容^合理的、可以滿足化學(xué)教育測(cè)量各種要求的效標(biāo)。除高考外,還沒(méi)有其他比較權(quán)威的化學(xué)考試,而高考卻不能作為一般化學(xué)教學(xué)測(cè)驗(yàn)的效標(biāo)。這是因?yàn)閮烧咧g在內(nèi)容、性質(zhì)上都有很大差別。高考是為高校錄取新生服務(wù)的選拔性考試,而教學(xué)測(cè)驗(yàn)多是為教學(xué)服務(wù)的形成性評(píng)價(jià)的一部分;高考試題要在中學(xué)化學(xué)的全部教學(xué)內(nèi)容范圍內(nèi)取樣,而教學(xué)測(cè)驗(yàn)往往只就某一教學(xué)階段的內(nèi)容范圍取樣。在教學(xué)實(shí)際中,有時(shí)用教師對(duì)學(xué)生的等級(jí)評(píng)定作為某種測(cè)驗(yàn)的效標(biāo),但這樣的效標(biāo)難免會(huì)帶有較多的主觀因素的影響。某些心理測(cè)驗(yàn)如智力測(cè)驗(yàn)、國(guó)外的一些學(xué)科水平測(cè)驗(yàn)等,與我國(guó)的化學(xué)教學(xué)實(shí)際尚有較大的距離,也很難作為化學(xué)教育測(cè)驗(yàn)的效標(biāo)。因此,尋找化學(xué)教育測(cè)驗(yàn)的合理效標(biāo),是當(dāng)前化學(xué)教育測(cè)評(píng)研究的重要課題之一。2

效標(biāo)效度條件信度、效度與常模

使研究具有較高的效標(biāo)效度,應(yīng)該滿足以下4個(gè)條件:

(1)理論構(gòu)思要結(jié)構(gòu)嚴(yán)謹(jǐn)、符合邏輯、層次分明,形成某種“構(gòu)思網(wǎng)絡(luò)”。例如,將兒童的自我意識(shí)發(fā)展分為自我認(rèn)識(shí)、自我體驗(yàn)和自我控制三方面,而自我認(rèn)識(shí)進(jìn)一步細(xì)分為對(duì)生理自我的認(rèn)識(shí)、對(duì)心理自我的認(rèn)識(shí)和對(duì)社會(huì)自我的認(rèn)識(shí)。這樣的理論構(gòu)思,就比較嚴(yán)謹(jǐn)、完整,有層次,并且形成一種“網(wǎng)絡(luò)”,便于理解和研究。 (2)清晰、準(zhǔn)確的界定研究的環(huán)境條件和變量。例如,“小學(xué)五年級(jí)學(xué)生發(fā)散思維問(wèn)題研究”這樣一個(gè)課題,對(duì)研究被試的年齡段,生理智力發(fā)展,學(xué)習(xí)、生活、社會(huì)環(huán)境等需要明確界定范圍,用文字和語(yǔ)言兩種形式完整、準(zhǔn)確地表述研究變量。

(3)對(duì)研究變量做出準(zhǔn)確、嚴(yán)格的操作定義,并選擇對(duì)應(yīng)、客觀的觀測(cè)指標(biāo)。

(4)避免采用單一方法或單一指標(biāo)去代表或分析多維的、多層次的、多側(cè)面的事物和活動(dòng),盡可能采用多種方法、多種指標(biāo),從不同角度分析研究相同的理論構(gòu)思。

教育科學(xué)研究常常包含著復(fù)雜的、多維度的理論構(gòu)思,如何提高研究的效標(biāo)效度是進(jìn)行研究設(shè)計(jì)時(shí)需要加以特別重視的問(wèn)題,也是提高教育科學(xué)研究水平的重要內(nèi)容。2