Rasch Model: Riset Kuantitatif

Home » Penelitian » Teori Tes Klasik

Teori Tes Klasik

Bagian ini menjelaskan evolusi yang terjadi dalam disiplin ilmu pengukuran (measurement). Teori test klasik (atau clasical test theory, CTT) adalah cikal bakal yang nantinya berkembang menjadi teori respon butir (Item response theory,  IRT) yang mana pengukuran  pemodelan Rasch (Rasch Model Measurement) merupakan komponen utamanya. Penjelasan tentang CTT akan memberikan gambaran tentang komponen utamanya dan keterbatasan pengukuran dengan teori ini, dan IRT dikembangkan untuk memperbaiki hal ini.

Teori tes klasik (CTT) adalah teori psikometri yang membolehkan kita untuk melakukan prediksi tentang hasil dari suatu ujian (tes), melalui kemampuan orang yang melakukan tes dan tingkat kesulitan soal yang dikerjakan. CTT digagas oleh Charles Spearman pada tahun 1904, dan merupakan teori psikometri yang populer dan banyak digunakan untuk berbagai disiplin ilmu (psikologi, pendidikan dan ilmu sosial lainnya). Asumsi dasardari CTT adalah, skor yang diamati (atau skor mentah yang didapat) dilambangkan dengan X, terdiri dari skor murni (T) dan skor kesalahan (skor galat) (E), sehingga persamaannya:

X = T + E

hal yang perlu dicatat adalah, skor mentah (X) adalah satu-satunya skor yang nyata; sedangkan skor murni (T) dan skor kesalahan (E) bersifat tersembunyi (latent), tidak bisa diamati secara langsung. Informasi yang didapat dari skor pengamatan dapat digunakan untuk menguji konsistensi tes (reliability). Asumsi lain yang perlu diketahui adalah skor kesalahan (E) dalam CTT bersifat acak dan tidak berkorelasi dengan X maupun T, dan perkiraan nilainya adalah 0 (nol).

Berdasar asumsi di atas, maka keragaman (varian) dai skor mentah adalah gabungan dari varian skor murni dan skor kesalahan:   Var (X) = Var (T) + Var (E). Karena nilai dari T dan E sifatnya tersembunyi dan yang dicari dalam satu ujian adalah skor murni individu (T), asumsi yang ditetapkan pada skor kesalahan (E), mendapatkan kita persamaan reliabilitas  tes, yaitu: R = Var(T) / Var (X). Berhubung skor murni tidak bisa didapatkan secara langsung; maka cara lain digunakan untuk mendapatkan nilai relibilitas, yaitu melalui dua buah ujian yang sama konsep dan kualitasnya, korelasi antara hasil kedua test tersebut akan menunjukkan nilai yang sama dengan reliabilitas ujian.

Mengetahui reliabilitas ujian memberikan informasi tentang keragaman dan skor murni, sehingga mengetahui skor mentah membuat seorang peneliti dapat menjelaskan kisaran yang masuk akal tentang skor murni dan hubungannya dengan skor mentah. Dari segi praktis, nilai reliabilitas yang banyak digunakan adalah nilai alpha cronbach.

Kegunaan utama dari CTT adalah untuk mendapatkan skor mentah dari satu ujian yang didapat, yang menunjukkan kemampuan seseorang dalam mengerjakan ujian. Dari skor mentah ini maka berbagai analisis dan interpretasi bisa dihasilkan sesuai dengan keperluan studi yang dilakukan.

1. Statistik deskriptif. Saat data sudah diperoleh, maka nilai rata-rata dan keragaman (varian)  suatu informasi yang berharga untuk didapatkan. Hal ini akan memberikan info secara langsung butir soal mana yang berguna dan mana yang tidak; misalnya jika keragam dari satu soal rendah, maka menunjukkan tidak beragamnya hasil dari soal tersebut dan menunjukkan soal yang mungkin tidak bagus.

2. Tingkat kesulitan. Proporsi dari individu yang dapat mengerjakan soal atau menyetujui satu pernyataan dari satu ujian dinamakan tingkat kesulitan. Tingkat kesulitan mempunyai nilai terendah 1,0 dimana semua peserta tes dapat menjawab dengan betul; sedangkan tingkat kesulitan soal 0,0 berarti tidak ada satupun yang bisa menjawab dengan benar. Kedua jenis soal begini tidak berguna karena tidak bisa membedakan kemampuan individu. Sehingga tingkat kesulitan 0,50, yaitu 50% dari anggota kelompok yang diuji lulus, merupakan tingkat kesulitan yang baik dimana soal tersebut mempunyai tingkat pembedaan kemampuan tertinggi untuk peserta tes.

3. Indeks diskriminasi. Selain tingkat kesulitan soal yang membandingkan keseluruhan soal yang diberikan, dalam konteks CTT indeks diskriminasi juga dapat dihitung berdasarkan dikotomi butir soal yang diberikan. Biasanya, tingkat kesulitan 0,5 akan menyumbang pada bagusnya nilai indeks diskriminasi, yang makin besar nilai indeksnya menunjukkan makin bagus.

4. korelasi antara butir soal dengan total. Bentuk lain dari pengujian butir soal dalam CTT adalah melalui perhitungan korelasi Pearson. Cara yang dilakukan adalah memilih butir soal tertentu dari tia-tiap individu, kemudian dilakukan korelasi dengan total skor mentah yang didapat; dengan cara ini bila didapat nilai korelasinya kecil, maka mengindikasikan hal ini tidak berhubungan dengan butir soal lain yang diberikan (standarnya nilai korelasi lebih besar dari 0,5).

5. Pembobotan butir soal. Umumnya dalam konteks CTT, skor untuk tiap butir soal diberikan sama (misal 1,0 untuk jawaban betul), pembobotan skor diberlakukan bila satu soal yang diberikan mempunyai bobot yang berbeda untuk menghasilkan total skor mentah. Terdapat banyak cara untuk memberikan pembobotan, misal melalui relibilitas soal, dimana soal dengan reliabilitas tinggi menyumbang bobot lebih besar dan sebaliknya; melalui nilai korelasi butir soal; regresi kriteria soal yang diberikan; ataupun dengan faktor analisis.

–ooo–

Dalam disiplin ilmu pengukuran seperti pada bidang pendidikan, efektivitas CTT mempunyai keterbatasan. Misalnya ketika dua jenis tes berbeda diberikan pada dua kelompok yang berbeda, maka hasil yang didapat oleh individu maupun pengujian butir soalnya tidak bisa dibandingkan. Skor mentah yang didapat oleh seseorang dari satu tes tertentu yang dianggao sebagai hasil pengukuran, juga tidak dapat dibandingkan.  Dalam konteks CTT, tingkat kesulitan dan pembobotan butir soal pun sangat tergantung pada hasil dari kelompok yang diuji. Satu kesulitan mendasar lainnya, yang berdasar asumsi yang dibuat, skor murni sangat tergantung dari ujian yang dilaksanakan. Skor mentah dan skor murni pada dasarnya berubah-ubah tergantung pada tingkat kesulitan soal yang diberikan.

Kritik laiun terhadap CTT menunjukkan bahwa relibilitas yang didapatkan pun berdasar asumsi bahwa ujian dan orang yang mengerjakannya dianggap tepat; faktanya kecondongan data empiris yang didapat dianggap normal saat penghitungan koefisien relibilitas. Lebih jauh lagi kritik dari Schumaker (dalam Alagumalai et al., 2005, p. 11) menunjukkan bahwa koefisien reliabilitas dalam CTT “do not always behave as expected because of sample dependency, non-linear raw scores, a restriction in the range of scores, offsetting negative and positive inter-item correlations, and the scoring rubric“.


2 Comments

  1. rizaldi says:

    teori tes klasik, masih dipake hingga saat ini

    • deceng says:

      iyah memang masih dipake dengan berbagai keterbatasannya🙂
      Namun bila menginginkan analisis yang lebih tepat, maka mungkin akan diragukan hasilnya😀

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

%d bloggers like this: