- pengukuran yang menggunakan tes yang dibuat guru
- pengukuran yang menggunakan tes standar. Bentuk tes yang dibuat guru di kelas tentunya berbeda dengan bentuk tes standar.
Bentuk tes yang dibuat guru bisa sangat bervariasi, misalnya tes tertulis, tes lisan, tes kinerja, sikap dan pengukurannya lebih menekankan untuk mendapatkan informasi proses pembelajaran siswa dari hari ke hari.
Sedangkan bentuk tes standar, soal dan penskorannya harus lebih objektif dan mudah dilakukan sehingga pada umumnya hanya menggunakan satu jenis penilaian saja yaitu tes tertulis, Kususnya bentuk soal pilihan ganda. Hal ini disebabkan tes standar digunakan untuk keperluan yang lebih luas dan umum, misalnya tes untuk bisa masuk ke jenjang pendidikan berikutnya, tes untuk melihat daya serap siswa, tes pemantauan mutu siswa, dsb. Selain itu hasil dari tes
- menentukan tujuan tes;
- menentukan acuan yang akan dipakai oleh tes (criteria atau norma);
- membuat kisi-kisi;
- memilih soal-soal dari kumpulan soal yang sudah ada sesuai dengan kisi-kisinya.
Apabila soal yang diambil merupakan soal baru, maka soal-soal tersebut harus melalui tahap telaah secara kualitatif, revisi, uji coba, analisis hasil ujicoba sehingga diperoleh soal yang baik dari segi kualitatif maupun kuantitatif. Selain itu peng administrasian tes (pelaksanaan tes) juga dibuat standar.
Untuk tes prestasi belajar terstandar soal-soal harus mengacu pada tujuan pembelajaran yang harus dicapai siswa, dalam hal ini kurikulum atau SKL (Standar Kompetensi Lulusan) yang sudah ditetapkan apabila tes tersebut akan digunakan untuk kelulusan, dan proses penskorannya juga harus dilakukan secara standar terutama apabila ada soal berbentuk uraian, sehingga hasil dari tes tersebut dapat dilihat keterbandingannya.
Untuk membuat tes prestasi belajar terstandar yang dapat digunakan setiap saat, dibutuhkan butir-butir soal cukup banyak. Kebutuhan butir-butir soal yang bagus dan banyak ini bisa diatasi apabila ada bank soal yang menyimpan soal-soal tersebut. Bank soal adalah kumpulan soal-soal dalam jumlah yang besar, dan mengukur pengetahuan yang sama, disimpan di dalam komputer bersama dengan karakteristik setiap butir soalnya. Bank soal ini perlu dibuat dan harus selalu dikembangkan karena:
- dapat menyiapkan tes yang dibutuhkan secara rutin dan lebih dari satu set;
- memungkinkan diterapkannya tes melalui komputer (computer adaptive test–cat), sehingga setiap saat peserta tes dapat mengikuti tes kapan saja;
- kualitas tes dapat dipertanggung jawabkan.
Sebuah tes yang baik sebagaimana disampaikan oleh Syaifuddin Azwar (2006 : 2) harus memiliki beberapa kriteria antara lain valid, reliable, standar, ekonomis dan praktis.
Dalam Standards for Educational and Psychological Testing validitas adalah "... the degree to which evidence and theory support the interpretation of test scores entailed by proposed uses of tests " (1999: 9). Sebuah tes dikatakan valid jika ia memang mengukur apa yang seharusnya diukur (Allen & Yen, 1979: 95). Djemari Mardapi (2004: 25) menyatakan bahwa validitas adalah ukuran seberapa cermat suatu tes melakukan fungsi ukurnya. Menurut Nitko & Brookhart (2007: 38) kevalidan sebuah alat ukur tergantung pada bagaimana hasil tes tersebut diinterpretasikan dan digunakan.
Dalam pandangan Samuel Messick (1989: 13) validitas merupakan penilaian menyeluruh dimana bukti empiris dan logika teori mendukung pengambilan keputusan serta tindakan berdasarkan skor tes atau model-model penilaian yang lain. Jika dikaitkan dengan bidang psikologi, penggunaan validitas dapat dijumpai dalam tiga konteks yaitu validitas penelitian, validitas soal dan validitas alat ukur.
Validitas penelitian merupakan derajad kesesuaian hasil penelitian dengan keadaan sebenarnya. Validitas soal berkaitan dengan kesesuaian antara suatu soal dengan soal lain. Sedangkan validitas alat ukur merujuk pada kecermatan ukurnya suatu tes (Sumadi Suryabrata, 2004: 40).
Menurut Allen & Yen (1979: 95) validitas tes dapat dibagi kedalam tiga kelompok utama yaitu :
- validitas isi (content validity),
- validitas konstruk (construct validity)
- validitas kriteria (criterion related validity).
Meskipun idealnya validasi dapat dilakukan dengan memakai semua bentuk validitas tes tersebut, tetapi pengembang tes dapat memilih bentuk validasi dengan melihat tujuan pengembangan tes (Kumaidi, 1994: 58).
1. Validitas isi
Validitas isi menunjuk pada sejauhmana isi perangkat soal tersebut mengukur apa yang seharusnya diukur.
Dalam kaitannya dengan kegiatan pembelajaran menurut Djemari Mardapi (1996: 22) validitas isi adalah kesesuaian antara materi ujian dan materi yang telah dipelajari. Pengujian validitas isi tidak melalui analisis statistik melainkan analisis rasional yaitu dengan melihat apakah butir-butirnya telah sesuai dengan batasan domain ukur yang telah ditetapkan sebelumnya
Allen & Yen (1979: 95) membagi validitas isi kedalam dua kelompok yaitu
- face validity (validitas muka)
- logical validity (validitas logis).
- Validitas muka
Validitas muka dapat dicapai jika tampilan tes tersebut telah meyakinkan untuk mengungkap atribut yang hendak diukur.
- Adapun validitas logis
menunjukkan sejauhmana isi tes mengungkapkan representasi dari ciri-ciri atribut yang hendak diukur.
2. Validitas konstruk
Merujuk pada sejauh mana suatu tes mengukur suatu konstruk teoretik atau trait yang hendak diukurnya (Allen & Yen, 1979: 108)
Konstruk dalam pengertian ini adalah berkaitan dengan aspek-aspek psikologi seseorang khususnya aspek kognitif, afektif dan psikomotor.Ada beberapa cara yang bisa digunakan untuk menguji validitas konstruk. Misalnya dengan melakukan pencocokan antara aspek-aspek berpikir yang terkandung dalam tes hasil belajar dengan aspek-aspek berpikir yang hendak diungkap oleh tujuan instruksional khusus.
Kesahihan alat ukur dilihat dari sejauhmana hasil pengukuran tersebut sama dengan hasil pengukuran alat lain yang dijadikan kriteria.
Biasanya, dalam pengukuran psikologis, yang dijadikan kriteria, adalah hasil pengukuran lain yang telah dianggap sebagai alat ukur yang baik misalnya tes Stanford Binnet atau tes Weschler.
Validitas kriteria dibedakan menjadi dua macam yaitu
- jika dimanfaatkan dalam waktu dekat maka disebut validitas konkurent (concurrent validity)
- jika dimanfaatkan diwaktu yang akan datang disebut validitas prediktif (predictive validity).
Untuk memperoleh validitas kriteria, diperlukan pengujian dengan menggunakan korelasi. Validitas kriteria ditunjukkan dengan angka korelasi antara skor pada alat yang dipergunakan dengan skor yang dihasilkan dari alat yang dijadikan kriteria. Tetapi dalam ujian masuk perguruan tinggi misalnya, koefisien validitas ditunjukkan dengan skor pada saat ujian masuk dengan skor yang diperoleh pada saat seseorang telah belajar selama beberapa waktu tertentu.
Menurut Sumadi Suryabrata, (2004: 46) dalam menafsirkan koefisien validitas yang didapat dari mengkorelasikan skor alat ukur dengan kriterianya sebaiknya dilakukan melalui koefisien determinasi yaitu koefisien korelasi kuadrat. Jadi jika diperoleh koefisien korelasi sebesar 0,5, maka koefisien determinasinya adalah sebesar 0,25. semakin tinggi angka koefisien determinasi, maka semakin tinggi pula kecermatan prediksinya.
Soetarlinah Sukadji menyatakan bahwa reliabilitas suatu tes adalah seberapa besar derajat tes mengukur secara konsisten sasaran yang diukur. Reliabilitas dinyatakan dalam bentuk angka, biasanya sebagai koefisien. Koefisien tinggi berarti reliabilitas tinggi.
Reliabilitas tes dapat dibagi menjadi :
1. Reliabilitas Tes Re-Tes
Adalah seberapa besar derajat skor tes konsisten dari waktu ke waktu. Reliabilitas diukur dengan menentukan hubungan antara skor hasil penyajian tes yang sama kepada kelompok yang sama, pada waktu yang berbeda.
- Reliabiltas Belah-Dua
Reliabiltas ini diukur dengan menentukan hubungan antara skor dua paruh yang ekuivalen suatu tes, ang disajikan kepada seluruh kelompok pada suatu saat. Karena reliabilitas belah dua mewakili reliabilitas hanya separuh tes yang sebenarnya, rumus Spearman-Brown dapat digunakan untuk mengoreksi koefisien yang didapat.
- Reliabilitas Rasional Ekuivalen
Reliabilitas ini tidak ditentukan menggunakan korelasi tetapi menggunakan estimasi konsistensi internal. Reliabilitas ini diukur menggunakan Kuder-Richardson, biasanya Formula-20 (KR-20) atau Formula-21 (KR-21). Kedua rumus ini hanya dapat dipakai untuk tes yang aitem-aitemnya diskor dikotomi, yaitu benar atau salah, 0 atau 1.
- Reliabilitas Penyekor/Penilai
Adalah reliabilitas dua (atau lebih) penyekor independen. Reliabilitas ini biasa ditentukan menggunakan teknik korelasi, tetapi juga dapat hanya dinyatakan dalam persentase kesepakatan.
Didik Widiawan Sukmadi
SMA Negeri 2 Solo
Jawa Tengah
0 komentar:
Posting Komentar