 |
| image source:http://e-learning-teknologi.blogspot.co.id |
A. Pendahuluan
Evaluasi adalah suatu proses merencanakan, memperoleh dan menyediakan informasi yang sangat diperlukan untuk membuat alternatif-alternatif keputusan. Sesuai dengan pengertian tersebut maka setiap kegiatan evaluasi atau penilaian merupakan suatu proses yang sengaja direncanakan untuk memperoleh informasi atau data. Berdasarkan data tersebut kemudian dicoba membuat suatu keputusan. Sudah barang tentu informasi atau data yang dikumpulkan itu haruslah data yang sesuai dan mendukung tujuan evaluasi yang direncanakan.
Dalam hubungan dengan kegiatan pengajaran, evaluasi adalah suatu proses yang sistematis untuk menentukan atau membuat keputusan sampai sejauh mana tujuan-tujuan pengajaran telah dicapai ssiwa.
Dengan kata-kata yang berbeda evaluasi pendidikan ialah penaksiran terhadap pertumbuhan dan kemajuan siswa ke arah tujuan-tujuan atau nilai-nilai yang telah ditetapkan di dalam kurikulum.
Dalam dunia pendidikan pasti dilakukan suatu evaluasi, salah satunya dengan cara tes dikumpulkan dan kemudian dilakukan penilaian dan pemberian skor. Penilaian yang meliputi pengertian penyekoran dan penilaian, perbedaan menyekor dan menilai serta langkah-langkah melakukan penilaian.
B. Pengertian Menskor
Pemberian skor (scoring) merupakan langkah pertama dalam proses pengolahan hasil test, yaitu proses pengubahan jawaban-jawaban soal test menjadi angka-angka. Dengan kata lain, pemberian skor itu merupakan tindakan kuantitatif terhadap jawaban-jawaban yang diberikan oleh tester dalam suatu test hasil belajar. Angka-angka hasil penskoran tersebut selanjutnya diubah menjadi nilai-nilai (grade) melalui proses tertentu. Penggunaan simbol untuk menyatakan nilai-nilai hasil test itu ada yang tertuang dalam bentuk rentangan angka antara 0-10, antara 0-100 dan adapula yang menggunakan simbol huruf yaitu A, B, C, D dan F (F = Fail, gagal).
Cara menskor hasil test biasanya disesuaikan dengan bentuk soal-soal test yang dipergunakan. Apakah test itu objektif atau non objektif (isian). Untuk soal-soal objektif biasanya setiap jawaban yang benar diberi skor 1 (satu) dan setiap jawaban yang salah diberi skor 0 (nol). Total skor diperoleh dari semua soal. Untuk soal-soal non objektif (essay) dalam penskoran biasanya digunakan cara pemberian bobot (weighting) kepada setiap soal menurut tingkat kesukuannya atau banyak-sedikitnya unsur tingkat kesukarannya atau banyak-sedikitnya unsur terdapat dalam jawaban yang dianggap paling benar. Misal soal no.1 diberi skor maksimum 4, untuk soal no.3 diberi skor maksimum 6, untuk soal no.5 skor maksimum 10, dan seterusnya. Dalam pekerjaan menskor atau menentukan angka dapat digunakan 3 macam alat bantu: 1. Pembantu menentukan jawaban yang benar disebut kunci jawaban
2. Pembantu menyeleksi jawaban yang benar dan yang salah disebut kunci skoring
3. Pembantu menskor tes objektif.
4.
C. Teknik menskor tes objektif
1. Fill-in dan completion (tes isian dan melengkapi)
Cara menilai tes bentuk ini ada dua pendapat, yang pertama mengatakan bahwa skor maksimum setiap bentuk fill-in sama dengan jumlah isian yang ada pada test tersebut. Jika pada suatu test bentuk fill-in ada 10 item, dan setiap item berisi satu isian, dua isian atau tiga isian, maka cara menilainya dihitung menurut jumlah isian yang ada pada seluruh item.
Pendapat kedua mengatakan bahwa skor maksimum test berbentuk fill-in dihitung menurut jumlah itemnya. Tiap item dinilai satu, meskipun mungkin jumlah isiannya tidak sama banyaknya.
Pemakalah berpendapat bahwa yang lebih baik adalah pendapat yang pertama, karena evaluasi yang demikian lebih halus dan lebih adil.
Rumus penskoran untuk fill-in dan completion adalah sebagai berikut:
S = R
S : Skor terakhir / yang diharapkan
R : Jumlah isian yang dijawab betul (right)
Contoh penggunaan :
Misalnya sebuah test berbentuk fill-in mengandung 30 isian, Ahmad mengerjakan test tersebut 23 isian betul, 3 isian salah, dan 2 isian kosong (tidak dijawab). Maka skor Ahmad : 23 (tiap isian diberi nilai 1).
2. True-False (tes benar-salah)
Setiap item tes bentuk true false diberi skor maksimum 1 (satu). Jadi apabila suatu item dijawab betul (sesuai dengan kunci jawaban), maka skornya adalah 1 (satu). Akan tetapi, jika dijawab salah (tidak sesuai dengan kunci jawaban), maka skornya 0 (nol).
Untuk menghitung skor akhir dari seluruh item test bentuk true false biasanya digunakan rumus sebagai berikut :
S = Skor terakhir / yang diharapkan
R = Jumlah item yang dijawab betul (right)
W = Jumlah item yang dijawab salah (wrong)
N = Banyaknya option untuk true false selalu dua
1 = Bilangan tetap (konstanta)
Keterangan penggunaan :
Umpamakan jumlah item true-false (B-S) = 20. Seorang siswa bernama Ali dapat menjawab betul 13 item dan salah 7 item, maka skor yang diperoleh Ali adalah sebagai berikut :
Aman dapat menjawab betul 10 item, dan salah 10 item. Skor yang diperoleh sebagai berikut :
Bakir hanya dapat menjawab 8 item betul dan 12 item salah, maka skor yang diperoleh Bakir ialah :
Dengan menggunakan rumus tersebut ternyata bahwa siswa yang hanya dapat menjawab betul setengah dari jumlah item akan mendapatkan skor 0 (nol). Dan siswa yang menjawab betul kurang dari setengah akan mendapatkan skor minus.
3. Multiple choice (tes pilihan ganda)
Cara menskor terakhir dari tes yang berbentuk multiple choice dipergunakan rumus sebagai berikut :
Contoh penggunaan :
Umpamakan kita membuat test berbentuk multiple choice sebanyak 20 item, dengan item alternatif jawaban (A, B, C, D) 4 tiap item. Seorang siswa bernama Ipung dapat menjawab betul 14 item dan salah 6 item, maka skor yang diperoleh Ipung dari test tersebut sebagai berikut :
Jika dalam mengerjakan tes berbentuk true false / multiple choice terdapat item yang tidak dijawab (dikosongkan) maka dalam penilaian atau scoring, item yang tidak dijawab itu tidak diperhitungkan (tidak dianggap benar dan tidak dianggap salah).
Sebagai contoh :
a. True false
Jumlah 30 item
Dijawab betul 19 item
Dijawab salah 8 item
Tidak dijawab 3 item
Skor yang diperoleh :
Jadi, yang diperhatikan dalam scoring hanya 27 item.
b. Multiple choice
Jumlah 20 item
Yang dijawab betul 16 item
Yang dijawab salah 3 item
Tidak dijawab 1 item
Skor yang diperoleh :
Akan tetapi ada juga yang berpendapat lain, yaitu semua item yang tidak dijawab (dikosongkan) berarti salah. Jadi, baik item yang dijawab, tetapi salah maupun item yang dikosongkan atau tidak dijawab kedua-duanya dianggap salah. Tentu saja hal ini bergantung pada perjanjian antara pengetes dengan yang di tes. Maka sebelum tes dimulai sebaiknya guru menjelaskan terlebih dahulu bagaimana cara menskor, dan bagaimana siswa menjadi lebih hati-hati dalam mengerjakan test.
4. Matching (test menjodohkan)
Untuk menilai tes yang berbentuk matching diperhitungkan dari jumlah item yang dijawab betul saja, rumusnya sama dengan completion, yaitu :
S = R
Contoh penggunaan :
Misalnya berbentuk matching sebanyak 10 item. Hari dapat mengerjakan test tersebut 7 item betul dan 3 item salah, maka skor yang diperoleh Hari = 10 – 3 = 7
Mira dapat mengerjakan 5 item betul, 3 item salah, 2 item dikosongkan atau tidak dijawab, maka skor yang diperoleh Mira = 5.
Jadi, dengan rumus penskoran tersebut di atas, item yang di jawab salah dan item yang tidak dijawab atau dikosongkan, kedua-duanya dianggap salah karena yang diperhitungkan hanya item yang dijawab betul.
5. Jawaban singkat
Dengan bentuk jawaban singkat menuntut siswa untuk menemukan sendiri jawaban singkat atas pernyataan dalam soal test. Test bentuk ini tidak memberikan peluang untuk menebak jawaban dari kemungkinan jawaban yang tersedia seperti pada bentuk pilihan. Dengan demikian sistem koreksi untuk faktor tebakan pun tidak dikenakan pada test bentuk ini. Dengan bentuknya yang sangat berbeda dari bentuk pilihan, maka cara penskorannya pun tidak seperti bentuk pilihan, yang perlu disiapkan untuk skoring test bentuk jawaban singkat hanyalah lembaran tidak dapat dibuat kunci skoring.
Lembaran kunci jawaban memuat semua kemungkinan jawaban yang dapat dibenarkan atas pernyataan sebuah soal. Apabila terdapat soal sebagai berikut:
Apabila hasil test membentuk kurva juling negatif berarti soal-soal tes itu …………
Butir soal semacam ini mengundang banyak kemungkinan jawaban yang dapat diterima karena memang benar.
Jawaban atas soal tersebut misalnya :
a. Mudah
b. Gampang
c. Sukar
d. Tingkat kesukaran rendah
e. Indeks kesukaran diatas 0.85
f. Dan mungkin ada yang lain lagi.
Untuk soal-soal hitungan lebih banyak lagi kemungkinan, tanpa pembatasan yang tegas, yang harus diterima sebagai jawaban yang benar. Contoh :
Jawabannya dapat : 3.33, 3.3, 31/3, 32/6, 33/9 dan seterusnya.
Meskipun jawaban yang diminta dalam test bentuk ini adalah jawaban yang singkat, terdapat variasi jawaban siswa mulai dari yang lengkap sampai dengan yang kurang lengkap, namun masih menunjukkan bahwa siswa mempunyai sedikit pengetahuan mengenai materi yang dinyatakan itu. Oleh karena itu kemungkinan-kemungkinan jawabannya perlu diberikan pembobotan. Misalnya dengan pembandingan 3 : 2 : 1 atau 4 : 3 : 2 : 1 atau langsung saja diberi tingkatan skor 2 yang lengkap sekali, 1.5 yang lengkap dan yang kurang lengkap 1. D. Teknik menskor test non objektif (essay)
Soal-soal bentuk uraian jika direncanakan dengan baik, sangat tepat untuk menilai proses berfikir seseorang serta kemampuannya mengekspresikan buah pikiran, kelemahan yang sering dirasakan penggunaan soal-soal bentuk uraian ini antara lain terbatasnya lingkup bahan pelajaran yang dinilai dan sulitnya mengoreksi jawaban dengan objektif. Adapun teknik menskor soal-soal non objektif (essay) adalah sebagai berikut :
1. Nilailah jawaban-jawaban soal essay dalam hubungannya dengan hasil belajar yang sedang diukur.
2. Untuk soal-soal isian dengan jawaban terbatas (restricted-response questions) berilah jawaban skor dengan point method gunakan pedoman jawaban sebagai petunjuk. Tulislah lebih dahulu pedoman jawabannya untuk tiap soal, dan tentukan nilai skor yang dikenakan pada tiap soal atau bagian soal (dengan weighting atau pembobotan).
3. Untuk soal-soal isian dengan jawaban terbuka, nilailah dengan rating method, gunakan kriteria tertentu sebagai pedoman penilaian.
4. Soal-soal essay menurut jawaban yang terbuka dan bebas sehingga seringkali tidak mungkin untuk menyiapkan pedoman jawabannya. Oleh karena itu, biasanya guru atau pembuat test menilai tiap jawaban dengan menimbang-nimbang kualitasnya dan hubungannya dengan kriteria yang telah ditetapkan sebelumnya. Jadi bukan menskor point demi point dengan kunci jawaban, untuk itu bisa dilakukan dengan mengklasifikasikan jawaban-jawaban itu ke dalam 5 tingkat, yang selanjutnya diberi nilai 0, 1, 2, 3, 4 atau A, B, C, D dan E.
5. Evaluasilah semua jawaban siswa, soal demi soal dan bukan siswa demi siswa. Dengan demikian dapat dihindarkan terjadinya halo effect.
6. Evaluasilah jawaban-jawaban soal essay tanpa mengetahui identitas atau nama murid yang mengerjakan jawaban itu.
7. Bilamana mungkin, mintalah dua atau tiga orang guru lain, yang mengetahui masalah itu untuk menilai tiap jawaban, ini diperlukan untuk mengecek keandalan skoring terhadap jawaban-jawaban essay itu. Tentu hal ini tidak perlu dilakukan pada setiap penilaian, tetapi sewaktu-waktu saja. Misalnya untuk memilih siswa-siswi yang akan dicalonkan untuk mengikuti latihan tertentu atau untuk memilih juara sekolah.
E. Pengertian Menilai
Sesuai memeriksa hasil tes dan menghitung jumlah jawaban benar untuk menentukan skornya, maka langkah berikut adalah menetapkan nilai untuk pencapaian belajar ssiwa seperti yang dicerminkan oleh skor itu. Kalimat ini menunjukkan bahwa skor dan nilai mempunyai pengertian yang berbeda.
Skor (scoreatau mark) adalah angka yang menunjukkan jumlah jawaban yang benar dari sejumlah butir soal yang membentuk tes. Dengan demikian, apabila jumlah soal yang benar ada 25, maka skor untuk siswa tersebut adalah juga 25, terlepas dari berapa jumlah soal yang membentuk tes itu. Jadi, biarpun jumlah soal dalam tes itu 30, 40, 50, 75, atau 100 sekalipun, siswa tersebut tetap mendapat skor 25. Pemberian angka skor itu sebagai angka nilai tersebut tidak tepat. Skor 25 dari 30 butir soal berbeda nilai daripada skor 25 pada tes dengan 50 butir soal, apalagi pada tes dengan 100 butir soal. Pada tes dengan 30 buir soal, skor 25 menempatkan siwa itu pada kelompok yang berhasil mencapai 83% tujuan instruksional yang diukur dengna tes tersebut. Tetapi skor 25 yang diperoleh dari tes dengan 50 butir soal, tingkat pencapaian tujuan instruksional hanya sebenar 50%, dan hanya sebesar 25% pada tes dengan 100 butir soal.
Angka-angka persentase itu diperoleh dengan jalan membagi jumlah skor dengan jumlah butir soal dalam seluruh tes dan dikalikan dengan 100%. Angka-angka persentase ini menunjukkan nilai skor tersebut dalam kaitan dengan seluruh tes yang disajikan Nilai (grade), dengan demikian, adalah angka yang menunjukkan tingkat pencapaian tujuan instruksional yang dicantumkan daam keseluruhan tes. Misalnya, nlai pencapaian tujuan instruksional ditetapkan antara 0 dan 100, maka angka-angka persentase tersebut di atas harus dikalikan dengan nilai maksimal yang ditetapkan itu, yakni 100 sehingga diperoleh 83, 50 atau 25 masing-masing untuk tes dengan jumlah butir soal 30, 50 dan 100. Apabila nilai tertinggi ditetapkan 10, maka angka persentase tersebut perlu dikalikan dengan 10 sehingga diperoleh nilai 8,3 untuk tes dengan 30 butir soal, atau 5 dan 2,5 untuk masing-masing tes dengan 30 butir soal, atau 5 dan 2,5 untuk masing-masing tes dengan jumlah soal 50 dan 100 butir. Semua nilai semacam ini disebut juga skor jabaran (derived scores). F. Perbedaan Mensekor dan Menilai
Skor adalah hasil pekerjaan menyekor (sama dengan memberikan angka yang diperoleh dengan jalan menjumlahkan angka-angka bagi setiap butir item yang oleh testee telah dijawab denganbetul, dengan ,memperhitungkan bobot jawaban betulnya. Adapun yang dimaksud nilai adalah angka (bisa juga huruf), yang merupakan hasil ubahan dari skor yang sudah dijadikan satu dengan skor-skor lainnya, serta disesuaikan pengaturannya dengan standar tertentu. Itulah sebabnya mengapa nilai sering disebut skor standar (standard score).
Nilai pada dasarnya adalah angka/huruf yang melambangkan seberapa jauh/seberapa besar kemampuan yang telah ditujukan oleh testee terhadap materi atau bahan yang teskan, sesuai dengan tujuan instruksional khusus yang telah ditentukan. Perskoran berarti proses pengubahan prestasi menjadi angka-angka, sedangkan dalam penilaian kita memproses angka-angka hasil kuantifikasi prestasi itu dalam hubungannya dengan “kedudukan” personal siswa dan mahasiswa yang memperoleh angka-angka tersebut di dalam skala tertentu.
Dalam penskoran, perhatian utama ditujukam kepada kecermatan dan kemantapan, sedangkan dalam penilaian, perhatian terutama ditujukan kepada validitas dan kegunaan. G. Prinsip-perinsip Menilai
Untuk dapat melakukan pengukuran dan penilaian secara efektif diperlukan latihan dan penguasaan teori-teori yang relevan dengan tujuan dari proses-belajar-mengajar sebagai bagian yang tidak terlepas dari kegiatan pendidikan sebagai suatu sistem. Sehubungan dengan itu, dalam uraian berikut ini akan dibicarakan beberapa prinsip penilaian yang perlu diperhatikan sebagai dasar dalam pelaksanaan penilaian, sesudah itu akan dibicarakan pula tentang prosedur pemberian nilai.
Adapun beberapa prinsip penilain itu ialah sebagai berikut: 1. Penilaian hendaknya didasarkann atas hasil pengukuran yang komprehensif.
Hal ini berarti bahwa penilaian didasarkan atas sampel presasi yang cukup banyak, baik macamnya maupun jenisnya. Untuk itu dituntut pelaksanaan penilaian secara sinambung dan penggunaan bermacam-macam teknik pengukuran .
2. Harus dibedakan antara peskoran (scoring) dan penilaian (grading).
Hal ini telah dibicarakan dalam uraian terdahulu. Penskoran berarti proses pengubahan prestasi menjadi angka-angka, sedangkan dalam penilaian kita memproses angka-angka hasil kualifikasi prestasi itu dalam hubungannya dengan “kedudukan” personal siswa dan mahasiswa yang memperoleh angka-angka tersebut di dalam skala tertentu, misalnya skala tentang baik-buruk, bisa diterima-tidak bisa diterima, dinyatakan lulus-tidak lulus.
Dalam penskoran, perhatian terutama ditujukan kepada kecermatan dan kemantapan (accuracy dan reliability); sedangkan dalam penilaian, perhatian tertutama ditujukan kepada validitas dan kegunaan (validity dan utility).
3. Dalam proses pemberian nilai hendaknya diperhatikan adanya dua macam orientasi,
Penilaian yang norms-referenced dan yang criterion-referenced. Norm-referenced evaluation adalah penilaian yang diorientasikan kepada suatu kelompok tertentu; jadi, hasil evaluasi perseorangan siswa atau mahasiswa dibandingkan dengan prestasi kelompoknya. Prestasi kelompoknya itulah yang dijadikan patokan atau norm dalam menilai siswa atau mahasiswa secara perseorangan. Penilaian norm-referenced selalu bersifat kompetitif intrakelompok. Criterion-referenced evaluation ialah penilaian yang diorientasikan kepada suatu standar absolut, tanpa dihubungkan dengan suatu kelompok tertentu.
4. Kegiatan pemberian nilai hendaknya merupakan bagian integral dari proses belajar-mengajar.
Ini berarti bahwa tujuan penilaian, di samping untuk mengetahui status siswa dan menaksir kemampuan belajar serta penguasaannya terhadap bahan pelajaran, juga digunakan sebagai feedbacak (umpan balik), baik kepada siswa sendiri maupun bagi guru atau pengajar.
5. Penilaian harus bersifat komparabel.
Artinya setelah tahap pengukuran yang menghasilkan angka-angka itu dilaksanakan, prestasi-prestasi yang menduduki skor yang sama harus memperoleh nilai yang sama pula.
6. Sistem penilaian yang dipergunakan hendaknya jelas bagi siswa dan bagi pengajar sendiri.
Sumber ketidakberesan dalam penilaian terutama adalah tidak jelasnya sistem penilaian itu sendiri bagi para guru atau pengajar; apa yang dinilai serta macam skala penilaian yang dipergunakan dan makna masing-masing skala itu. Apapun skala yang dipakai dalam penilaian, apakah skala 0-4 atau A, B, C, D, dan F (TL), hendaknya benar-benar apa isi dan maknanya.
H. Langkah-langkah Menilai
Untuk dapat melakukan penilaian terhadap hasil belajar siswa dengan baik, perlu kita kajij beberapa prosedur penilaian dari yang sangat sederhana dan mengandung banyak kelemahan sampai kepada yang lebih rumit dan sophiticated. Dengan pengkajian ini diharapkan kita dapat memahami kelemahan-kelamahan maupun kebaikan yang terkandung di dalam setiap prosedur penilaian.
Prosedur penilaian yang paling sederhana, atau mungkin juga dapat dikatakan paling tua dan banyak dilakukan di lembaga-lembaga pendidikan kita, ialah prosedur yang tidak membedakan dengan jelas adanya dua fase, yaitu fase pengukuran dan penilaian. Prosedur ini mengandung lebih banyak kelemahan dari pada kebaikan. Dalam pelaksanaannya sering dikacaukan antara penskoran dan penilaian, atau lebih lazim lagi angka atau kor yang sebenarnya merupakan “biji”, langsung dianggap sebagai nilai, yang kemudian dipergunakan sebagai alat untuk menentukan vonnis kepada siswa atau mahasiswa yang memperoleh “biji” tersebut.
Prosedur ini dan berikutnya adalah prosedur yang telah memisahkan fase pengukuran da fase penilaian dengan berbagai variasi, mulai dari yang relatif sederhana sampai dengan yang lebih rumit dan sophisticated.
Yang pertama ialah prosedur penilaian dengan membuat peringkat skor-skor dalam bentuk tabel-tabel distribusi (untuk lebih jelasnya, periksalah tabel-yabel dalam lampiran) dengan membuat rentangan skor teoritis dari O s.d. N (dalam buku lain disebut juga rentangan skor ideal). Jika kemudian skor-skor yang diperoleh siswa (skor aktual) dimasukkan ke dalam rentangan skor teoritis itu, maka rentangan dan distribusi frekuensinya sehingga sekaligus kita dapat melihat apakah tes itu terlalu mudah, terlalu sukar, atau sedang bagi kelompok siswa yang bersangkutan. Dari pemeriksaan secara visual demikian itulah penilaian dapat menetapkan batas-batas penilaian (baca: skala penilaian) sesuai dengan distribusi kelompok skor yang terlukis di dalam tabel. Dalam hal ini, peran guru atau penilai dituntut tanggung jawab profesionalnya dalam mnentukan batas persyaratan penguasaan minimal dari hasil tes yang telah ditabulasikan itu.
Prosedur penilaian dengan menggunakan persentase (%) banyak digunakan karena dianggap lebih sederhana dan praktis. Penilaian dengan presentase ini umumnya dikaitkan dengan skala penilaian 0-10 atau 0-100, dengan langsung mentransformasikan persentase yang dimaksud menjadi nilai. Misalnya 50% benar sama dengan nilai 5 (dalam skala penilaian 0-10) atau 50 (dalam skala penilaian 0-100); 78% benar sama dengan nilai 8 (dalam skala penilaian 0-10) atau 78 (dalam skala penilaian 0-100).
Prosedur yang menggunakan teknik statistik yang lebih kompleks, yaitu yang dinamakan prosedur perstandardisasian dan penormalisasian. Dikatakan perstandardisasian karena dalam mentranspormasikan skor-skor hasil pengukuran suatu kelompok siswa menggunakan rentangan yang disebut deviasi standar, yaitu penyimpangan rata-rata yang dihitung dari nilai titik tengah kelompok yang disebut mean atau rata-rata hitung (arithmetic mean)
DAFTAR PUSTAKA
No comments:
💬 Tinggalkan Komentar Anda
Kami sangat senang dengan pendapat, pertanyaan, atau pengalaman Anda. Mari kita berdiskusi bersama di kolom komentar ini ⬇️