evaluasi pendidikan: PENGEMBANGAN INSTRUMEN EVALUASI DOMAIN AFEKTIF

A. PENDAHULUAN
Pembelajaran merupakan perubahan dalam diri seseorang yang merupakan hasil pengalaman. Perubahan pada seseorang tersebut dapat dilihat pada aspek behavioral dan kognitif. Para ahli psikologi behavioral seperti: J.B. Watson, E.L. Thorndike dan B.F. Skinner menegaskan bahwa pembelajaran merupakan perubahan perilaku, yang dengannya seseorang bertindak dalam satu situasi tertentu. Sebaliknya, para psikolog kognitif seperti Jean Piaget, Robert Claser, John Anderson, dan David Ausumbel mengatakan bahwa pembelajaran merupakan proses internal yang tidak dapat diobservasi secara langsung. Menurut pandangan kognitif pembelajaran merupakan perubahan dalam kemampuan seseorang untuk merespons satu situasi tertentu[2].
Terdapat bermacam-macam model disain pembelajaran, misalnya model yang dikembangkan oleh Winarno Surakhmad, Winkel, Hisyam Zaini dkk., Briggs dan Wager, Gerlach dan Ely, Kemp[3]. Dari model-model disain tersebut komponen dan polanya antara yang satu dengan lainnya terdapat perbedaan. Meskipun demikian dari berbagai disain pembelajaran tersebut terdapat komponen-komponen yang termasuk komponen pokok yaitu: tujuan, materi, strategi, media dan evaluasi. Tujuan[4] adalah sesuatu yang ingin dicapai, materi adalah bahan yang dipelajari siswa atau diajarkan guru kepada siswa, strategi adalah langkah-langkah yang ditempuh siswa dan / atau guru dalam mempelajari (guru = mengajarkan) materi pelajaran untuk mencapai tujuan, media adalah sarana untuk memudahkan pencapaian tujuan, dan evaluasi adalah proses untuk mengetahui pencapaian hasil dan efektivitas pembelajaran. Dengan demikian evaluasi merupakan salah satu komponen pokok yang selalu ada dalam pembelajaran. Dengan kata lain. sebuah pembelajaran tidak dapat dipisahkan dengan kegiatan evaluasi.
Secara umum evaluasi memiliki dua fungsi utama yaitu untuk mengetahui pencapaian hasil belajar siswa dan hasil mengajar guru[5]. Pengetahuan tentang hasil belajar siswa terkait dengan sejauh mana siswa telah mencapai tujuan pembelajaran atau kompetensi-kompetensi yang telah ditetapkan. Sedangkan hasil mengajar guru terkait dengan sejauh mana guru sebagai manajer belajar siswa[6] dalam hal merencanakan, mengelola, memimpin dan mengevaluasi.
Pencapaian hasil belajar dan mengajar terkait erat dengan pencapaian tujuan pembelajaran, dan pencapaian tujuan pembelajaran tidak terlepas dengan pencapaian tujuan pendidikan. Undang – undang RI nomor 20 tahun 2003 tentang Sistem Pendidikan Nasional mengamanatkan bahwa pendidikan nasional bertujuan untuk mengembangkan potensi peserta didik agar menjadi manusia yang beriman dan bertakwa kepada Tuhan Yang Maha Esa, berakhlak mulia, sehat, berilmu, cakap, kreatif, mandiri, dan menjadi warga negara yang demokratis serta bertanggung jawab[7]. Dengan mencermati tujuan tersebut maka pendidikan yang diselenggarakan di Indonesia, baik yang dikelola oleh pemerintah (berstatus negeri) maupun yang dikelola oleh masyarakat (berstatus swasta) mencakup tiga domain (ranah) yakni kognitif, afektif dan psikomotor. Domain kognitif ditunjukkan dengan kata berilmu, afektif ditunjukkan dengan kata beriman dan bertakwa, berakhlak mulia, mandiri, demokratis, bertanggungjawab, dan psikomotor ditunjukkan dengan kata sehat, cakap, dan kreatif. Dari segi klasifikasinya maka domain afektif memiliki cakupan yang lebih banyak (lima unsur) dibanding domain lainnya (cognitif dan psikomotor).
Dalam khasanah pendidikan Islam, M. Athiyah Al Abrosyi[8] mengatakan bahwa tujuan pendidikan Islam adalah membentuk manusia yang berpribadi manusia, serasi dan seimbang; tidak saja bidang keagamaan dan keilmuan melainkan juga bidang keterampilan. Namun demikian Al Abrosyi menekankan aspek pendidikan akhlak sebagai awal tujuan pendidikan Islam, hal ini disebabkan karena menurutnya akhlak merupakan kunci utama bagi keberhasilan manusia dalam menjalankan tugas kehidupan. Bahkan misi utama diutusnya Muhammad sebagai Rasul adalah untuk menyempurnakan akhlak ( Innama bu’isttu liutammima makaarima al-akhlaq ).
Dengan kutipan tujuan pendidikan di atas, maka tujuan pendidikan mencakup domain kognitif, afektif dan psikomotor. Ketiganya perlu dicapai secara komprehensif dan seimbang. Pencapaian tujuan domain kognitif akan menjadikan seseorang menjadi cerdas. Pencapaian tujuan domain afektif akan menjadikan seseorang menjadi berakhlak mulia, dan pencapaian tujuan psikomor akan menjadikan seseorang menjadi terampil.
Di sekolah-sekolah tingkat dasar (sekolah dasar dan madrasah ibtidaiyah) banyak dijumpai tiga kata yang ditulis secara besar yang merupakan cerminan ringkas dari ketiga domain / ranah tersebut yaitu: CERDAS, TAQWA dan TERAMPIL[9].
Dalam khazanah pendidikan, pembagian cakupan tujuan pendidikan menjadi tiga domain tersebut dipelopori dan dipopulerkan oleh Bloom dan kawan-kawan dengan mengistilahkan taxonomy tujuan pendidikan[10]. Oleh Bloom dan kawan-kawan taxonomy tersebut kemudian dijabarkan lagi ke dalam tingkatan-tingkatan / level pada masing-masing domain. Domain kognitif terdiri dari 6 level, ke enam level tersebut secara berturut (dari level terbawah); knowledge, comprehension, application, analysis, synthesis dan evaluation. Domain afektif terdiri dari 5 level yakni; receiving (attending), responding, valuing, organization, dan characterization by a value or value complex. Sementara domain psikomotor terdiri dari; persepsi, kesiapan, gerakan terbimbing, gerakan terbiasa, gerakan kompleks, penyesuaian pola gerakan, dan kreatifitas.
Dengan mengacu kepada klasifikasi tujuan pendidikan menjadi tiga domain tersebut (kognitif, afektif dan psikomotor) maka evaluasi pendidikan yang ideal (seharusnya) mencakup ketiga domain tersebut secara komprehensif. Realitas menunjukkan bahwa evaluasi belum dilaksanakan secara komprehensif karena masih didominasi pada evaluasi pada domain kognitif. Pengembangan secara parsial berakibat pada pencapaian tujuan yang parsial pula. Kesenjangan / gap antara evaluasi yang ideal dan realitas evaluasi dapat divisualisasikan sebagai berikut:
Realitas menunjukkan bahwa masih banyak yang mereduksi evaluasi sebagai kegiatan tes, hal ini dibuktikan dengan kegiatan evaluasi yang menonjol di lembaga dan satuan pendidikan adalah pelaksanaan tes yang dilaksanakan setelah penyelesaikan pokok bahasan tertentu (kompetensi dasar tertentu) sebagai tes formatif dan tes akhir semester yang dikenal dengan tes sumatif[11] serta tes yang diselenggarakan di akhir jenjang pendidikan tertentu dalam bentuk ujian akhir sekolah dan ujian nasional. Dari tes formatif, sumatif, hingga ujian akhir sekolah dan ujian nasional sebagian besar dalam bentuk tes, dan tes tersebut sebagian besar dalam bentuk tes tertulis. Padahal tes tertulis hanyalah salah satu bentuk tes (di samping tes lisan dan tindakan), dan tes hanyalah salah satu dari teknik evaluasi (di samping teknik non tes / alternative test).
Menggunakan teknis tes tertulis untuk mengukur pencapaian hasil belajar peserta didik yang mencakup berbagai domain / ranah ( kognitif, afektif dan psikomotor) sudah barang tentu tidak dapat memberikan informasi yang valid dan reliabel serta tidak selaras dengan prinsip kontinuitas, objektivitas, keseimbangan dan komprehensifitas sebuah evaluasi[12]. Tes tepat dipakai untuk mengukur pencapaian domain kognitif, tetapi tidak tepat untuk mengukur pencapaian ranah afektif. Padahal cakupan tujuan pendidikan, baik skala nasional, jenjang pendidikan, satuan pendidikan, bahkan hingga tujuan mata pelajaran (standar kompetensi mata pelajaran) meliputi domain kognitif, afektif dan psikomotor. Sehingga ironis memang sebuah proses pembelajaran yang panjang (3 sampai dengan 6 tahun), terkadang ditentukan oleh hasil tes tertulis yang dilaksanakan beberapa jam pada mata pelajaran tertentu[13]. Kesenjangan teknik evaluasi yang ideal dengan realitas teknik evaluasi tersebut dapat divisualisasikan sebagai berikut:
Pengembangan teknik evaluasi dengan tes telah banyak dilakukan oleh para ahli, hal ini dibuktikan dengan khazanah kepustakan evaluasi pendidikan didominasi dengan buku-buku yang mengupas pengembangan intrumen tes, seperti: Sumadi Suryabrata, Saifudin Azwar, Fernandes[14]. Bahkan buku-buku yang berjudul “evaluasi” ternyata sebagian besar membahas tentang pengembangan tes, dan hanya sebagian kecil saja membahas pengembangan non tes, seperti: Issac dan Michael dalam bukunya Handbook in Research and Evaluation[15], Mehren dan Lehmann dalam bukunya Measurement and Evaluation in Education and Psychology[16], Hopkin dan Antes dalam bukunya Classroom Measurement and Evaluation[17], Anas Sudijono, Nana Sudjana dan Ibrahim, Suharsimi Arikunto[18] dan masih banyak lagi (yang dapat dilihat dalam daftar pustaka). Sebagian besar buku-buku tersebut membahas tentang pengembangan tes, mulai dari perancangan, penyusunan, hingga analisis intrumen tes tersebut, meskipun judul dari buku-buku tersebut adalah evaluasi.
B. KONSEP DASAR EVALUASI
Istilah evaluasi berasal dari bahasa Inggris evaluation, yang berarti penilaian atau penaksiran. Penggunaan istilah evaluasi dalam dunia pendidikan sebenarnya dapat dikatakan masih relatif baru. Rice, tokoh yang dianggap sebagai pemula kegiatan evaluasi di Amerika Serikat pada awal abad ini, belum menggunakan istilah evaluasi, meskipun pekerjaannya dapat dikategorikan sebagai pekerjaan evaluasi. Tyler baru mempergunakan istilah evaluasi dalam buku kecilnya yang terkenal berjudul : Basic Principles of Curriculum and Instruction yang ditulis pada tahun 1949.
Tyler sebagaimana dikutip oleh Guba (1982) mendefinisikan evaluasi sebagai proses pembanding data empiris kinerja pembelajar dengan tujuan yang ditetapkan secara jelas/proses untuk menentukan sejauhmana tujuan telah direalisasikan. Sementara itu Morrison sebagaimana dikutip oleh Oemar Hamalik merumuskan pengertian evaluasi sebagai perbuatan pertimbangan berdasarkan seperangkat kriteria yang disepakati dan dapat dipertanggungjawabkan. Dari rumusan Morrison tersebut, terdapat tiga faktor utama dalam evaluasi, yaitu (1) pertimbangan (judgment), (2) deskripsi obyek penilaian dan (3) kritria yang dapat dipertanggungjawabkan[19].
Pertimbangan adalah pangkal dalam membuat keputusan. Membuat keputusan berarti menentukan derajad tertentu yang berkenaan dengan hasil evaluasi itu. Untuk membuat suatu keputusan tepat diperlukan informasi yang akurat dan relevan serta dapat dipercaya.
Deskripsi objek penilaian adalah penggambaran objek penilaian dengan seksama berdasarkan fakta dan data yang diperoleh dari penelitian. Untuk memperoleh deskripsi yang tepat diperlukan metode pengumpulan data yang tepat (valid). Sedangkan kriteria yang dapat dipertanggungjawabkan ialah ukuran-ukuran yang dibuat dan digunakan dalam menilai suatu objek.
Blaine R. Worhen dan James R. Sanders mendefinisikan evaluasi sebagai berikut; evaluation is the process of delineating obtaining, and providing useful information for judging decision alternatives[20]. Dari pengertian tersebut, dapat diketahui bahwa pada dasarnya tujuan akhir evaluasi adalah untuk memberikan bahan-bahan pertimbangan untuk menentukan/membuat kebijakan tertentu, yang diawali dengan suatu proses pengumpulan data yang sistematis. Pembuatan suatu keputusan berkaitan dengan berbagai bidang, seperti bidang pendidikan, psikologi, penelitian, program, kebijakan, dan sebagainya. Luasnya ruang lingkup pembuatan keputusan tersebut membawa perkembangan pada bidang-bidang kajian evaluasi. Dalam berbagai literature yang penulis peroleh, hingga saat ini bidang kajian evaluasi antara lain meliputi:
a) Evaluasi di bidang pendidikan, antara lain dapat dilihat dalam tulisan yang berjudul: Education Evaluation: theory and practice dan buku Education Evaluation : alternative approaches and practical guidelines karya Worthen & Sanders[21], Handbook of curriculum evaluation karya Lewy[22]. Tujuan utama evaluasi dalam bidang kependidikan adalah untuk menyediakan informasi yang berhubungan dengan masalah-masalah kependidikan, antara lain: tujuan pendidikan, metode pendidikan, lingkungan pendidikan dan sebagainya. Dalam literature juga ditemukan kajian evaluasi dan kurikulum, seperti buku yang berjudul Curriculum and Evaluation, karya Arno A. Bellack dan Herbert M Kliebard[23].
b) Evaluasi dibidang psikologi, antara laian dala tulisan yang brjudul measurement and evaluation in educational and psychology karya Mehrens dan Lehmann[24].
c) Evaluasi dibidang penelitian, antara lain dapat dilihat dala tulisan yang berjudul : Handbook in research and evaluation karya Isaac & Michael[25].
d) Evaluasi dibidang program, antara lain dapat dilihat dalam tulisan yang berjudul : Evaluation of educational programs karya Fernandes[26].
e) Evaluasi di bidang kebijakan, antara lain dapat dilihat dalam tulisan yang berjudul : The practice of policy evaluation karya Nachmias[27].
Dari beberapa referensi di atas, penulis berpendapat bahwa evaluasi tidak identik dengan tes hasil belajar, melainkan memiliki cakupan yang sangat luas. Prinsip dasar evaluasi adalah suatu proses penilaian terhadap sesuatu yang diawali dengan kegiatan pengumpulan data yang sistematis. Tujuan akhir evaluasi adalah penyediaan informasi bagi pembuatan suatu keputusan tertentu. Keputusan tertentu tersebut dapat berkaitan dengan sesorang atau sekelompok orang, program, kebijakan dan sebagainya.
Visualisasi evaluasi sebagai sebuah proses yang diawali penentuan tujuan dan diakhiri dengan pembuatan keputusan tertentu, dapat dilihat pada bagan / gambar berikut:
C. TUJUAN DAN FUNGSI EVALUASI
Evaluasi atau penilaian memiliki beberapa tujuan, Nana Sudjana[28] mengemukakan ada empat tujuan evaluasi, yaitu:
a. mendeskripsikan kecakapan belajar siswa
b. mengetahui keberhasilan proses pendidikan dan pengajaran
c. menentukan tindak lanjut hasil penilaian
d. memberikan pertanggungjawaban (accountability) dari pihak sekolah kepada pihak-pihak yang berkepentingan.
Suharsimi Arikunto menyamakan tujuan dan fungsi evaluasi, menurutnya tujuan atau fungsi tersebut adalah:
a. fungsi selektif
b. fungsi diagnostik, untuk mengetahui kelemahan atau kegagalan dan menemukan sebab-sebabnya.
c. fungsi penempatan, untuk dapat menentukan dengan pasti di kelompok mana seorang siswa harus ditempatkan.
d. fungsi pengukur keberhasilan, untuk mengetahui sejauh mana suatu program berhasil diterapkan[29].
Sedangkan Anas Sudijono[30] membedakan antara fungsi, tujuan dan kegunaan evaluasi. Fungsi evaluasi diklasifikasi menjadi dua, yakni fungsi secara umum dan secara khusus. Secara umum evaluasi berfungsi untuk: (1) mengukur kemajuan, (2) menunjang penyusunan rencana, dan (3) memperbaiki atau melakukan penyempurnaan. Sedangkan secara khusus evaluasi pendidikan memiliki fungsi yang dapat ditilik dari tiga segi, yaitu: (1) segi psikologis, (2) segi didaktik, dan (3) segi administratif. Adapun tujuan evaluasi, secara umum untuk (1) menghimpun data sebagai bukti taraf perkembangan peserta didik, (2) mengetahui tingkat efektivitas dari metode pengajaran yang dipergunakan. Secara khusus evaluasi bertujuan untuk: (1) merangsang kegiatan peserta didik dalam menempuh program pendidikan, (2) mencari dan menemukan faktor-faktor penyebab keberhasilan dan ketidakberhasilan peserta didik.
Dengan mencermati berbagai pendapat tersebut, dapat disimpulkan bahwa dalam pendidikan dan pembelajaran evaluasi memiliki beberapa fungsi yaitu: (1) seleksi, (2) penempatan, (3) diagnosis dan remidial, (4) motivatif / dorongan belajar, (5) pengembangan dan perbaikan strategi pembelajaran, (6) pengembangan dan perbaikan kurikulum dan (7) pengembangan ilmu.

D. KLASIFIKASI EVALUASI
Untuk membuat sebuah “keputusan” yang merupakan tujuan muara dari proses evaluasi diperlukan data yang akurat. Untuk memperoleh data yang akurat diperlukan teknik dan instrumen yang valid dan reliabel.
Secara garis besar evaluasi dapat dilakukan dengan menggunakan teknik tes dan teknik non tes (sebagian khazanah menggunakan istilah alternative test). Dari kedua teknik tersebut, realitas di lapangan teknik tes lebih masyhur (populer) dibandingkan teknik non tes. Realitas ini tampaknya tidak terlepas atau terkait dengan “tradisi” yang sudah turun-temurun, di mana evaluasi direduksi pada kegiatan ujian-ujian atau ulangan-ulangan yang dalam prakteknya menggunakan teknik tes. Mulai dari ulangan (ujian) harian yang dikenal dengan formatif, ulangan (ujian) akhir semester yang dikenal dengan sumatif, ulangan (ujian) akhir sekolah hingga ujian nasional, sebagian besar mengambil bentuk tes dan hanya sebagian kecil menggunakan non tes. Realitas inilah yang diduga peneliti sebagai salah satu penyebab munculnya anggapan yang salah bahwa evaluasi identik dengan tes.
Dari segi respon yang dikehendaki atau dituntut kepada peserta tes, teknik tes dapat diklasifikasi menjadi teknik tes tertulis, tes lisan dan tes perbuatan. Dari ketiga klasifikasi tersebut realitas di lapangan teknik tes tertulis lebih banyak dipergunakan dibandingkan kedua teknik tes yang lain. Hal ini disebabkan teknis tes tertulis memungkinkan untuk dapat diselenggarakan secara massal, di mana dalam waktu yang sama dapat dilaksanakan tes secara serempak dengan materi tes yang sama kepada sejumlah peserta tes (hingga jutaan peserta sebagaimana ujian nasional). Sementara teknik tes lisan dan perbuatan memerlukan biaya, waktu, tenaga yang lebih besar, dan dalam prakteknya sulit untuk membuat materi tes yang sama.
Apakah dengan demikian berarti tes tertulis lebih unggul dibandingkan dengan tes lisan dan perbuatan ?. Tentu saja tidak, karena klasifikasi tes tidak berhubungan baik atau tidaknya teknis dan unggul atau tidaknya. Hal ini disebabkan teknik dan jenis tes, masing-masing memiliki keunggulan dan keterbatasan. Pertimbangan yang diperlukan dalam memilih dan mengembangkan teknik dan jenis tes sudah barang tentu didasarkan pada ”ketepatan” teknik dan jenis tersebut tersebut terkait dengan kompetensi, tujuan dan hasil belajar yang diinginkan. Jika kompetensi yang diinginkan agar peserta didik mampu mengucapkan secara tepat kosa kata atau kalimat tertentu, maka tes lisan lebih tepat dipergunakan. Tetapi seandainya hasil belajar yang diharapkan peserta didik dapat memeragakan tata cara berwudlu misalnya, maka tes perbuatan lebih tepat dipergunakan.
Hisyam Zaini , dkk[31] mengelompokkan tes menjadi:
a. Menurut bentuknya, secara umum terdapat dua bentuk tes, yaitu tes objektif dan tes subjektif. Tes Objektif adalah bentuk tes yang diskor secara objektif. Disebut objektif karena kebenaran jawaban tes tidak berdasarkan pada penilaian (judgement) dari korektor tes. Tes bentuk ini menyediakan beberapa option untuk dipilih peserta tes, yang setiap butir hanya memiliki satu jawaban benar. Tes subjektif adalah tes yang diskor dengan memasukkan penilaian (judgement) dari korektor tes. Jenis tes ini antara lain: tes esai, lisan.
b. Menurut ragamnya, tes esai dapat diklasifikasi menjadi tes esai terbatas (restricted essay) dan tes esai bebas (extended essay). Butir tes objektif menurut ragamnya dapat dibagi menjadi tiga, yaitu: tes ben ar salah (true-false), tes menjodohkan (matching) dan tes pilihan ganda (multiple choice).
Teknik non tes dalam evaluasi banyak macamnya, beberapa diantaranya adalah: angket (questionair), wawancara (interview), pengamatan (observation), skala bertingkat (rating scale), sosiometri, paper, portofolio, kehadiran (presence), penyajian (presentation), partisipasi (participation), riwayat hidup, dsb. Klasifikasi tersebut dapat divisualisasaikan sebagai berikut:
E. PENGUKURAN DOMAIN / RANAH AFEKTIF
Mengacu klasifikasi domain tujuan pendidikan menjadi domain kognitif, afektif dan psikomotor, maka untuk mencapai tujuan ketiga domain tersebut diperlukan instrumen yang valid untuk mengukur pencapaian ketiga domain tersebut. Jika dibuat bagan klasifikasi tersebut sebagai berikut:
Pengukuran domain afektif tidak semudah mengukur domain kognitif. Pengukuran domain afektif tidak dapat dilakukan setiap saat (dalam arti pengukuran formal) karena perubahan tingkah laku peserta didik dapat berubah sewaktu-waktu. Pembentukan sikap seseorang memerlukan waktu yang relatif lama.
Di bagian awal proposal ini telah penulis kemukakan bahwa dalam skala nasional (dengan mengacu kepada tujuan pendidikan nasional) domain atau ranah afektif memiliki cakupan lebih banyak dibandingkan dengan domain atau ranah kognitif dan psikomotor. Penjabaran tujuan pendidikan nasional ke dalam tujuan jenjang dan satuan pendidikan, kelompok mata pelajaran hingga tujuan mata pelajaran, tidak terlepas dengan tujuan pendidikan nasional, hanya proporsi dari masing-masing domain tersebut tidak sama untuk masing-masing mata pelajaran[32]. Sudah barang tentu kelompok mata pelajaran pendidikan agama dan akhlak mulia memiliki porsi lebih banyak domain afektifnya dibanding kelompok mata pelajaran yang lainnya.
Domain atau ranah afektif dijabarkan menjadi 5 level, yaitu: penerimaan, partisipasi, penentuan sikap, organisasi, dan pembentukan pola hidup. Untuk memudahkan dalam memilah kata kerja yang cocok untuk masing-masing level tersebut dapat dilihat pada table berikut[33]:
Tabel.1
Level Domain Afektif dan Klasifikasi Kata Kerja yang sesuai

Level
Kemampuan Umum
Kata Kerja Operasional
Penerimaan
Mendengarkan dengan perhatian, menunjukkan kesadaran tentang pentingnya belajar, menunjukkan sensitifitas pada problem social, menerima perbedaan ras dan kultur, mengikuti aktivitas belajar
Bertanya, memilih, menggambarkan, mengikuti, memberikan, menempatkan, menjawab, menunjukkan, duduk dengan tegak, menggunakan, memilah, memberi nama, mengidentifikasi, memegangg.
Partisipasi
Mematuhi peraturan sekolah, menyelesaikan tugas rumah, berpartisipasi pada diskusi, melakukan secara suka rela, menunjukkan minat, menolong orang lain dengan senang
Menjawab, menolong, mendiskusikan, memberi salam, membantu, menyelenggarakan, melakukan pelatihan, membaca, menceritakan, memilih, menampilkan.
Penentuan sikap
Mendemonstrasikan, keyakinan dalam proses demokrasi, menghargai literature yang baik, menghargai peran sains dalam kehidupan, menunjukkan perhatian terhadap kesejahteraan orang lain, mendemonstrasikan sikap problem solving, mendemonstrasikan komitmen terhadap perbaikan social.
Menyempurnakan, menggambarkan, menjelaskan, mengikuti, mengambil inisiatif, membentuk, mengundang, bergabung, menyampaikan usul, membedakan, melaporkan, berbagi rasa, belajar, bekerja.
Organisasi
Mengakui perlunya keseimbangan antara kebebasan dan tanggung jawab, mengakui peran perencana yang sistematis dalam problrm solving, bertanggung jawab terhadap tindakan, memformulasikan perencanaan hidup sesuai dengan kemampuan, minat dan keyakinan
Menganut, mengatur, mengubah (berubah), mengkombinasikan, membandingkan, menyempurnakan, mempertahankan, menjelaskan, mengidentifikasi, menghubungkan, menyiapkan, mensintesiskan, mengorganisasikan, mengintegrasikan.
Pembentukan pola hidup
Menunjukkan kesadaran diri, mendemonstrasikan kerja mandiri, menggunakan pendekatan objektif dalam problem solving, memelihara kebiasaan hidup sehat, menerapkan pola kerjasama dalam kegiatan kelompok
Bertindak, membedakan, menunjukkan, mempengaruhi, memodifikasi, melakukan, berlatih, menanyakan, merevisi, melayani, menyelesaikan (problem), menggunakan, memeriksa, mengusulkan

Menurut Suharsimi[34], terdapat beberapa skala sikap yang dapat dipergunakan untuk mengukur domain afektif, di antaranya:
b. Skala Likert; skala ini disusun dalam bentuk suatu pernyataan dan diikuti oleh lima respon yang menunjukkan tingkatan. Misalnya: SS (sangat setuju), S (setuju), TB (tidak berpendapat / abstain), TS (tidak setuju), STS (sangat tidak setuju).
c. Skala Pilihan Ganda, skala ini dikembangkan oleh Inkels, seorang ahli penilaian di Stanford University. Skala ini bentuknya seperti soal bentuk pilihan ganda yaitu terdiri dari sejumlah pertanyaan yang diikuti oleh sejumlah alternative / option jawaban.
d. Skala Thurstone; skala ini mirip dengan skala Likert karena merupakan suatu instrument yang pilihan jawabannya menunjukkan tingkatan. Perbedaan skala Thurstone dengan skala Likert, pada skala Thurstone rentang skala yang disediakan lebih dari lima pilihan dan disarankan sekitar sepuluh pilihan jawaban (misalnya dengan rentang angka 1 s/d 11 atau a s/d k). Jawaban di tengah adalah netral, semakin ke kiri semakin tidak setuju, sebaliknya semakin ke kanan semakin setuju.
1
2
3
4
5
6
7
8
9
10
11
Tidak setuju setuju
e. Skala Guttman, skala ini sama dengan yang disusun oleh Bogardus, yaitu berupa tiga atau empat buah pertanyaan yang masing-masing harus dijawab “ya” atau “tidak”. Pernyataan-pernyataan tersebut menunjukkan tingkatan yang berurutan sehingga bila responden setuju pernyataan nomor 2, diasumsikan setuju nomor 1, selanjutnya jika responden setuju dengan pernyataan nomor 3, berarti setuju penyataan nomor 1 dan 2.
Contoh:
1). Saya mengizinkan anak saya bermain ke tetangga
2). Saya mengizinkan anak saya pergi ke mana saja ia mau
3). Saya mengizinkan anak saya pergi kapan saja dan ke mana saja
4). Anak saya bebas pergi ke mana saja tanpa minta izin terlebih dahulu.
f. Semantic Differensial, instrument ini disusun oleh Osgood dan kawan-kawan dipergunakan untuk mengukur konsep-konsep untuk tiga dimensi. Dimensi-dimensi yang ada diukur dalam kategori: baik-tidak baik, kuat-lemah, dan cepat-lambat atau aktif-pasif, atau dapat juga berguna-tidak berguna.
Contoh:
Main Musik
Baik 1 2 3 4 5 6 7 Tidak Baik
Berguna 1 2 3 4 5 6 7 Tidak berguna
Aktif 1 2 3 4 5 6 7 Pasif

Dengan mengacu pada pembagian skala data menjadi empat, yaitu skala data nominal, ordinal, interval dan rasio[35], Augusty Ferdinand[36] mengemukan teknik pengukuran untuk masing-masing skala data tersebut:
1. Pengukuran Data Nominal
Untuk mengukur data nominal dapat menggunakan pertanyaan dengan sejumlah pilihan tertentu atau pertanyaan dengan di akhiri titik-titik kosong responden diminta untuk menulis jawaban yang sesuai dengan keadaannya. Pemberian angka pada kategori jawaban respon semata-mata sebagai identitas atau tanda tertentu.
2. Pengukuran Data Ordinal
1) Forced Ranking. Dalam teknik ini seseorang (responden) diminta untuk memberikan ranking pada sejumlah pilihan tertentu yang disediakan.
Contoh:
Mohon saudara memberikan ranking preferensi terhadap 5 perguruan tinggi agama Islam berikut. Berikan angka 1 untuk yang paling diminati, 2 untuk yang paling diminati berikutnya hingga angka 5 untuk yang paling tidak diminati:
Universitas Islam Negeri Sunan Kalijaga Yogyakarta ...............
Universitas Islam Negeri Syarif Hidayatullah Jakarta................
Universitas Islam Negeri Malang ..............................................
Institut Agama Islam Negeri Walisongo Semarang ..................
Institut Agama Islam Sunan Ampel Surabaya ..........................

2) Semantic Scale. Teknik ini dipergunakan untuk menghasilkan respon terhadap sebuah stimuli yang disajikan dalam kategori semantik yang menyatakan sebuah tingkatan sifat atau keterangan tertentu.
Contoh:
Apakah saudara suka minuman kopi ?
............... ................ ............... ................ ..................
sangat tidak netral suka sangat
tidak suka suka suka
(=1) (=2) (=3) (=4) (=5)

3) Summated (Likert) Scale. Skala Likert adalah sebuah ekstensi dari skala semantik Perbedaan utamanya adalah: pertama, skala ini menggunakan lebih dari 1 item pertanyaan, di mana beberapa pertanyaan digunakan untuk menjelaskan sebuah konstruk, lalu jawabannya dijumlahkan, oleh karenanya disebut summated scala. Kedua, skala ini dikalibrasi dengan cara jawaban yang netral diberi kode ”0”.
Contoh:
1. Apakah saudara suka minum kopi ?
............... ................ ......X......... ................ ..................
sangat tidak netral suka sangat
tidak suka suka suka
(-2) (-1) (0) (1) (2)

2. Apakah kopi termasuk minuman yang menyehatkan ?
............... ................ ............... .......X......... ................
sangat tidak netral sehat sangat
tidak sehat sehat sehat
(-2) (-1) (0) (1) (2)

3. Apakah saudara pikir, orang-orang sebaya saudara suka minuman kopi ?
............... ................ ............... ................ .........X.......
sangat tidak netral suka sangat
tidak suka suka suka
(-2) (-1) (0) (1) (2)

Jawaban dari skala di atas bila dijumlahkan = 0 + 1 + 2 = +3, yang mengindikasikan sikap yang positif terhadap kopi.
3. Pengukuran Data Interval
1) Bipolar Adjective. Skala ini merupakan penyempurnaan dari semantic scale dengan harapan agar respons yang dihasilkan dapat merupakan intervally scaled data. Caranya adalah dengan memberikan hanya dua kategori ekstrim.
Contoh:

Apakah audara suka minuman kopi ?
Sangat tidak suka 1 2 3 4 5 6 7 8 9 10 sangat suka
Jelaskan bagaimana kesukaan saudara pada kopi: .........................................

2) Agree-Disagree Scale. Skala ini merupakan salah satu bentuk lain dari Bipolar adjective, dengan mengembangkan pertanyaan yang menghasilkan jawaban setuju – tidak setuju dalam berbagai rentang nilai.
Contoh:

Kopi adalah minuman alamiah yang menyehatkan tubuh.
Sangat tidak setuju 1 2 3 4 5 6 7 8 9 10 sangat setuju
Jelaskan bagaimana ia menyehatkan tubuh dan rasa apa yang saudara rasakan waktu minum kopi .................................................. .........................................

3) Continous Scale. Skala ini merupakan salah satu teknik pengukur data untuk menghasilkan data interval di mana responden diminta untuk memberikan jawaban pada garis yang ditentukan dan setelah itu peneliti pengukur posisi yang dipilih oleh responden untuk menghasil skore tertentu.

Kopi adalah minuman alamiah yang menyehatkan tubuh.
Sangat tidak setuju _________________________________ sangat setuju
Jelaskan bagaimana ia menyehatkan tubuh dan rasa apa yang saudara rasakan waktu minum kopi .................................................. .........................................

4) Equal With Interval. Teknik ini dipergunakan dengan menanyakan responden termasuk ke dalam kategori mana pandangan mereka dapat diletakkan. Bila rentang yang digunakan tidak equal, maka data yang dihasilkan cenderung merupakan data ordinal.
Contoh:
Berapa jumlah buku agama yang saudara miliki di rumah ?
................ .................. ................... .................. ...................
1 – 2 3 – 4 5 – 6 7 – 9 10 ke atas

4. Pengukuran Data Rasio
1) Direct Quantification (Kuantifikasi Langsung). Teknik ini dilakukan dengan menanyakan secara langsung nilai dari sebuah konstruk.
Contoh:
Berapa uang saku yang diberikan kepada saudara setiap hari ? Rp. .................
Berapa uang saku saudara ditabung dalam satu minggu ?. Rp. .........................

2) Constant Sum Scale (Skala Berjumlah Konstan). Skala ini dapat dipergunakan untuk mengetahui preferensi konsumen atas beberapa jenis sesuai dengan konstruk tertentu.
Contoh:
Alokasikan angka 100 ke dalam empat jenis bacaan berikut sesuai dengan tingkat kesenangan saudara !
1. buku cerita = ....................
2. buku ilmiah = ....................
3. buku agama = ....................
4. koran = ....................
Total = 100
3) Reference Alternative (Alternatif Rujukan), yaitu dengan menentukan sebuah acuan rujukan dan penilaian diberikan dengan membandingkan pada acuan yang dirujuk tersebut. Teknik ini disebut juga dengan magnitude scaling.
Bila buku agama dinilai 100, berapa nilai yang saudara berikan pada alternatif berikut:
1. buku cerita = ....................
2. buku ilmiah = ....................
3. majalah = ....................
4. koran = ....................

F. PENUTUP.
Dari uraian ringkas di atas penulis dapat menyimpulkan bahwa untuk melakukan evaluasi secara komprehensif diperlukan intrumen yang tepat sesuai sesuai dengan domain / ranah yang hendak dievaluasi. Pengembangan instrument evaluasi dengan menggunakan tes telah banyak dilakukan oleh para ahli. Instrumen ini hanya cocok untuk mengukur domain kognitif dan sebagian psikomotor.
Untuk mengukur domain afektif dan sebagian psikomotor diperlukan pengembangan instrument evaluasi non tes (alternative test). Pengembangan instrument ini relative lebih sulit dibandingkan dengan pengembangan instrumen evaluasi tes. Untuk itu diperlukan kajian yang seksama dalam menurunkan serta menjabarkan domain afektif ke dalam aspek-aspek yang spesifik untuk dapat mengembangkan instrumen yang valid dan reliabel.
[1] Penulis lahir di Karanganyar, 22 Desember 1966. Menyelesaikan S-1 di IAIN Sunan Kalijaga Fakultas Tarbiyah Juli 1989, S-2 Universitas Negeri Yogyakarta April 2001. Semenjak Oktober 2003 menduduki jabatan Lektor Kepala di STAIN Purwokerto. Sekarang sedang mengikuti Program Doktor By Research di UIN Yogyakarta.
[2] Woofolk, Anita E. dan Lorraine McCune-Nicolich (2004), Mengembangkan Kepribadian & Kecerdasan Anak-anak (Psikologi Pembelajaran I), Penerjemah: M.Khairul Anam, Depok: Inisiasi Press, hlm. 206-207.
[3] Surakhmad, Winarno (1986), Pengantar Interaksi Mengajar Belajar: Dasar dan teknik metodologi pengajaran, edisi IV, Bandung: Tarsito. Dapat dilihat pula di Zaini, Hisyam, dkk (2002), Desain Pembelajaran di Perguruan Tinggi, Yogyakarta: CTSD IAIN Sunan Kalijaga. Lihat juga Soenarwan (1991) Pendekatan system dalam Pendidikan, Surakarta: UNS Press.
[4] Terdapat beberapa istilah tentang sesuatu yang ingin dicapai dalam pembelajaran. Semenjak Kurikulum 1975 dikenal istilah tujuan yang dalam implementasi operasionalnya dikenal Tujuan Instruksional Umum (TIU) dan Tujuan Instruksional Khusus (TIK). Kemudian Tujuan Pembelajaran Umum (TPU), Tujuan Pembelajaran Khusus (TPK). Dalam Kurikulum Berbasis Kompetensi dikenal istilah Kompetensi Dasar (KD), Standar Kompetensi (SK), hasil belajar, dan indikator pencapaian. Apapun istilah yang dipakai pada prinsipnya adalah rumusan tentang sesuatu yang ingin dicapai dalam proses tersebut.
[5] Winkel (1989), Psikologi Pengajaran, Jakarta: Gramedia. Dapat dilihat juga di Sudijono, Anas (1996), Pengantar Evaluasi Pendidikan, Jakarta: Raja Grafindo Persada lihat juga Arikonto, Suharsimi (2002), Dasar-dasar Evaluasi Pendidikan (edisi revisi), Jakarta: Bumi Aksara.
[6] Guru sebagai manajer memiliki empat fungsi yaitu: merencanakan, mengorganisasikan, memimpin dan mengawasi. Lihat Davis. Ivor K.(1987), Pengelolaan Belajar, penerjemah; Sudarsono Sudirdjo, Lily Rompas, Koyo Kartasurya, Jakarta: CV Rajawali bekerja sama demngan Pusat Antar Universitas di Universitas Terbuka, hlm. 29-39. Sementara ahli mengemukan bahwa guru memiliki beberapa peran, yaitu sebagai ahli instruksional, motivator, manager, pemimpin, konselor, “Insinyur lingkungan”, model (teladan), Lihat Woolfolk, Ibid, hlm. 3-9.
[7] UU RI no. 20 tahun 2003 Bab II pasal 3. Lihat Undang-undang dan Peraturan Pemerintah RI tentang Pendidikan (2006), Jakarta: Direktorat Jendral Pendidikan Islam Departemen Agama RI
[8] Al Albrasyi, M. Athiyah (1987), Dasar-dasar Pokok Pendidikan Islam, Alih bahasa: Bustami A. Gani dan Djohar Bahry L.I.S., Jakarta: Bulan Bintang, hlm. 1-4.
[9] Ketiga kata tersebur CERDAS, TAQWA dan TERAMPIL banyak ditulis dengan huruf-huruf besar di tembok-tembok depan sekolah dasar sehingga mudah dibaca setiap orang yang ada di depan sekolah tersebut.
[10] Bloom, Bejamin S (ed.) (1956), Taxonomy of Educational Objectives: The Classification of Educational Goals, London : Longman Group Ltd. Lihat juga Zaini dkk, Op Cit., hlm. 88-92.
[11] Michael Sriven seorang ahli dalam penelitian evaluasi melihat pembagian evaluasi secara formatif dan sumatif dari segi fungsi. Formatif difungsikan sebagai pengumpulan data pada waktu pendidikan masih berlangsung. Sedangkan evaluasi sumatif dilaksanakabn jika program kegiatan sudah betul-betul dilaksanakan. Sementara ahli memandang formatif dan sumatif menunjuk pada lingkup atau luasnya yang dinilai. Sasaran evaluasi sumatif merupakan gabungan dari sasaran evaluasi formatif. Lihat Suharsimi Arikunto (2000), Manajemen Penelitian, Jakarta: Rineka Cipta, hlm. 283
[12] Terdapat beberapa prinsip dasar evaluasi antara lain: validitas, reliabilitas, objektivitas, praktikabilitas, ekonomis. Lihat Suharsimi Arikunto, Dasar-dasar…OpCit., hlm. 58-63.
[13] Mata pelajaran yang diujikan dalam Ujian Nasional adalah: Matematika, Bahasa Indonesia dan Bahasa Inggris. Penentuan tiga mata pelajaran ini yang mengundang polemik antara pro dan kontra. Yang kontra mempertanyakan apakah ketiga mata pelajaran tersebut dapat mewakili (representative) seluruh mata pelajaran yang ada ?. Bagaimana dengan kedudukan mata pelajaran-mata pelajaran yang lain seperti Pendidikan Agama, IPS, PKn dan sebagainya.
[14] Suryabrata, Sumadi (1997), Pengembangan Tes Hasil Belajar, Jakarta: Rajawali Press. Lihat juga Saifuddin Azwar, (2002), Tes Prestasi: Fungsi dan Pengembangan Pengukuran Prestasi Belajar, Yogyakarta: Pustaka Pelajar. Dan Fernandes, H.J.X. ((1984), Testing and measurement, Jakarta: National Education Planning, Evaluation and Curriculum Development.
[15] Isaac, Stephen & William B. Michael (1984), Handbook in research and evaluation, second edition, San Diego, California: Edits Publishers.
[16] Mehrens, William A. & Irvin J Lehmann (1973), Measurement and Evaluation in education and Psychology, New York: Holt, Rinehart and Winston, Inc.
[17] Hopkins, Charles D., Richard L. Antes (1990), Classroom Measurement and Evaluation, third edition, Itasca Illinois: F.E. Peacock Publishers, Inc.
[18] Anas Sudijono, Loc. Cit., Suharsimi Arikunto, Loc. Cit., dan Sudjana, Nana (2001), Penilaian Hasil Belajar Proses Belajar Mengajar, Bandung: PT Remaja Rosdakarya. Lihat juga Sudjana, Nana dan Ibrahim (2001), Penelitian dan Penilaian Pendidikan, Bandung: Sinar Baru Algesindo.
[19] Hamalik, Oemar (2003), Perencanaan Pengajaran Berdasarkan Pendekatan Sistem, Jakarta: Bumi Aksara, hlm. 2.
[20] Worthen, Blaine R and James R. Sanders (1973), Educational Evaluation: theory and practice, New York & London: Longman, hlm. 129
[21] Ibid. dan Worthen, Blaine R and James R. Sanders (1988), Educational Evaluation: Alternative Approach and Practical Guidelines, New York & London: Longman.
[22] Lewy, Arieh., (1977), Handbook of curriculum evaluatio, New York: Longman Inc.
[23] Bellack, Arno A. and Herbert M. Kliebard (1977) Curriculum and Evaluation, Berkeley, California: Mr Cutrhan Pblishing Corporation.
[24] Mehrens, William A. & Irvin J Lehmann (1973), Measurement and Evaluation in education and Psychology, New York: Holt, Rinehart and Winston, Inc.
[25] Isaac, Stephen & William B. Michael (1984), Handbook in research and evaluation, second edition, San Diego, California: Edits Publishers.
[26] Fernandes, H.J.X. ((1984), Evaluation of educational programs, Jakarta: National Education Planning, Evaluation and Curriculum Development.
[27] Nachmias, David (1980), The practice of policy evaluatio, New York: St. Martin’s Press.
[28] Sudjana, Nana (2001), Penilaian Hasil Belajar Proses Belajar Mengajar, Bandung: PT Remaja Rosdakarya, hlm. 4.
[29] Suharsimi Arikunto, Op Cit., hlm. 10-11.
[30] Anas Sudijono, Op Cit., hlm. 7-17.
[31] Hisyam Zaini dkk, Op Cit., 164-166.
[32] Mulyasa, E (2005), Kurikulum Berbasis Kompetensi: Konsep, Karakteristik dan Implementasi, Bandung: PT Remaja Rosdakarya, hlm. 89-144.
[33] Hisyam Zaini dkk, Op Cit.,., hlm. 88-92
[34] Suharsimi Arikunto, Op Cit., hlm. 177-182.
[35] Keterangan tentang klasifikasi skala data menjadi nominal, ordinal, interval dan rasio banyak ditulis dalam buku-buku statistika. Antara lain lihat: Glass, Gene V. and Kenneth D. Hopkons (1984), Statistical Methods in Education and Psychology, second edition, London: Prentice –Hall International Inc., hlm 6 – 8.
[36] Ferdinand, Augusty (2006), Structural Equation Modeling dalam Penelitian Manajemen: Aplikasi Model-model Rumit dalam Penelitian untuk Tesis Magister dan Disertasi Doktor, edisi 4, Semarang: BP Universitas Diponegoro. hlm. 144-149.

evaluasi pendidikan

Rabu, 11 November 2009

PENGEMBANGAN INSTRUMEN EVALUASI DOMAIN AFEKTIF

Tidak ada komentar:

Posting Komentar

Mengenai Saya

Pengikut

Arsip Blog