Informasi Tes TOAFL

Salah satu instrumen evaluasi pembelajaran bahasa Arab adalah tes atau ikhtibâr. Tes bahasa dirancang dan disusun sesuai dengan tujuan, materi dan sasaran pembelajaran itu sendiri. Tes inilah yang banyak dilakukan oleh tenaga pengajar/dosen, karena memang berkaitan dengan tugas edukatifnya, yakni memberi evaluasi dan nilai terhadap pemerolehan dan hasil belajar peserta didik.
Tes kebahasaan merupakan sejumlah prosedur dan instrumen yang didesain secara sistematis, digunakan oleh tenaga pengajar dalam mengamati dan mengetahui performa dan komptensi salah satu keterampilan bahasa peserta didik atau keseluruhannya, sesuai dengan ukuran kuantitatif tertentu dengan maksud mencapai tujuan tertentu pula. Pengerjaan tes sangat tergantung pada petunjuk yang diberikan, misalnya: melingkari atau memberi tanda silang pada salah satu huruf di depan pilihan jawaban, mencoret jawaban yang salah, menerangkan, mengisi titik-titik, dan sebagainya.
Tes kebahasaan itu sangat beragam, bergantung pada perbedaan tujuan, kepentingan, cara pemeriksaan, dan ruang lingkupnya. Dari segi tujuannya, tes kebahasaan dapat diklasifikasikan menjadi tiga, yaitu: tes pemerolehan atau tes prestasi (achievement test, al-ikhtibâr al-tahshîlî), tes profisiensi (proficiency test, ikhtibâr al-ijâdah aw al-kafâah), dan tes kesiapan berbahasa (language aptitude test, ikhtibâr al-isti‘dâd al-lughawî) atau tes prekdisi (predictive test, al-ikhtibâr al-tanabbu’).
Tes pemerolehan bahasa adalah tes yang dimaksudkan menguji apa yang telah diperoleh peserta didik setelah menempuh atau memperoleh pengalaman pendidik-an dalam waktu tertentu. Tes ini terkait dengan kurikulum dan buku ajar yang digunakan oleh lembaga pendidikan, dan pada umumnya dilaksanakan dalam bentuk ujian pada pertengahan atau akhir semester.
Sementara itu, tes profisiensi adalah tes yang tidak dimaksudkan untuk menguji pemerolehan kebahasaan peserta didik, dan tidak terkait dengan kurikulum, buku ajar dan masa program belajar tertentu, melainkan menguji kemampuan dan keterampilan bahasa peserta didik secara umum. Yang termasuk jenis tes ini adalah TOEFL (Test of English as a Foreign Language) atau TOAFL (Test of Arabic as a Foreign Language). Sedangkan tes kesiapan atau prediksi adalah tes yang dimaksudkan untuk menentukan tingkat kesiapan peserta didik untuk belajar bahasa kedua, dan memprediksi kemajuan yang akan dicapai peserta didik. Tes ini juga mengukur aspek audio-visual peserta didik, terutama mengukur kemampuannya dalam membedakan berbagai tarâkîb lugawiyyah.
Dari segi pembuatnya, tes dapat dibagi menjadi dua, yaitu: tes standar (al-ikhtibâr al-muqannan) dan tes tenaga pengajar (ikhtibâr al-mu‘allim). Yang pertama adalah tes yang dibuat oleh lembaga tertentu, dengan standar tertentu pula, untuk dipergunakan dalam skala yang luas, misalnya: tes bahasa Arab untuk seluruh kelas III Madrasah Aliyah dalam ujian akhir di wilayah Kabupaten Bogor. Sedangkan yang kedua adalah tes yang dibuat oleh tenaga pengajar untuk diujikan kepada peserta didiknya sendiri, dan bertujuan untuk mengentahui tingkat penguasaan bahasa yang telah dipelajarinya.
Sementara itu, dari segi skoringnya, tes dapat dibagi menjadi dua, yaitu: tes essay atau tes subyektif dan tes obyektif . Yang pertama adalah tes yang dirancang sedemikian rupa, sehingga peserta didik memiliki kebebasan dalam memilih dan menentukan jawaban dalam bentuk uraian. Tes ini disebut subyektif karena jawaban peserta didik maupun koreksi yang diberikan oleh tenaga pengajar bersifat subyektif. Sedangkan yang kedua adalah tes yang itemnya dapat dijawab dengan memilih jawaban yang sudah tersedia, sehingga peserta didik menampilkan keseragaman data, baik yang menjawab benar maupun yang menjawab salah. Tes ini disebut obyektif karena pilihan jawaban bersifat pasti dan tertutup, tidak membuka peluang bagi peserta didik untuk memilih selain dari pilihan jawaban yang sudah ditentukan; demikian juga penilai juga tidak mungkin memberikan skoring yang menyimpang dari pilihan jawaban yang benar.
Setidaknya ada empat bentuk tes obyektif, yaitu: pilihan ganda (al-ikhtiyâr min muta‘addid, multiple choise), pilihan benar-salah (ikhtiyâr al-shawâb wa al-khatha’), mencari pasangan (al-muzâwajah, matching), dan melengkapi isian (al-takmilah, completion) dengan jawaban yang bersifat tertutup.
Dari segi cara dan bentuk pengujiannya, tes dapat dibagi menjadi dua: tes lisan (ikhtibâr syafawî) dan tes tulis (ikhtibâr tahrîrî). Yang pertama adalah tes yang soal dan jawabannya diberikan secara lisan, sebaliknya yang kedua adalah tes yang soal dan jawabannya diberikan dalam bentuk tulis. Tes lisan dapat digunakan, terutama untuk menguji keterampilan berbicara (mahârat al-kalâm), membaca dan ekspresi verbal (ta‘bîr syafawî). Sedangkan tes tulis dapat digunakan untuk menguji cabang-cabang kebahasaaraban yang kurang cocok diujikan secara lisan, seperti: materi nahwu, tarjamah tahrîriyyah (tarjamah tulis), insyâ’, dan sebagainya.
Aplikasi tes, dalam berbagai bentuk dan jenisnya tersebut, dalam pembelajaran bahasa Arab dapat disesuaikan dengan karakteristik materi yang akan diujikan. Materi istimâ’ berbeda dengan materi qawâ’id dan insyâ’. Demikian juga alat dan media yang digunakan. Tes keterampilan menyimak (ikhtibâr al-istimâ’), misalnya, idealnya dilakukan dalam laboratorium bahasa dengan menggunakan tape recorde dan earphone, atau sekurang-kurangnya didukung oleh rekaman kaset yang dibunyikan melalui tape, seperti halnya tes listening dalam TOEFL atau TOAFL. Tes mufradât juga dikembangkan dengan penuh variasi; tidak hanya berupa mencari sinonim dan antonim kata, melainkan juga dapat berupa mendefinisikan sesuatu, menyebut profesi, mencari salah kata yang asing dari suatu kelompok kata, dan sebagainya.
Penyusunan tes menurut James Smith harus sesuai dengan norma-norma berikut. Pertama, butir-butir atau kalimat soal hendaknya hanya disesuaikan dengan tujuan khusus yang telah ditetapkan. Misalnya saja, jika kalimat soal ditujukan untuk menguji arti mufradât dalam sebuah kalimat, maka alternatif jawaban –jika berbentuk pilihan ganda— hendaknya tidak bias dengan unsur nahwu atau sharaf. Kedua, soal yang dibuat hendaknya sesuai dengan tingkat kemampuan peserta didik, terutama jika berbentuk tes pemerolehan. Ketiga, penyusunan tes hendaknya disertai petunjuk yang jelas, baik mengenai cara dan tempat menjawabnya serta lamanya waktu yang disediakan. Keempat, redaksi atau rumusan masing-masing soal harus jelas, tidak bersayap dan multiinterpretasi, terukur, dan diskriminatif. Kelima, waktu yang diberikan untuk menjawab soal harus sebanding dengan tingkat kesulitan dan banyak soal. Keenam, skoring penilaian harus obyektif berdasarkan proporsi yang ditetapkan, bukan berdasarkan rekaan, dan jauh dari subyektivitas penilai.
TOAFL
TOAFL adalah singkatan dari “Test of Arabic as Foreign Language”. Nama ini diilhami oleh TOEFL (Test of English as a Foreign Language), yang telah ada lebih dahulu. Penamaan ini memang dimaksudkan agar TOAFL lebih mudah diucapkan dan dikenal oleh banyak orang, meskipun terkesan “menyerupai” TOEFL.
Pusat Bahasa (PB) UIN Syarif Hidayatullah Jakarta sebetulnya telah membuat nama untuk tes ini, yaitu “al-Ikhtibârât al-‘Arabiyyah li al-Dirâsât al-Islâmiyyah li al-Ajânib” atau “al-Ikhtibârât fi al-Lughah al-‘Arabiyyah li al-Nâthiqîna bi Ghairihâ”. Akan tetapi, TOAFL sudah terlanjur lebih dikenal dan populer. Selain itu, TOAFL sudah menjadi “trademark” atau “brainmark” PB UIN Jakarta.
TOAFL dilatarbelakangi oleh upaya serius untuk meningkatkan standar mutu kelulusan secara akurat dan jelas, sehingga tingkat kemampuan bahasa Arab lulusan UIN dapat diukur dengan standar tertentu secara pasti. Penyusunan TOAFL juga disemangati oleh usaha “memasukkan” unsur-unsur keislaman dalam materi tes, sehingga peserta tes berkenalan dengan wawasan dan dunia Islam secara umum. TOAFL lahir dengan visi: “Menjadikan bahasa Arab sebagai bahasa studi Islam dan sains”.
TOAFL mulai digunakan sebagai salah satu materi ujian masuk Program S2 dan S3 IAIN (kini UIN) Jakarta. Penggunaan TOAFL sebagai materi tes didasarkan pada kebutuhan akademis bahwa para peserta program S2 dan S3 dituntut mampu dan memiliki standar tertentu dalam berbahasa asing, utamanya Arab. Selanjutnya, pada 2000/2001, TOAFL juga digunakan sebagai materi tes masuk di beberapa Program Pascasarjana di luar UIN Jakarta, seperti: IAIN Palembang, IAIN Lampung, IAIN Mataram, STAIN Banjarmasin, dan IAIN Padang, bahkan juga PPs. Studi Islam, Universitas Muhammadiyah Jakarta. Saat ini, PB telah memiliki 8 edisi/form TOAFL; dua di antaranya telah dijadikan sebagai bahan pelatihan TOAFL dan yang empat masih “dijaga kerahasiaannya” untuk digunakan sebagai bahan tes.

a.Perbedaan Antara TOEFL dan TOAFL
Jika TOEFL pertama kali diselenggarakan pada 1963 di 165 negara, TOAFL baru lahir 1998 lalu, dan baru digunakan di Indonesia. Ketika dirancang, disadari bahwa format TOAFL mengadaptasi TOEFL. Karena itu, ada beberapa kesamaan, seperti: bentuk tes (multiple choise), sebagian kisi-kisi dan jumlah soal (150 item), dan skoring. Namun demikian, TOAFL berbeda sama sekali dengan TOEFL. Referensi TOAFL adalah literatur-literatur keislaman multidisiplin dan pengetahuan umum. Nuansa Islami lebih menonjol pada TOAFL daripada nuansa “Amerika” pada TOEFL. Di antara substansi TOAFL adalah: pemikiran Islam, tafsir, ilmu tafsir, hadits, ilmu hadits, sejarah dan peradaban, pemikiran politik, pendidikan, dakwah, fiqh dan ushûl fiqh, bahasa dan sastra Arab, ekonomi, komunikasi, dan perkembangan modern di dunia Islam.
Perbedaan lain yang menjadi karakteristik TOAFL adalah adanya soal-soal gramatika (qawâ‘id), baik nahwu maupun sharf, termasuk i‘râb (analisis jabatan kata dalam struktur kalimat). Soal-soal ini penting dimunculkan karena pemahaman suatu teks atau wacana bahasa Arab dipengaruhi oleh pemahaman terhadap gramatikanya. Jika skor akhir TOEFL tertinggi sekitar 680, maka TOAFL membakukan skor akhir tertinggi dengan angka 700 dan terendah 210.

b.Aspek-aspek Materi Tes dan Jumlah Item Soal
Aspek yang diujikan dalam TOAFL terdiri tiga bagian, yaitu sebagai berikut:
1.Fahm al-Masmû’, sejumlah 50 item, meliputi: (a) pemahaman makna, pengertian, penalaran logis atau kesimpulan dari sebuah pernyataan/kalimat yang diperdengarkan (20 item); (b) pemahaman maksud, topik, penalaran logis, kesimpulan dan makna tersirat dari dialog singkat antara dua orang (15 item); dan (c) pemahaman maksud, topik, penalaran logis, kesimpulan dan makna tersirat dari dialog panjang antara dua orang atau lebih dan alenia pernyataan (15 item).
2.Fahm al-Tarâkîb wa al-‘Ibârât, terdiri dari 40 item, meliputi: (a) melengkapi kalimat dengan ungkapan atau struktur baku (20 item), dan (b) mengenali dan menganalisis penggunaan kata, ungkapan dan atau struktur yang salah dalam sebuah kalimat (20 item).
3.Fahm al-Mufradât wa al-Nash al-Maktûb wa al-Qawâ‘id, terdiri dari 60 item, meliputi: (a) memahami tarâduf (sinonim) atau kedekatan makna suatu yang digarisbawahi sesuai dengan konteks kalimat (20 item); (b) memahami isi, topik dan makna tersirat dalam beberapa paragraf/wacana ((20 item); dan (c) memahami penggunaan, kedudukan (i’râb), derivasi (isytiqâq), bentuk kata dan istilah-istilah nahwu dan sharf (20 item).
Waktu untuk menjwab semua soal tersebut (150 item) adalah 120 menit, sehingga satu soal harus dijawab dalam waktu kurang dari satu menit. Karena itu, di antara kelemahan tes jenis ini adalah terbukanya kemungkinan guessing (asal tebak). Namun demikian, jumlah soal sebanyak itu (150 item) memang didesain untuk mengeliminasi tingkat “asal tebak” tersebut. Sejauh ini, TOAFL merupakan bentuk tes yang relatif terukur, standar, praktis, dan obyektif.

c.Validitas dan Reliabilitas TOAFL
Ciri utama tes yang baik adalah kesesuaiannya dengan kemampuan yang diukur, atau yang disebut dengan validitas. Ciri lainnya adalah kemampuannya melakukan pengukuran dengan tingkat keajegan tertentu, yang dapat dikaji menurut beberapa metode . Dengan kata lain, validitas merupakan kesesuaian antara tes dengan apa yang ingin diukur dalam tes itu.
Ada beberapa macam validitas. Di antaranya adalah validitas isi (content validity), validitas konstruk (construct validity), dan validitas kriteria (criteria validity). Ada juga yang mengklasifikasikan validitas menjadi empat, yaitu: validitas isi, validitas konstruk, validitas prediktif (predictive validity), dan validitas konkuren (concurent validity). Validitas isi menuntut adanya kesesuaian isi antara kemampuan yang ingin diukur dan tes yang digunakan untuk mengukurnya. Kesesuaian itu tercermin pada jenis kemampuan yang dituntut untuk mengerjakan tes, dibandingkan dengan jenis kemampuan yang dijadikan sasaran pengukuran. Tes dimaksud harus benar-benar memerlukan kemampuan menyimak, dan bukan kemampuan membaca.
Validitas kriteria mengacu kepada kesesuaian antara hasil suatu tes dengan hasil tes lain yang digunakan sebagai kriteria. Kriteria yang digunakan untuk menetapkan tingkat kesesuaian itu dapat diambil dari tes sejenis yang diketahui cirri-cirinya sebagai tes yang baik, dan yang diselenggarakan pada saat yang hampir bersamaan. Validitas ini juga dikenal sebagai validitas kesetaraan waktu.
Sementara itu, validitas konstruk merupakan sebuah konsep atau teori yang mendasari penggunaan jenis kemampuan, termasuk kemampuan berbahasa. Pembuktiaan adanya validitas konstruk merupakan usaha untuk menunjukkan bahwa skor yang dihasilkan suatu tes benar-benar mencerminkan konstruk yang sama dengan kemampuan yang dijadikan sebagai sasaran pengukurannya. Dalam tes kemampuan qirâ’ah (membaca), misalnya, urusan validitas konstruk menyangkut pembuktian apakah skor yang dihasilkan benar-benar mencerminkan jenis dan rincian kemampuan membaca yang sama dengan jenis dan rincian kemampuan yang diperlukan untuk memahami bacaan.
Yang akan dibuktikan dalam penelitian ini adalah tingkat validitas kriteria TOAFL, bukan validitas isi, karena diukur adalah hasil jawaban peserta tes dilihat dari kesesuaiannya dengan jawaban benar yang telah dirancang.
Sementara itu, reliabilitas merupakan cirri tes yang memiliki kemampuan untuk menghasilkan pengukuran yang ajeg, tidak berubah-rubah, seandainya digunakan secara berulang-ulang pada sasaran yang sama. Dengan kata lain, reliabilitas terkait bukan dengan tesnya sebagai alat ukur, melainkan dengan hasil pengukurannya dalam bentuk skor yang ajeg. Skor sebagai hasil pengukuran itulah yang seharusnya ajeg, tidak berubah-ubah. Dengan ciri keajegan itu, peserta tes yang sama seharusnya memperoleh skor yang hampir sama pula, seandainya ia kembali mengerjakan tes yang sama, pada kesempatan yang berbeda.

Tinggalkan Balasan

Isikan data di bawah atau klik salah satu ikon untuk log in:

Logo WordPress.com

You are commenting using your WordPress.com account. Logout / Ubah )

Gambar Twitter

You are commenting using your Twitter account. Logout / Ubah )

Foto Facebook

You are commenting using your Facebook account. Logout / Ubah )

Foto Google+

You are commenting using your Google+ account. Logout / Ubah )

Connecting to %s