Perkembangan model evaluasi termasuk suatu fenomena yang menarik. Setelah Tyler mengemukakan model black box tahun 1949, belum terlihat ada model lain yang muncul ke permukaan. Lebih kurang 10 tahun lamanya, orang-orang yang melakukan kegiatan evaluasi hanya menggunakan model evaluasi tersebut. Hal ini mungkin disebabkan evaluasi belum menjadi studi tersendiri. Ketika itu, orang banyak mempelajari evaluasi dari psikometrik dengan kajian utamanya adalah tes dan pengukuran.
Selanjutnya, sekitar tahun 1972, model evaluasi mulai berkembang. Taylor dan Cowley, misalnya, berhasil mengumpulkan berbagai pemikiran tentang model evaluasi dan menerbitkannya dalam suatu buku. Dalam model tersebut, nuansa tes dan pengukuran masih sangat kental, sekalipun tidak lagi diidentikkan dengan evaluasi. Penggunaan desain eksperimen seperti yang dikemukakan Campbell dan Stanley (1963) menjadi ciri utama dari model evaluasi.
Nah, lantas apa yang dimaksud dengan evaluasi tersebut ?
Evaluasi adalah suatu alat atau prosedur yang digunakan untuk mengetahui dan mengukur sesuatu dalam suasana dengan cara dan aturan-aturan yang sudah ditentukan. Dari hasil evaluasi biasanya diperoleh tentang atribut atau sifat-sifat yang terdapat pada individu atau objek yang bersangkutan. Selain menggunakan tes, data juga dapat dihimpun dengan menggunakan angket, observasi, dan wawancara atau bentuk instrumen lainnya yang sesuai (Nurhasan, 2001:3). Sedangkan menurut Brinkerhoff dalam Sawitri (2007:13) evaluasi adalah penyelidikan (proses pengumpulan informasi) yang sistematis dari berbagai aspek pengembangan program profesional dan pelatihan untuk mengevaluasi kegunaan dan kemanfaatannya.
Kemudian apa saja model-model evaluasi yang dikembangkan oleh para ahli ?
Dalam studi tentang evaluasi, banyak sekali dijumpai model-model evaluasi dengan format atau sistematika yang berbeda, sekalipun dalam beberapa model ada juga yang sama. Ada banyak model evaluasi program yang dikembangkan oleh para ahli yang dapat dipakai untuk mengevaluasi program. Model-model tersebut di antaranya :
1. Discrepancy Model (Provus)
Evaluasi model kesenjangan (discrepancy model) menurut Provus (dalam Fernandes, 1984) adalah untuk mengetahui tingkat kesesuaian antara baku (standard) yang sudah ditentukan dalam program dengan kinerja (performance) sesungguhnya dari program tersebut. Baku adalah kriteria yang ditetapkan, sedangkan kinerja adalah hasil pelaksanaan program
2. CIPP Model (Daniel Stufflebeam's)
Model CIPP (Context, Input, Process, dan Product) merupakan model evaluasi di mana evaluasi dilakukan secara keseluruhan sebagai suatu sistem. Evaluasi model CIPP merupakan konsep yang ditawarkan oleh Stufflebeam dengan pandangan bahwa tujuan penting evaluasi adalah bukan membuktikan tetapi untuk memperbaiki (Stufflebeam, H McKee and B McKee, 2003:118).
3. . Responsive Evaluation Model (Robert Stake's)