Mohon tunggu...
Wiwik Agustina
Wiwik Agustina Mohon Tunggu... Lainnya - Writer and Long Life Learner

Concern about Self Development and Poverty. Welcome to My Universe! From science to digital marketer. I believe that humans do what they think, and think what they believe, let's start changing our thoughts through sentences.

Selanjutnya

Tutup

Artificial intelligence Pilihan

Apa itu Knowledge Distillation dari Kemunculan DeepSeek, Apa dan Bagaimana Kerjanya?

30 Januari 2025   15:55 Diperbarui: 30 Januari 2025   15:55 60
+
Laporkan Konten
Laporkan Akun
Kompasiana adalah platform blog. Konten ini menjadi tanggung jawab bloger dan tidak mewakili pandangan redaksi Kompas.
Lihat foto
Ilustrasi Machine Learning (Source: deepai.org)

Sama dengan penjelasan diatas, proses knowledge distillation melibatkan beberapa langkah utama, seperti:

 1. Model LLM yang Kredibel (OpenAI-GPT)

Memiliki parameter yang kompleks yang telah dilatih dalam menggunakan data dalam jumlah besar, perannya disini adalah sebagai profesor. Terbukti dapat melakukan berbagai tugas, seperti menghasilkan teks, gambar, menganalisa, mengklasifikasikan data, dan lainnya sesuai dengan prompt atau perintah.

2. Mempelajari Soft Output

Alih-alih meniru jawaban spesifik dari prompt yang diberikan, model AI kedua yang berperan sebagai mahasiswa magang, yang belajar dari soft output dari profesor. Apa itu soft output? Adalah distribusi probabilitas yang dihasilkan oleh model profesor dari suatu input tertentu. 

Misalnya, input yang dihasilkan adalah "Apa ibu kota Perancis?", GPT kemungkinan akan menampilkan distribusi probabilitas seperti Paris, London, atau Roma, dimana Paris sebagai jawaban yang paling mungkin. Jadi, memperkirakan distribusi probabilitas adalah tahap kedua.

3. Melatih Target atau 'mahasiswa magang'

Proses menyesuaikan parameter internal sehingga probabilitas yang dihasilkan sesuai dengan 'sumber' atau profesor meskipun jumlah parameter lebih sedikit dan komputasinya lebih sederhana. Pada tahap ini, diukur akurasi dari hasil 'profesor' dan 'mahasiswa magang'.

4. Penyempurnaan 

Tahapan ini dilakukan untuk mengkhususkan diri pada tugas dan kumpulan data tertentu, sehingga dapat dipastikan bahwa model 'mahasiswa magang' memiliki performa baik dalam tugas yang diberikan, seperti menjawab pertanyaan spesifik atau menganalisa data.

Dari penjelasan diatas, akan menjawab pertanyaan 'Apakah memungkinkan dilakukan dalam 55 hari?', dan jawabannya adalah mungkin. Namun, jangka waktu ini juga tergantung pada kompleksitas model, data , parameter, sumber daya komputasi, dan lainnya.

Tentunya, masuk akan jika akurasi DeepSeek masih di angka 17%, namun ini menjadi awal mula perang ekonomi antara Amerika Serikat dengan Tiongkok. Lantas, apa hal yang bisa kita pelajari dari hadirnya DeepSeek? Bahwa kedaulatan sebuah negara perlu diperjuangkan.

Saya banyak belajar dari gebrakan negara Tiongkok, bagaimana mendidik warga negaranya, memprioritaskan pendidikan dan berusaha untuk berdaulat secara ekonomi. Jadi benar peribahasa untuk 'Tuntutlah ilmu sampai ke negeri Cina', karena hari ini Cina terbukti menjadi negara maju, dengan kemajuan teknologi, ekonomi, dan ilmu pengetahuan.

Referensi:

Follow Instagram @kompasianacom juga Tiktok @kompasiana biar nggak ketinggalan event seru komunitas dan tips dapat cuan dari Kompasiana
Baca juga cerita inspiratif langsung dari smartphone kamu dengan bergabung di WhatsApp Channel Kompasiana di SINI

HALAMAN :
  1. 1
  2. 2
Mohon tunggu...

Lihat Konten Artificial intelligence Selengkapnya
Lihat Artificial intelligence Selengkapnya
Beri Komentar
Berkomentarlah secara bijaksana dan bertanggung jawab. Komentar sepenuhnya menjadi tanggung jawab komentator seperti diatur dalam UU ITE

Belum ada komentar. Jadilah yang pertama untuk memberikan komentar!
LAPORKAN KONTEN
Alasan
Laporkan Konten
Laporkan Akun