SVR) adalah teknik yang kuat untuk melakukan forecasting atau prediksi berdasarkan data historis. Metode ini berdasarkan pada Support Vector Machine (SVM) yang diperluas untuk menangani kasus regresi. Dalam artikel ini, kita akan menjelaskan konsep SVR serta parameter-parameter yang digunakan dalam proses forecasting, seperti C, gamma, epsilon, fungsi kernel, cross validation, dan time steps.
Dalam analisis prediktif, Support Vector Regression (Konsep Dasar SVR
SVR bertujuan untuk menemukan fungsi regresi \( f(x) \) yang mendekati sebanyak mungkin data training, sambil mempertahankan margin sejauh mungkin dari data itu sendiri. Margin di sini adalah batas jarak dari data yang diizinkan untuk berada di sekitar garis regresi.
Parameter SVR
1. Parameter C : C adalah parameter regulasi yang mengontrol penalti untuk kesalahan model. Semakin besar nilai C, semakin besar penalti untuk kesalahan yang terjadi. Nilai yang lebih kecil untuk C akan menghasilkan margin yang lebih besar.
2. Parameter Gamma: Gamma (γ) mengontrol pengaruh sebuah titik data. Nilai gamma yang tinggi menunjukkan bahwa hanya titik data yang sangat dekat dengan garis pemisah yang diperhatikan, sementara nilai gamma yang rendah menunjukkan bahwa titik data yang lebih jauh juga diperhitungkan.
3. Parameter Epsilon: Epsilon (ε) menentukan toleransi kesalahan yang diizinkan dalam model. Ini adalah batas yang menunjukkan seberapa jauh kesalahan dapat diizinkan sebelum model mulai menganggapnya signifikan dan mulai menyesuaikan diri.
4. Fungsi Kernel: Fungsi kernel adalah fungsi matematika yang digunakan untuk mengubah ruang fitur menjadi ruang dimensi yang lebih tinggi. Fungsi kernel yang umum digunakan adalah linear, polinomial, dan radial basis function (RBF).
5. Cross Validation: Cross validation adalah teknik yang digunakan untuk mengevaluasi kinerja model dengan membagi dataset menjadi subset yang lebih kecil. Ini membantu menghindari overfitting dan memberikan perkiraan yang lebih baik tentang kinerja model pada data yang tidak terlihat.
6. Time Steps: Time steps adalah parameter yang relevan terutama dalam kasus forecasting time series data. Ini mengacu pada jumlah langkah waktu atau interval waktu yang digunakan dalam pemodelan.
Implementasi dalam Python