Meningkatkan Pengalaman Pengguna Baru dengan Rekomendasi Cerdas melalui M3RecÂ
Sistem rekomendasi telah menjadi salah satu elemen penting dalam era digital saat ini, di mana personalisasi dan prediksi preferensi pengguna memainkan peran signifikan dalam meningkatkan pengalaman pelanggan. Artikel yang berjudul "M3Rec: A Context-Aware Offline Meta-Level Model-Based Reinforcement Learning Approach for Cold-Start Recommendation" karya Yanan Wang, Yong Ge, Zhepeng Li, Li Li, dan Rui Chen (2024) dari University of Arizona dan Samsung Research America, mengangkat solusi yang menarik untuk mengatasi masalah klasik pada sistem rekomendasi, yakni cold-start. Cold-start terjadi ketika sistem dihadapkan pada pengguna baru yang memiliki data interaksi yang sangat terbatas, sehingga sistem kesulitan memberikan rekomendasi yang relevan.
Sistem rekomendasi berbasis reinforcement learning (RL) adalah salah satu metode yang menjanjikan, karena mampu memaksimalkan minat jangka panjang pengguna. Namun, tantangan utama dari metode ini adalah kebutuhan akan sejumlah besar interaksi dari setiap pengguna untuk melatih kebijakan rekomendasi yang efektif. Dalam dunia nyata, terutama dalam situasi cold-start, mengumpulkan data dalam jumlah besar untuk pengguna baru adalah hal yang sulit dan mahal. Oleh karena itu, artikel ini memberikan solusi dengan memperkenalkan pendekatan meta-level yang berbasis model-based reinforcement learning (MBRL), di mana data historis offline dapat digunakan untuk melatih model tanpa perlu interaksi langsung dengan pengguna secara online.
Dengan demikian, artikel ini menawarkan kontribusi yang penting dalam ekosistem rekomendasi berbasis RL, terutama dalam hal efisiensi adaptasi terhadap pengguna baru. Pendekatan ini tidak hanya menarik secara teoritis, tetapi juga menawarkan manfaat praktis dalam berbagai skenario aplikasi, dari e-commerce hingga platform streaming, di mana personalisasi dan relevansi konten merupakan kunci sukses.
***
Pendekatan M3Rec yang diusulkan dalam artikel ini mengandalkan teknik meta-learning untuk mengatasi tantangan cold-start dengan data terbatas. Salah satu inovasi utama dari pendekatan ini adalah penggunaan variabel konteks pengguna. Variabel ini dirancang untuk menangkap informasi terbatas, seperti atribut demografis atau beberapa interaksi awal, dan kemudian menerjemahkannya ke dalam preferensi yang lebih umum yang bisa digunakan oleh sistem rekomendasi. Dengan cara ini, model dapat beradaptasi dengan pengguna baru meskipun hanya memiliki sedikit data. Teknik ini didasarkan pada pembelajaran meta-level, di mana model dilatih untuk mengenali pola umum di berbagai pengguna dan menerapkannya pada situasi baru.
Metode ini sangat efisien dibandingkan dengan pendekatan tradisional yang memerlukan sejumlah besar data dari interaksi pengguna. Dalam penelitian ini, mereka menguji model M3Rec dengan dua dataset utama, yaitu MovieLens dan Last.fm. Hasilnya, metode ini terbukti unggul dibandingkan baseline lainnya, dengan peningkatan performa yang signifikan. Sebagai contoh, pada dataset Last.fm, pendekatan M3Rec mampu meningkatkan hit ratio (HR) sebesar 15,58% dan normalized discounted cumulative gain (NDCG) sebesar 17,15% dibandingkan metode terbaik sebelumnya. Angka-angka ini mengindikasikan bahwa *M3Rec* tidak hanya efektif dalam skenario simulasi, tetapi juga menunjukkan kinerja yang lebih baik dalam situasi dunia nyata dengan data yang beragam.
Tidak hanya itu, pendekatan offline reinforcement learning yang digunakan dalam penelitian ini juga mengurangi biaya operasional, terutama dalam hal interaksi pengguna yang mahal dan memakan waktu. Dalam beberapa kasus, model tradisional memerlukan ratusan atau bahkan ribuan interaksi untuk mencapai kebijakan rekomendasi yang optimal. Sebaliknya, M3Rec dapat mempelajari preferensi pengguna hanya dari data historis offline tanpa perlu interaksi langsung. Dengan demikian, ini dapat menghemat sumber daya secara signifikan, yang sangat penting dalam lingkungan bisnis yang dinamis.
Selain manfaat dari efisiensi data, M3Rec juga memperkenalkan regularisasi mutual information antara model pengguna dan agen rekomendasi, yang mendorong model untuk membuat rekomendasi yang lebih akurat berdasarkan data yang tersedia. Hal ini memastikan bahwa model tetap beroperasi dalam "zona aman" data yang sudah dipelajari, mengurangi risiko bias atau rekomendasi yang tidak akurat ketika dihadapkan dengan situasi yang jarang terjadi dalam data offline.
***
Secara keseluruhan, pendekatan M3Rec yang dikembangkan oleh Wang et al. (2024) menawarkan inovasi yang signifikan dalam dunia sistem rekomendasi berbasis reinforcement learning, khususnya dalam mengatasi masalah cold-start. Dengan memanfaatkan pembelajaran meta-level dan data historis offline, model ini mampu beradaptasi lebih cepat dengan pengguna baru tanpa perlu interaksi yang intensif. Ini bukan hanya efisiensi dalam hal biaya dan waktu, tetapi juga memberikan solusi yang lebih relevan dan tepat bagi pengguna baru, yang sering kali menjadi tantangan dalam berbagai aplikasi rekomendasi.