Mohon tunggu...
Sucahya Tjoa
Sucahya Tjoa Mohon Tunggu... Konsultan - Lansia mantan pengusaha dan konsultan teknik aviasi, waktu senggang gemar tulis menulis. http://sucahyatjoa.blogspot.co.id/

Lansia mantan pengusaha dan konsultan teknik aviasi, waktu senggang gemar tulis menulis. http://sucahyatjoa.blogspot.co.id/

Selanjutnya

Tutup

Humaniora Pilihan

Seorang "Kutu Buku" Penyediri Usia 40 Tahun di Balik DeepSeek

30 Januari 2025   12:04 Diperbarui: 30 Januari 2025   12:08 492
+
Laporkan Konten
Laporkan Akun
Kompasiana adalah platform blog. Konten ini menjadi tanggung jawab bloger dan tidak mewakili pandangan redaksi Kompas.

Pada tahun 2022, Luo Fuli meninggalkan Alibaba DAMO Academy dan beralih ke firma ekuitas swasta terkenal, Huanfang Quantitative, untuk terlibat dalam pemodelan strategi terkait pembelajaran mendalam dan penelitian algoritma. Huanfang Quantitative adalah perusahaan yang berfokus pada investasi kuantitatif. Perusahaan ini didirikan pada tahun 2015 dan telah berkembang pesat menjadi dana ekuitas swasta dengan skala puluhan miliar.

Kemudian, Luo Fuli terjun ke DeepSeek sebagai peneliti pembelajaran mendalam dan berpartisipasi dalam pengembangan model besar MoE DeepSeek-V2. DeepSeek diinkubasi oleh Huanfang Quantitative dan didirikan pada April 2023. Ini adalah perusahaan teknologi inovatif yang berfokus pada pengembangan model bahasa besar (LLM) tingkat lanjut dan teknologi terkait.

Luo Fuli juga mengomentari tim DeepSeek: "Semua orang sangat luar biasa, dan saya sangat yakin bahwa pendirinya adalah yang paling cocok untuk kewirausahaan berbasis teknologi di Tiongkok." Model sumber terbuka DeepSeek V2 yang hemat biaya memicu perang harga untuk perusahaan besar model di Tiongkok dan dikenal sebagai "Pinduoduo AI".

Setelah merilis DeepSeek-V2, Luo Fuli menulis artikel di Zhihu, mengungkapkan pandangannya tentang DeepSeek-V2. Dia berkata, "Dalam hal tingkat model DeepSeek-V2 di Tiongkok, model ini benar-benar berada di eselon pertama model sumber tertutup di dalam dan luar negeri." "Selain itu, harga 1 yuan (RMB) per juta token input hanya 1/100 dari harga GPT4, yang sangat hemat biaya.".

Luo Fuli menikah setahun setelah lulus. Ia berbagi di akun publik pribadinya, "Saya adalah orang pertama di antara teman-teman sekelas saya yang menikah. Saya mendapatkan surat nikah kurang dari setahun setelah lulus."

Langkah besar Xiaomi! Terungkap cluster GPU 10.000 chip dibangun

Selain merekrut talenta, Xiaomi saat ini tengah membangun klaster GPU berisi 10.000 GPU, peningkatan signifikan dari sekitar 6.500 GPU saat tim model besarnya dibentuk. Rencana tersebut telah dilaksanakan selama beberapa bulan dan dipimpin oleh ketua kelompok Lei Jun. Terkait hal ini, pelapor sudah menghubungi pihak terkait dari Xiaomi untuk melakukan verifikasi, namun pihak lainnya tidak memberikan tanggapan.

Menurut Presiden Grup Xiaomi Lu Weibing, biaya R&D Xiaomi diperkirakan mencapai 24 miliar yuan (RMB) pada tahun 2024 dan akan naik menjadi 30 miliar yuan pada tahun 2025. Dia memperkirakan bahwa dalam lima tahun dari 2022 hingga 2026, investasi R&D Xiaomi akan melebihi 100 miliar yuan, terutama berfokus pada penelitian dan pengembangan tiga teknologi dasar: AI, OS, dan chip.

Dalam hal pembangunan tim AI, sejak Xiaomi mendirikan tim AI-nya pada tahun 2016, tim tersebut telah berkembang beberapa kali dan jumlah orang di bidang terkait telah mencapai lebih dari 3.000.

Lei Jun pernah mengatakan dalam pidato publik bahwa pendekatan Xiaomi dalam membangun model besar berbeda dari banyak perusahaan, dan bahwa terobosan utamanya adalah penerapan yang ringan dan lokal. Bagi perusahaan seperti Xiaomi yang menekankan "rasio harga-kinerja" dalam pembuatan ponsel dan mobil, cara menyeimbangkan biaya dalam bisnis model besar yang menghabiskan banyak uang tidak diragukan lagi merupakan isu inti yang dipertimbangkan Lei Jun. Ini mungkin juga menjadi alasan mengapa Lei Jun memilih Luo Fuli, yang memiliki latar belakang dalam penelitian dan pengembangan DeepSeek-V2.

Filosofi perekrutan DeepSeek yang tidak konvensional juga menarik perhatian. Perusahaan tersebut menghindari perekrutan kandidat dengan pengalaman lebih dari delapan tahun atau veteran industri yang terkenal, sebaliknya berfokus pada lulusan baru dan profesional awal karier dari universitas ternama. Menurut mitra perekrutan, DeepSeek percaya Profesional yang berpengalaman sering kali tidak memiliki ketangkasan dan kemauan untuk berinovasi, dan lebih memilih mempercayakan proyek-proyek penting kepada pendatang baru yang ambisius.

HALAMAN :
  1. 1
  2. 2
  3. 3
  4. 4
  5. 5
  6. 6
  7. 7
  8. 8
Mohon tunggu...

Lihat Konten Humaniora Selengkapnya
Lihat Humaniora Selengkapnya
Beri Komentar
Berkomentarlah secara bijaksana dan bertanggung jawab. Komentar sepenuhnya menjadi tanggung jawab komentator seperti diatur dalam UU ITE

Belum ada komentar. Jadilah yang pertama untuk memberikan komentar!
LAPORKAN KONTEN
Alasan
Laporkan Konten
Laporkan Akun