Pada posting yang lalu telah diulas tentang DeepSeek AI sebuah perusahaan start-up AI Tiongkok telah bikin goncang OpenAI-ChatGPT, Gemini-Google, dan Meta AI-Meta, sehingga telah menyebabkan mereka mengalami kerugian sebesar US$593 miliar hingga US$943 miliar di Wall Street. Baca:
Start-up AI DeepSeek Tiongkok Menggoncang Raksasa ChatGPT-OpenAI-Gemini Google-MetaAI Meta
Tiga tahun lalu, perusahaan hedge fund (dana lindung) nilai kuantitatif milik Liang Wenfeng meminta maaf sebesar-besarnya kepada para investor karena mengalami kerugian selama periode penuh gejolak bagi pasar saham Tiongkok.
Ini merupakan kegagalan yang mengejutkan bagi Zhejiang High-Flyer Asset Management, yang menggunakan kecerdasan buatan untuk memilih saham dan telah berkembang pesat menjadi salah satu dana kuantitatif terbesar di negara tersebut. Saat perusahaan tersebut melewati krisis tersebut dan asetnya menyusut lebih dari sepertiga dari puncaknya yang mencapai lebih dari US$12 miliar ($19,2 miliar), di balik layar, Liang tengah meletakkan dasar bagi perusahaan start-up (rintisan) AI baru, DeepSeek.
DeepSeek, yang tumbuh dari High-Flyer, kini mengancam untuk mengubah rantai pasokan kecerdasan buatan global dan menantang keunggulan AS yang tampaknya tak tergoyahkan dalam teknologi AI yang sangat penting. Popularitas mendadak dari teknologi terobosan perusahaan berusia 20 bulan tersebut dan aplikasi yang dinamai sesuai namanya memicu kejatuhan saham AS dan Eropa secara besar-besaran pada hari Senin (27 Jan 2025), menghapus hampir $US1 triliun nilai pasar gabungan dari raksasa chip Nvidia dan perusahaan sejenis lainnya.
Hal ini juga menimbulkan keterkejutan dan kekaguman atas bagaimana Liang, seorang lulusan teknik yang tidak pernah belajar atau bekerja di luar daratan Tiongkok, berhasil melakukan hal tersebut. Ia telah menunjukkan bahwa dengan insinyur kecerdasan buatan lokal, akses terbatas ke teknologi semikonduktor terkini, dan sumber daya terbatas, masih mungkin untuk menyamai dan bahkan melampaui  dari yang terbaik dunia di bidangnya.
"Setiap negara di dunia dapat menjalankan proyek semacam itu, jika mereka dapat memperoleh talenta dan mampu mengerjakannya, tentu saja. Industri lainnya akan belajar dari ini," kata Shuman Ghosemajumder, salah satu pendiri dan kepala eksekutif Reken, perusahaan rintisan AI yang berbasis di San Francisco.
Pertanyaan yang sekarang menjadi pegangan para investor, perusahaan, dan pembuat kebijakan adalah apakah kecerdasan buatan membutuhkan belanja modal ratusan miliar dolar untuk menghasilkan inovasi terbaru dan model AI terdepan, Â dan apakah kontrol ekspor (sanksi) dapat menahan persaingan Tiongkok.
Liang telah dibandingkan dengan pendiri OpenAI Sam Altman, tetapi warga negara Tiongkok itu tidak terlalu menonjolkan diri dan jarang berbicara di depan umum. "OpenAI bukanlah dewa dan tidak dapat selalu menjadi yang terdepan," kata Liang kepada media Tiongkok 36Kr pada bulan Juli 2024.
Tahun sebelumnya, Liang mengatakan lebih banyak investasi tidak selalu menghasilkan lebih banyak inovasi. Ia juga berpendapat tentang bagaimana perusahaan-perusahaan Tiongkok selama ini lebih banyak menjadi pengikut daripada inovator teknologi. Masalahnya adalah "kurangnya rasa percaya diri dan tidak tahu bagaimana mengatur talenta-talenta yang memiliki banyak keahlian untuk mencapai inovasi yang efektif," katanya.
Liang Wenfeng Seorang yang Berbeda
Liang lahir pada tahun 1985 di Zhanjiang, sebuah kota miskin di provinsi Guangdong, Tiongkok selatan. Ayahnya adalah seorang guru sekolah dasar. Ia belajar teknik elektronik di Universitas Zhejiang, sebuah perguruan tinggi bergengsi di kota Hangzhou, dan juga meraih gelar master di bidang teknik informasi dan komunikasi di sana.
High-Flyer merupakan sebuah anomali dalam industri kuantitatif Tiongkok seperti halnya DeepSeek di industri AI global.
Liang dan dua mantan teman sekelasnya di universitas mulai berkecimpung dalam saham domestik pada tahun 2008. Tidak seperti para pendiri sebagian besar dana kuantitatif Tiongkok, tidak satu pun dari mereka memiliki pengalaman perdagangan di luar negeri atau di lembaga.
Ketiganya mencoba berbagai strategi mulai dari perdagangan diskresioner hingga arbitrase, sebelum akhirnya memutuskan untuk menggunakan pendekatan sistematis untuk menerapkan ide perdagangan pada tahun 2015, tahun ketika mereka mendirikan High-Flyer. Awalnya mereka membangun model berdasarkan faktor harga dan volume, sebelum mencoba pembelajaran mesin pada tahun 2016. (untuk partnernya Luo Fuli akan diposting pada tulisan berikutnya)
Alat baru tersebut memungkinkan perusahaan untuk menggali lebih dalam guna menemukan faktor-faktor baru dan mengidentifikasi hubungan "non-linier" antara berbagai faktor, kata kepala eksekutifnya Simon Lu dalam sebuah wawancara pada tahun 2020. Para pendiri mengintegrasikan pembelajaran mesin ke dalam produk-produk High-Flyer pada tahun 2018.
AI memungkinkan High-Flyer untuk mencapai "banyak inovasi" dan mengembangkan model investasi multi-strategi dan multi-siklus untuk "menumpuk" laba dari berbagai sumber laba, menurut brosur perusahaan tahun 2020. Produk andalannya yang dibandingkan dengan Indeks CSI 500 mengintegrasikan strategi berisiko rendah seperti perdagangan intra-hari, yang memungkinkannya mengalahkan tolok ukur tersebut dengan gabungan 120 poin persentase dalam tiga tahun sebelumnya, demikian yang ditunjukkannya.
Akibatnya, aset High-Flyer tumbuh dengan cepat, mencapai lebih dari RMB 90 miliar yuan pada tahun 2021 sebelum merosot di akhir tahun itu.
Pada bulan Desember 2021, setelah mengalami rekor penarikan dana (drawdown) di beberapa dana (fund), High-Flyer mengatakan kecerdasan buatannya salah mengatur waktu beberapa perdagangan dan berkinerja buruk selama periode fluktuasi saham yang besar. "Kami merasa sangat bersalah," katanya kepada investor. Perusahaan tersebut juga berhenti menerima arus masuk baru dan mengatakan akan mengurangi aset yang dikelolanya dan menyesuaikan strateginya.
Tiga bulan kemudian, kepala pemasarannya memperingatkan bahwa klien tertentu yang sensitif terhadap volatilitas harus mencairkan uang mereka --- sebuah langkah yang sangat tidak biasa.
Tahun lalu, High-Flyer mengatakan akan menghentikan produk yang telah membuat taruhan dua arah di pasar, dan fokus pada strategi "long-only" di mana mereka hanya mengambil posisi bullish pada saham. Aset yang dikelolanya telah turun menjadi sekitar RMB 60 miliar yuan.
Menjadikan Pusat Penelitian
Penelitian DeepSeek didanai oleh anggaran R&D High-Flyer, kata Liang sebelumnya. Perusahaan itu menarik sumber daya komputasi dari dana kuantitatif, yang telah mengumpulkan 10.000 GPU Nvidia pada tahun 2021, sebelum larangan AS atas ekspor chip Nvidia yang canggih dan unit pemrosesan grafis lainnya.
Liang merekrut talenta teknik hampir secara eksklusif dari Tiongkok. Banyak di antara mereka yang baru lulus dari universitas ternama, pekerja magang di tahap akhir studi doktoral, dan peraih medali Olimpiade.
"Dia memang kutu buku, tetapi kutu buku dalam konteks ini bukan sesuatu yang negatif," kata Zihan Wang, mahasiswa PhD di Universitas Northwestern yang melakukan magang selama enam bulan di DeepSeek pada tahun 2024.
Wang mengatakan Liang menjalankan banyak eksperimen sendiri, dan DeepSeek beroperasi seperti laboratorium penelitian. "Awalnya kecil, tetapi seiring kemajuan nyata, mereka mulai bersemangat," katanya.
Perusahaan start-up itu mulai merilis model secara berkala, yang tampaknya kebal terhadap --- bahkan terpengaruh oleh --- larangan AS terhadap ekspor chip akselerator AI mutakhir.
DeepSeek merilis model penalaran (reasoning) AI canggih R1 pada tanggal 20 Januari 2025, hari yang sama saat Donald Trump dilantik sebagai presiden Amerika ke-47.
Sebelumnya pada hari Senin (27-Jan 2025), Liang menghadiri simposium bisnis tertutup di Beijing yang diselenggarakan oleh Perdana Menteri Tiongkok Li Qiang. Di sana, para pakar di bidang teknologi, sains, pendidikan, dan bidang lainnya menyampaikan pendapat dan saran mereka untuk rancangan laporan kerja pemerintah, menurut kantor berita resmi Xinhua.
Rekaman video di YouTube menunjukkan Liang duduk di seberang meja dari Li dan berbicara, sementara pemimpin Tiongkok itu mengangguk penuh perhatian.
Yang penting, DeepSeek membuka sumber R1-nya, yang memungkinkan para peneliti dan pengembang untuk menggunakan, memodifikasi, dan mengomersialkan model tersebut secara bebas. Hal itu mengirimkan sinyal bahwa DeepSeek ingin berkolaborasi dan berinovasi dengan pihak lain dalam komunitas AI global.
Liang menonjol di antara pengusaha Tiongkok karena tujuan nonkomersialnya, fokusnya yang tajam pada penelitian dan realisasi Kecerdasan Umum Buatan (AGI/ Artificial General Intelligence), kata Thomas Qitong Cao, asisten profesor kebijakan teknologi di Universitas Tufts.
Liang diasumsikan memiliki 51 persen saham High-Flyer. Berdasarkan analisis perbandingan, menurut Bloomberg Billionaires' Index, saham tersebut akan memberinya nilai US$71 juta. Jika DeepSeek mencapai potensi yang sama dengan OpenAI, yang bernilai sekitar US$150 miliar, pendirinya berpotensi mendapatkan keuntungan besar.
Beberapa pihak mempertanyakan apakah DeepSeek milik Liang sama menjanjikannya dengan yang terlihat. Kekurangannya meliputi kemampuan infrastruktur perusahaan start-up (rintisan) tersebut untuk menangani lalu lintas global yang menunggu untuk mencoba layanannya, atau penanganan aplikasi tersebut terhadap subjek-subjek sensitif yang sering dikaitan AS dan Barat dengan HAM dan Geopolitik.
Para ahli juga mempertanyakan asumsi bahwa DeepSeek membangun dengan 10.000 chip Nvidia A100, dengan analis seperti Dylan Patel berspekulasi bahwa DeepSeek membutuhkan setidaknya 50.000 chip Nvidia yang jauh lebih canggih, yaitu H100. Meta misalnya, mengoperasikan setara dengan 600.000 chip Nvidia H100.
Meski begitu, Liang mendorong pemikiran ulang dan kalibrasi ulang dalam ekosistem AI global. Jelas terlihat bahwa "Perlombaan AI tidak akan dimenangkan dengan menciptakan model yang paling canggih; tetapi akan dimenangkan dengan menanamkan AI ke dalam sistem bisnis untuk menghasilkan nilai ekonomi yang nyata," kata Mike Capone, kepala eksekutif Qlik, platform analisis data dan kecerdasan buatan.
Luo Fuli, gadis pasca-95 yang juga di balik DeepSeek
Startup AI asal Tiongkok DeepSeek telah menjungkirbalikkan pasar AI AS, dengan kenaikannya yang pesat sebagian berkat Luo Fuli, seorang peneliti berusia 29 tahun yang secara luas dianggap sebagai tokoh kunci dalam kesuksesan perusahaan tersebut. Luo, yang dijuluki "Si Ajaib AI" oleh media Tiongkok, baru-baru ini bergabung dengan Xiaomi di bawah kontrak menguntungkan yang dilaporkan bernilai jutaan yuan setiap tahunnya, menyusul kontribusi instrumentalnya terhadap kemajuan AI DeepSeek yang inovatif.
Didirikan pada tahun 2023 oleh Liang Wenfeng, DeepSeek telah muncul dengan cepat sebagai disruptor dalam lanskap AI global, mengembangkan model bahasa besar (LLM) yang sangat efisien dengan biaya yang jauh lebih murah dibandingkan pesaingnya. Model andalan perusahaan, DeepSeek-V2, diluncurkan pada bulan Mei 2024, telah digembar-gemborkan karena kemampuannya menyaingi ChatGPT meskipun ada kendala sumber daya yang diberlakukan oleh pembatasan ekspor chip Nvidia di AS. Keberhasilan DeepSeek mencapai puncaknya pada Januari 2025, ketika aplikasi chatbot AI-nya menyalip ChatGPT sebagai aplikasi gratis yang paling banyak diunduh di App Store milik Apple di AS.
Perjalanan Luo menggambarkan etos DeepSeek dalam membina bakat muda yang inovatif. Lahir di Sichuan, ia awalnya berjuang dalam ilmu komputer di Universitas Normal Beijing tetapi segera unggul, mendapatkan tempat di Institut Linguistik Komputasi Universitas Peking. Pada tahun 2019, ia telah menerbitkan delapan makalah di konferensi ACL yang bergengsi, mendorongnya ke posisi menonjol dalam komunitas penelitian AI.
Luo Fuli, gadis yang lahir pasca-95 yang dipekerjakan oleh Lei Jun dengan gaji tahunan RMB 10 juta yuan, resume-nya terekspos.
Lei Jun adalah pengusaha miliarder dan dermawan Tongkok, sebagai pendiri perusahaan elektronik terkenal dunia Xiaomi.
Seperti diketahui baru-baru ini, model skala besar domestik DeepSeek telah menjadi populer di seluruh dunia, dan juga membawa ketenaran pada "gadis jenius" AI pasca-95 Luo Fuli.
Dilaporkan bahwa pendiri Xiaomi Lei Jun merekrut Luo Fuli, salah satu pengembang utama model besar sumber terbuka DeepSeek-V2, dengan gaji tahunan puluhan juta untuk memimpin tim model besar AI Xiaomi.
Siapakah Luo Fuli di balik label seperti "gaji tahunan puluhan juta" dan "gadis jenius AI"? Apa latar belakang dan pengalaman Anda? Setelah lulus dengan gelar master, Luo Fuli bergabung dengan Laboratorium Kecerdasan Mesin di Alibaba DAMO Academy. Menurut Red Star Capital, Luo Fuli masuk ke Alibaba Damo Academy melalui Program Ali Star, yang merupakan tingkat tertinggi rekrutmen kampus untuk Alibaba Group, mirip dengan program "Genius Youth" Huawei. "Semua rekrutan kampus melalui Program Ali Star adalah yang terbaik dari hasil program tersebut."
Siapa Luo Fuli?
Reporter memilah latar belakang dan pengalamannya dan menemukan bahwa dia memiliki banyak label: diterima di Universitas Peking, menerbitkan artikel di konferensi-konferensi top, bergabung dengan Akademi Alibaba Damo, mengubah karier dan melompat ke perusahaan ekuitas swasta terkenal, menjadi sensasi dalam semalam di Zhihu, dll.
Dunia luar menyebutnya sebagai "gadis jenius AI", tetapi Luo Fuli yakin bahwa dia "benar-benar 'titik awal yang rendah' dalam bidang komputer.
Pada bulan Juni 2021, Luo Fuli mengunggah sebuah artikel di akun publik pribadinya yang memperkenalkan pengalaman pertumbuhannya, dengan mengatakan bahwa dia diterima di Universitas Normal Beijing dari sebuah sekolah menengah atas di sebuah kota kecil, dan secara tidak sengaja memasuki jurusan komputer.
Dia menuturkan: Saat pertama kali masuk kuliah, saya bingung dan tidak tahu harus berbuat apa. Peringkat akhir saya juga berada di posisi terbawah. Baru pada tahun kedua saya mulai perlahan-lahan bersemangat dan fokus belajar. Saya juga pernah dikritik karena "tidak memiliki bakat untuk penelitian ilmiah" dan pernah mempertimbangkan untuk beralih karier ke pengembangan produk di tahun terakhir saya.
Titik balik terjadi selama sekolah pascasarjana. Setelah Luo Fuli diterima di program linguistik komputasional Universitas Peking, ia menerbitkan delapan makalah (dua di antaranya adalah makalah penulis pertama) di ACL, konferensi internasional teratas di bidang kecerdasan buatan. Ia menjadi topik hangat di Zhihu dan menjadi sensasi dalam semalam.
Informasi publik menunjukkan bahwa Luo Fuli mempelajari ilmu komputer di Universitas Normal Beijing untuk gelar sarjananya dan memperoleh gelar master dalam linguistik komputasional dari Universitas Peking.
Setelah lulus dengan gelar master, Luo Fuli pertama kali bergabung dengan Alibaba DAMO Academy untuk melakukan penelitian kecerdasan buatan, terlibat dalam pekerjaan yang terkait dengan model bahasa yang telah dilatih sebelumnya, bertanggung jawab atas proyek sumber terbuka AliceMind Alibaba DAMO Academy, dan memimpin pengembangan multi- model pra-pelatihan bahasa VECO.
Pada tahun 2022, Luo Fuli bergabung dengan Huanfang Quantitative untuk terlibat dalam pemodelan strategi terkait pembelajaran mendalam dan penelitian algoritma, dan kemudian terjun ke DeepSeek sebagai peneliti pembelajaran mendalam, berpartisipasi dalam pengembangan model besar MoE DeepSeek-V2.
Gadis jenius AI (Luo Fuli)pernah berkata dia tidak ingin didewakan
Selama waktunya di Alibaba DAMO Academy, Luo Fuli bertanggung jawab atas proyek sumber terbuka AliceMind dan memimpin pengembangan model pra-pelatihan multibahasa VECO. Dia pernah berpartisipasi dalam Sesi Berbagi Komunitas Kecerdasan Buatan TechBeat sebagai insinyur algoritma senior di Laboratorium Kecerdasan Mesin Alibaba DAMO Academy.
Menurut kolom yang diterbitkan oleh TechBeat, saat Luo Fuli bercerita tentang pengalamannya dipuji sebagai "gadis AI jenius" di Zhihu, dia berkata bahwa dia tidak ingin didewakan atau dihibur dengan puji-pujian.
Pada tahun 2022, Luo Fuli meninggalkan Alibaba DAMO Academy dan beralih ke firma ekuitas swasta terkenal, Huanfang Quantitative, untuk terlibat dalam pemodelan strategi terkait pembelajaran mendalam dan penelitian algoritma. Huanfang Quantitative adalah perusahaan yang berfokus pada investasi kuantitatif. Perusahaan ini didirikan pada tahun 2015 dan telah berkembang pesat menjadi dana ekuitas swasta dengan skala puluhan miliar.
Kemudian, Luo Fuli terjun ke DeepSeek sebagai peneliti pembelajaran mendalam dan berpartisipasi dalam pengembangan model besar MoE DeepSeek-V2. DeepSeek diinkubasi oleh Huanfang Quantitative dan didirikan pada April 2023. Ini adalah perusahaan teknologi inovatif yang berfokus pada pengembangan model bahasa besar (LLM) tingkat lanjut dan teknologi terkait.
Luo Fuli juga mengomentari tim DeepSeek: "Semua orang sangat luar biasa, dan saya sangat yakin bahwa pendirinya adalah yang paling cocok untuk kewirausahaan berbasis teknologi di Tiongkok." Model sumber terbuka DeepSeek V2 yang hemat biaya memicu perang harga untuk perusahaan besar model di Tiongkok dan dikenal sebagai "Pinduoduo AI".
Setelah merilis DeepSeek-V2, Luo Fuli menulis artikel di Zhihu, mengungkapkan pandangannya tentang DeepSeek-V2. Dia berkata, "Dalam hal tingkat model DeepSeek-V2 di Tiongkok, model ini benar-benar berada di eselon pertama model sumber tertutup di dalam dan luar negeri." "Selain itu, harga 1 yuan (RMB) per juta token input hanya 1/100 dari harga GPT4, yang sangat hemat biaya.".
Luo Fuli menikah setahun setelah lulus. Ia berbagi di akun publik pribadinya, "Saya adalah orang pertama di antara teman-teman sekelas saya yang menikah. Saya mendapatkan surat nikah kurang dari setahun setelah lulus."
Langkah besar Xiaomi! Terungkap cluster GPU 10.000 chip dibangun
Selain merekrut talenta, Xiaomi saat ini tengah membangun klaster GPU berisi 10.000 GPU, peningkatan signifikan dari sekitar 6.500 GPU saat tim model besarnya dibentuk. Rencana tersebut telah dilaksanakan selama beberapa bulan dan dipimpin oleh ketua kelompok Lei Jun. Terkait hal ini, pelapor sudah menghubungi pihak terkait dari Xiaomi untuk melakukan verifikasi, namun pihak lainnya tidak memberikan tanggapan.
Menurut Presiden Grup Xiaomi Lu Weibing, biaya R&D Xiaomi diperkirakan mencapai 24 miliar yuan (RMB) pada tahun 2024 dan akan naik menjadi 30 miliar yuan pada tahun 2025. Dia memperkirakan bahwa dalam lima tahun dari 2022 hingga 2026, investasi R&D Xiaomi akan melebihi 100 miliar yuan, terutama berfokus pada penelitian dan pengembangan tiga teknologi dasar: AI, OS, dan chip.
Dalam hal pembangunan tim AI, sejak Xiaomi mendirikan tim AI-nya pada tahun 2016, tim tersebut telah berkembang beberapa kali dan jumlah orang di bidang terkait telah mencapai lebih dari 3.000.
Lei Jun pernah mengatakan dalam pidato publik bahwa pendekatan Xiaomi dalam membangun model besar berbeda dari banyak perusahaan, dan bahwa terobosan utamanya adalah penerapan yang ringan dan lokal. Bagi perusahaan seperti Xiaomi yang menekankan "rasio harga-kinerja" dalam pembuatan ponsel dan mobil, cara menyeimbangkan biaya dalam bisnis model besar yang menghabiskan banyak uang tidak diragukan lagi merupakan isu inti yang dipertimbangkan Lei Jun. Ini mungkin juga menjadi alasan mengapa Lei Jun memilih Luo Fuli, yang memiliki latar belakang dalam penelitian dan pengembangan DeepSeek-V2.
Filosofi perekrutan DeepSeek yang tidak konvensional juga menarik perhatian. Perusahaan tersebut menghindari perekrutan kandidat dengan pengalaman lebih dari delapan tahun atau veteran industri yang terkenal, sebaliknya berfokus pada lulusan baru dan profesional awal karier dari universitas ternama. Menurut mitra perekrutan, DeepSeek percaya Profesional yang berpengalaman sering kali tidak memiliki ketangkasan dan kemauan untuk berinovasi, dan lebih memilih mempercayakan proyek-proyek penting kepada pendatang baru yang ambisius.
Perekrutan Luo oleh Xiaomi pada akhir tahun 2024, yang kabarnya diatur oleh CEO Lei Jun, menyoroti meningkatnya permintaan akan talenta AI papan atas. Meskipun Luo telah menyatakan ketidaknyamanannya karena dimitologikan sebagai "AI Prodigy," dia telah menekankan kekuatan tim DeepSeek dan visi pendirinya untuk kewirausahaan yang didorong oleh inovasi.
Sumber: Media TV dan Tulisan Luar Negeri
https://www.bbc.com/zhongwen/articles/cj02eq1l7j5o/simp
https://news.qq.com/rain/a/20241231A05SJU00
https://www.dimsumdaily.hk/deepseek-disrupts-u-s-ai-market-as-xiaomi-recruits-ai-prodigy-luo-fuli/
Follow Instagram @kompasianacom juga Tiktok @kompasiana biar nggak ketinggalan event seru komunitas dan tips dapat cuan dari Kompasiana
Baca juga cerita inspiratif langsung dari smartphone kamu dengan bergabung di WhatsApp Channel Kompasiana di SINI