HANGZHOU (Arrahmah.id) – Setelah menimbulkan gelombang kejutan dengan model AI yang memiliki kemampuan yang menyaingi kreasi Google dan OpenAI, DeepSeek asal Tiongkok menghadapi pertanyaan tentang apakah klaimnya yang berani dapat dipertanggungjawabkan.
Pengumuman perusahaan rintisan yang berbasis di Hangzhou ini bahwa mereka mengembangkan R1 dengan biaya yang jauh lebih murah daripada model-model terbaru di Silicon Valley segera mempertanyakan asumsi-asumsi tentang dominasi Amerika Serikat di bidang AI dan valuasi pasar yang sangat tinggi dari perusahaan-perusahaan teknologi terkemuka.
Namun, beberapa orang yang skeptis telah menantang pernyataan DeepSeek bahwa mereka bekerja dengan anggaran terbatas, menunjukkan bahwa perusahaan ini kemungkinan besar memiliki akses ke chip yang lebih canggih dan lebih banyak dana daripada yang mereka akui.
“Ini adalah pertanyaan terbuka apakah klaim DeepSeek dapat diterima begitu saja. Komunitas AI akan menggali lebih dalam dan kita akan mengetahuinya,” ujar Pedro Domingos, profesor emeritus ilmu komputer dan teknik di University of Washington, kepada Al Jazeera.
“Masuk akal bagi saya bahwa mereka dapat melatih sebuah model dengan dana sebesar $6 juta,” tambah Domingos.
“Namun, sangat mungkin juga bahwa itu hanyalah biaya penyempurnaan dan pasca-pemrosesan model yang lebih mahal, sehingga DeepSeek tidak dapat melakukannya tanpa membangun model yang lebih mahal dari pihak lain.”
Dalam sebuah makalah penelitian yang dirilis minggu lalu, tim pengembangan DeepSeek mengatakan bahwa mereka telah menggunakan 2.000 GPU Nvidia H800 – chip yang kurang canggih yang awalnya dirancang untuk memenuhi kontrol ekspor AS – dan menghabiskan $ 5,6 juta untuk melatih model dasar R1, V3.
CEO OpenAI, Sam Altman, mengatakan bahwa biaya yang dihabiskan untuk melatih chatbot GPT-4 lebih dari $100 juta, sementara analis memperkirakan bahwa model ini menggunakan 25.000 GPU H100 yang lebih canggih.
Pengumuman oleh DeepSeek, yang didirikan pada akhir 2023 oleh pengusaha serial Liang Wenfeng, menjungkirbalikkan keyakinan yang dipegang secara luas bahwa perusahaan yang ingin menjadi yang terdepan dalam AI perlu menginvestasikan miliaran dolar di pusat data dan chip kelas atas yang mahal dalam jumlah besar.
Hal ini juga menimbulkan pertanyaan tentang efektivitas upaya Washington untuk membatasi sektor AI Cina dengan melarang ekspor chip paling canggih.
Saham Nvidia yang berbasis di California, yang memegang hampir monopoli atas pasokan GPU yang memberi daya pada AI, pada Senin anjlok 17 persen, menghapus hampir $ 583 miliar dari nilai pasar raksasa chip tersebut -angka yang sebanding dengan produk domestik bruto (PDB) Swedia.
Meskipun ada konsensus luas bahwa rilis DeepSeek R1 setidaknya merupakan pencapaian yang signifikan, beberapa pengamat terkemuka telah memperingatkan agar tidak menerima klaimnya begitu saja.
Palmer Luckey, pendiri perusahaan virtual reality Oculus VR, pada Rabu melabeli anggaran yang diklaim DeepSeek sebagai “palsu” dan menuduh terlalu banyak “orang bodoh yang berguna” yang terjerumus ke dalam “propaganda Tiongkok”.
“Ini didorong oleh hedge fund Tiongkok untuk memperlambat investasi di perusahaan rintisan AI Amerika, melayani kepentingan mereka sendiri terhadap raksasa Amerika seperti Nvidia, dan menyembunyikan penghindaran sanksi,” kata Luckey dalam sebuah posting di X.
“Amerika adalah tempat tidur yang subur bagi para psikopat seperti ini karena aparatus media kita membenci perusahaan-perusahaan teknologi kita dan ingin melihat Presiden Trump gagal.”
Dalam sebuah wawancara dengan CNBC pekan lalu, Alexandr Wang, CEO Scale AI, juga meragukan pernyataan DeepSeek, dengan mengatakan bahwa ia “memahami” bahwa perusahaan tersebut memiliki akses ke 50.000 chip H100 yang lebih canggih yang tidak dapat dibicarakan karena kontrol ekspor AS.
Wang tidak memberikan bukti untuk klaimnya.
Miliarder teknologi Elon Musk, salah satu orang kepercayaan terdekat Presiden AS Donald Trump, mendukung skeptisisme DeepSeek, menulis “Jelas” di X di bawah sebuah posting tentang klaim Wang.
DeepSeek tidak menanggapi permintaan komentar.
Namun Zihan Wang, seorang kandidat PhD yang bekerja pada model DeepSeek sebelumnya, membalas para pengkritik perusahaan rintisan tersebut, dengan mengatakan, “Bicara itu murah.”
“Sangat mudah untuk mengkritik,” kata Wang di X dalam menanggapi pertanyaan dari Al Jazeera tentang saran bahwa klaim DeepSeek tidak boleh diterima begitu saja.
“Jika mereka menghabiskan lebih banyak waktu untuk mengerjakan kode dan mereproduksi ide DeepSeek sendiri, itu akan lebih baik daripada hanya berbicara di atas kertas,” tambah Wang, menggunakan terjemahan bahasa Inggris dari sebuah ungkapan dalam bahasa Mandarin tentang orang-orang yang terlibat dalam omong kosong.
Dia tidak menanggapi secara langsung pertanyaan tentang apakah dia yakin DeepSeek telah menghabiskan kurang dari $ 6 juta dan menggunakan chip yang kurang canggih untuk melatih model dasar R1.
Dalam sebuah wawancara pada 2023 dengan outlet media Tiongkok, Waves, Liang mengatakan bahwa perusahaannya telah menimbun 10.000 chip Nvidia A100 -yang lebih tua dari H800- sebelum pemerintahan Presiden AS saat itu, Joe Biden, melarang ekspor chip tersebut.
Para pengguna R1 juga menunjukkan keterbatasan yang dihadapinya karena asalnya dari Tiongkok, yaitu penyensoran terhadap topik-topik yang dianggap sensitif oleh Beijing, termasuk pembantaian di Lapangan Tiananmen pada 1989 dan status Taiwan.
Sebagai tanda bahwa kepanikan awal mengenai potensi dampak DeepSeek terhadap sektor teknologi AS sudah mulai surut, harga saham Nvidia pada Selasa pulih hampir 9%.
Indeks Nasdaq 100 yang sangat dipengaruhi oleh teknologi naik 1,59 persen setelah turun lebih dari 3 persen pada hari sebelumnya.
Tim Miller, seorang profesor yang berspesialisasi dalam bidang AI di University of Queensland, mengatakan bahwa sulit untuk mengatakan seberapa besar kepercayaan yang harus diberikan pada klaim DeepSeek.
“Model itu sendiri memberikan beberapa detail tentang cara kerjanya, tetapi biaya perubahan utama yang mereka klaim -yang saya pahami- tidak terlalu banyak muncul dalam model itu sendiri,” kata Miller kepada Al Jazeera.
Miller mengatakan bahwa ia tidak melihat adanya “lonceng peringatan”, namun ada argumen yang masuk akal untuk mendukung atau menentang kepercayaan terhadap makalah penelitian tersebut.
“Terobosan ini luar biasa -hampir seperti ‘terlalu bagus untuk menjadi kenyataan’. Perincian biayanya tidak jelas,” kata Miller.
Di sisi lain, katanya, terobosan memang kadang-kadang terjadi dalam ilmu komputer.
“Model-model berskala masif ini adalah fenomena yang sangat baru, jadi efisiensi pasti akan ditemukan,” kata Miller.
Penurunan biaya
Lucas Hansen, salah satu pendiri lembaga nirlaba CivAI, mengatakan bahwa meskipun sulit untuk mengetahui apakah DeepSeek menghindari kontrol ekspor AS, anggaran pelatihan yang diklaim oleh perusahaan rintisan ini mengacu pada V3, yang secara kasar setara dengan GPT-4 milik OpenAI, bukan R1 itu sendiri.
“GPT-4 selesai dilatih pada akhir 2022. Ada banyak peningkatan algoritme dan perangkat keras sejak 2022, sehingga menurunkan biaya pelatihan model sekelas GPT-4. Situasi serupa terjadi pada GPT-2. Pada saat itu, pelatihannya membutuhkan biaya yang besar, tetapi sekarang Anda dapat melatihnya dengan biaya $20 dalam waktu 90 menit,” kata Hansen kepada Al Jazeera.
“DeepSeek membuat R1 dengan mengambil model dasar -dalam hal ini, V3- dan menerapkan beberapa metode cerdas untuk mengajarkan model dasar tersebut untuk berpikir lebih hati-hati,” tambah Hansen.
“Proses pengajaran ini relatif murah jika dibandingkan dengan harga pelatihan model dasar. Sekarang DeepSeek telah mempublikasikan rincian tentang bagaimana cara melakukan bootstrap pada model dasar menjadi model berpikir, kita akan melihat banyak sekali model berpikir yang baru.” (haninmazaya/arrahmah.id)