AI  

DeepSeek-V3-0324: Ancaman Baru bagi OpenAI dengan Performa Tinggi di Mac Studio

Ilustrasi Pertarungan AI
Ilustrasi Pertarungan AI

Kabarselatan.id – Startup AI asal Tiongkok, DeepSeek, kembali mengguncang industri kecerdasan buatan dengan peluncuran diam-diam model bahasa besar terbaru mereka, DeepSeek-V3-0324.

Model AI berukuran 641GB ini muncul di repositori Hugging Face tanpa pengumuman resmi, melanjutkan strategi DeepSeek dalam merilis teknologi canggih secara low-key.

Keunggulan utama dari model ini terletak pada lisensi MIT-nya, yang memungkinkan penggunaan komersial secara gratis, serta kemampuannya untuk berjalan langsung di perangkat Mac Studio dengan chip M3 Ultra.

Baca Juga: Google Resmi Luncurkan Gemini dengan Fitur Personalisasi, Apa yang Baru?

Menurut peneliti AI Awni Hannun, versi 4-bit dari model ini dapat menghasilkan lebih dari 20 token per detik pada perangkat tersebut, menandai perubahan besar dalam cara model bahasa besar dijalankan—dari pusat data berdaya tinggi ke perangkat pengguna.

Pendekatan Tak Terduga: Strategi Peluncuran DeepSeek yang Mengganggu Pasar AI

Berbeda dengan pendekatan perusahaan Barat yang biasanya diiringi dengan kampanye pemasaran besar, DeepSeek memilih untuk merilis DeepSeek-V3-0324 tanpa dokumen pendukung atau promosi apa pun.

Model ini hanya muncul dengan README kosong dan bobot modelnya sendiri, menciptakan gelombang spekulasi di kalangan komunitas AI.

Sejumlah penguji awal menyebut model ini mengalami peningkatan besar dibandingkan pendahulunya.

Seorang peneliti AI, Xeophon, bahkan menyatakan bahwa DeepSeek-V3-0324 kini menjadi model AI non-reasoning terbaik, mengalahkan Claude Sonnet 3.5 dari Anthropic, salah satu model AI komersial terkemuka.

Yang membuatnya semakin menarik, DeepSeek-V3-0324 tersedia secara bebas, tidak seperti Sonnet 3.5 yang hanya bisa diakses melalui langganan berbayar.

Jika klaim ini terbukti, DeepSeek bisa menjadi pesaing kuat bagi OpenAI dan perusahaan AI besar lainnya.

Arsitektur Revolusioner: Bagaimana DeepSeek-V3-0324 Mengalahkan Model Lain dengan Efisiensi Tinggi

Keunggulan utama dari DeepSeek-V3-0324 terletak pada arsitektur Mixture-of-Experts (MoE), yang memungkinkan model hanya mengaktifkan 37 miliar dari total 685 miliar parameter untuk tugas tertentu.

Ini memberikan kinerja setara dengan model berukuran penuh tetapi dengan kebutuhan daya dan komputasi yang jauh lebih rendah.

Selain itu, model ini mengusung dua teknologi terobosan:

  • Multi-Head Latent Attention (MLA): Memungkinkan model memahami konteks panjang dengan lebih baik.
  • Multi-Token Prediction (MTP): Meningkatkan kecepatan keluaran dengan menghasilkan beberapa token sekaligus dalam satu langkah, bukan satu per satu.

Berkat teknologi ini, DeepSeek-V3-0324 menghasilkan output hingga 80% lebih cepat, memungkinkan pengguna menjalankan model AI canggih dengan perangkat yang lebih hemat daya, seperti Mac Studio yang hanya menggunakan 200 watt saat inferensi—jauh lebih rendah dibandingkan pusat data berbasis GPU Nvidia yang bisa mencapai beberapa kilowatt.

Dampak Open-Source: Tiongkok Tantang Model AI Tertutup ala Silicon Valley

Strategi open-source yang diterapkan DeepSeek menyoroti perbedaan mendasar dalam pendekatan bisnis antara perusahaan AI di Tiongkok dan Barat.

Sementara OpenAI dan Anthropic membatasi akses model mereka melalui langganan berbayar, DeepSeek dan perusahaan Tiongkok lainnya memilih membagikan teknologi mereka secara bebas.

Pendekatan ini mempercepat inovasi di ekosistem AI Tiongkok dengan memungkinkan startup dan akademisi mengembangkan teknologi mutakhir tanpa investasi besar.

Bahkan raksasa teknologi seperti Baidu, Alibaba, dan Tencent mulai mengikuti tren ini dengan membuka akses ke model AI mereka.

Dengan akses terbatas ke GPU canggih dari Nvidia akibat pembatasan perdagangan, perusahaan AI Tiongkok semakin fokus pada efisiensi dan optimalisasi, menjadikan pendekatan mereka sebagai keunggulan kompetitif baru.

DeepSeek-R2: Pesaing Langsung GPT-5 yang Akan Segera Hadir?

Berdasarkan pola perilisan sebelumnya, DeepSeek-V3-0324 kemungkinan besar adalah fondasi bagi model reasoning DeepSeek-R2, yang diperkirakan akan rilis dalam dua bulan ke depan.

Jika benar, ini bisa menjadi tantangan langsung bagi GPT-5, model unggulan OpenAI yang juga dirumorkan akan segera hadir.

Saat ini, model reasoning seperti OpenAI o1 dan DeepSeek-R1 merupakan puncak kecerdasan buatan dalam pemecahan masalah kompleks.

Baca Juga: Apple Resmi Tunda Pembaruan Siri Berbasis AI, Peluncuran Dijadwalkan Tahun Depan

Dengan membuat teknologi ini tersedia secara gratis, DeepSeek berpotensi mendemokratisasi akses ke AI tingkat lanjut, yang sebelumnya hanya dapat dimanfaatkan oleh perusahaan besar dengan anggaran besar.

Jika DeepSeek-R2 berhasil menyaingi GPT-5 dalam reasoning dan efisiensi daya, ini akan semakin mengukuhkan posisi Tiongkok sebagai pesaing utama dalam pengembangan AI global.

Masa Depan AI Terbuka vs. Tertutup

Peluncuran DeepSeek-V3-0324 menandai pergeseran besar dalam dunia kecerdasan buatan. Dengan performa tinggi, lisensi gratis, dan efisiensi daya yang luar biasa, model ini membuka kemungkinan baru dalam pengembangan AI tanpa ketergantungan pada pusat data besar.

Strategi open-source DeepSeek mencerminkan persaingan ideologis antara model AI terbuka ala Tiongkok dan model tertutup yang dipimpin Silicon Valley.

Jika tren ini berlanjut, perusahaan yang membagikan teknologinya secara luas mungkin akan memiliki pengaruh lebih besar dalam membentuk masa depan AI.

Bagi OpenAI dan perusahaan AI Barat lainnya, DeepSeek kini bukan lagi sekadar pesaing, melainkan ancaman nyata yang bisa mengubah peta persaingan industri kecerdasan buatan di tingkat global.

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *