Read

Mengenal DeepSeek: AI Open Source yang Bersaing dengan ChatGPT dan Llama!

Perusahaan teknologi asal Cina, DeepSeek, baru-baru ini meluncurkan model kecerdasan buatan (AI) open source terbaru mereka, DeepSeek V3. Sejak perilisannya pada akhir tahun lalu, DeepSeek V3 telah menunjukkan performa yang sangat mengesankan, bahkan melampaui pesaing-pesaing terkemuka di industri AI seperti ChatGPT dan Llama 3.1.

DeepSeek V3 memiliki total 671 juta parameter, menjadikannya model AI dengan jumlah parameter terbanyak di antara semua model open source saat ini. Sebagai perbandingan, Llama 3.1 yang dikembangkan oleh Meta hanya memiliki 405 juta parameter. Jumlah parameter yang lebih banyak sering kali berhubungan langsung dengan kemampuan model dalam melakukan prediksi atau keputusan yang akurat. Seperti yang dilaporkan oleh TechCrunch, model yang memiliki lebih banyak parameter cenderung menunjukkan kinerja yang lebih baik ketimbang model dengan jumlah parameter lebih sedikit.

Meskipun DeepSeek V3 menunjukkan keunggulan dalam banyak aspek, model yang lebih besar ini juga memerlukan perangkat keras yang lebih kuat untuk beroperasi. Versi tidak dioptimalkan dari DeepSeek V3 memerlukan sejumlah GPU kelas atas agar dapat memberikan jawaban dengan kecepatan yang memadai.

Keunggulan DeepSeek V3 tidak hanya terlihat dalam jumlah parameter, tetapi juga dalam performanya pada berbagai kompetisi. Dalam pengujian kompetisi pengodean di platform Codeforces, DeepSeek berhasil mengungguli sejumlah model AI lain, termasuk GPT-4o dari OpenAI dan Qwen 2.5 dari Alibaba. Selain itu, dalam Aider Polyglot, yang menguji kemampuan menulis kode baru yang terintegrasi dengan kode yang sudah ada, DeepSeek V3 juga menunjukkan kemampuan luar biasa.

Kecepatan pemrosesan DeepSeek V3 juga patut dicatat, di mana model ini dapat memproses 60 token per detik, tiga kali lipat lebih cepat dibandingkan versi sebelumnya. Perusahaan menjelaskan bahwa DeepSeek V3 dilatih menggunakan 14,8 triliun token dataset. Dalam konteks ilmu data, token adalah unit dasar untuk mewakili data, dan satu juta token setara dengan sekitar 750.000 kata.

Dengan semua keunggulan tersebut, DeepSeek V3 tidak hanya menjadi alternatif menonjol bagi peneliti dan developer yang mencari model AI open source, tetapi juga menjadi ancaman serius bagi model-model AI terkemuka yang ada saat ini. Seiring dengan perkembangan teknologi AI yang terus berlanjut, kehadiran DeepSeek V3 mungkin akan turut membentuk lanskap kompetisi di dunia kecerdasan buatan.

Cung Media

Cung Media adalah portal berita dan media online yang menyajikan informasi terkini, menarik, dan viral seputar peristiwa lokal hingga nasional dengan gaya yang informatif dan mudah diakses.

Artikel Terkait

Back to top button