DeepSeek China: Lebih Murah dari ChatGPT, Tapi Akurasi Jadi Sorotan!

Dalam industri teknologi saat ini, kecerdasan buatan (AI) menjadi topik yang sangat populer, dan di antara aplikasi mobile AI, DeepSeek dari China berhasil meraih perhatian sebagai salah satu aplikasi gratis paling terfavorit di App Store, mengalahkan ChatGPT. Meskipun DeepSeek dikembangkan dengan biaya yang jauh lebih rendah dibandingkan dengan pengembangan ChatGPT oleh OpenAI dan Gemini oleh Google, namun hasil uji akurasi menunjukkan bahwa harga yang lebih murah sering kali berbanding lurus dengan kualitas yang ditawarkan.

Sebuah laporan dari NewsGuard mengungkapkan fakta mengejutkan tentang performa DeepSeek yang ternyata sangat mengecewakan dalam menyampaikan berita dan informasi. DeepSeek hanya berhasil memberikan jawaban yang akurat sebanyak 17% dari total 300 pertanyaan yang digunakan dalam pengujian, membuatnya terjatuh pada posisi kesepuluh dari sebelas chatbot AI yang diuji, termasuk ChatGPT dan Gemini. Lebih mengkhawatirkan lagi, 30% dari semua tanggapan yang diberikan DeepSeek mengandung klaim palsu, dan lebih dari setengah waktu, yaitu 53%, ia memberikan jawaban yang samar atau tidak berguna terkait permintaan yang berhubungan dengan berita.

Data berikut menggambarkan performa DeepSeek dalam pengujian akurasi yang dilakukan:

1. Akurasi jawaban: 17%
2. Tanggapan dengan klaim palsu: 30%
3. Jawaban tidak berguna: 53%
4. Tingkat kegagalan secara keseluruhan: 87%
5. Tingkat kegagalan Western AI (seperti ChatGPT dan Gemini): 62%

Klaim dari DeepSeek yang menyatakan bahwa teknologi di balik chatbot tersebut memberi kinerja yang setara atau bahkan lebih baik daripada ChatGPT dengan biaya yang jauh lebih rendah kini dipertanyakan oleh penelitian NewsGuard. Pengujian tersebut meliputi 300 prompt yang sama dengan yang digunakan untuk menguji ChatGPT dan Gemini, di mana 30 di antaranya didasarkan pada klaim palsu yang ditemukan secara daring. Beberapa topik dalam prompt tersebut termasuk isu sensitif seperti pembunuhan CEO UnitedHealthcare, Brian Thompson, dan jatuhnya pesawat Azerbaijan Airlines flight 8243.

Gil Luria, seorang analis dari D.A. Davidson, menegaskan bahwa “pentingnya terobosan DeepSeek bukan terletak pada kemampuan menjawab pertanyaan terkait berita Tiongkok dengan akurat, melainkan pada fakta bahwa ia dapat menjawab segala pertanyaan dengan biaya 1/30 dari model AI sebanding.” Namun, temuan ini menjadi sorotan karena dalam tiga dari sepuluh prompt yang didasarkan pada klaim palsu, DeepSeek cenderung mereproduksi posisi pemerintah Tiongkok tanpa adanya penyebutan mengenai China dalam prompt tersebut. Misalnya, dalam menanggapi prompt tentang kecelakaan pesawat Azerbaijan Airlines, chatbot itu mengambil posisi Beijing meskipun tidak ada kaitan langsung dengan Tiongkok.

Dengan pengujian yang menunjukkan hasil yang memprihatinkan, potensi DeepSeek untuk menjadi pesaing utama dalam pasar chatbot AI yang lebih luas kini dipertanyakan. Meskipun menawarkan biaya pengoperasian yang rendah, tingkat keakuratan dan keandalan informasi tetap menjadi perhatian bagi pengguna yang mencari solusi AI yang efektif. Hal ini memberikan pelajaran berharga bahwa terkadang, “Anda mendapatkan apa yang Anda bayar” dalam dunia teknologi yang terus berkembang dan kompetitif ini.

Bagas Saputra30/01/2025

Follow Kami