Elon Musk, pemilik media sosial X dan pendiri xAI, baru-baru ini menyampaikan pandangannya tentang perkembangan kecerdasan buatan (AI) yang dinilai telah mencapai titik jenuh informasi. Dalam sebuah percakapan siaran langsung dengan Ketua Stagwell, Mark Penn, Musk menjelaskan bahwa para pengembang AI telah menggunakan hampir seluruh data dunia nyata yang tersedia dan mulai beralih ke data sintetis sebagai solusi. "Kami sekarang pada dasarnya telah menghabiskan jumlah kumulatif pengetahuan manusia dalam pelatihan AI… Itu terjadi pada tahun lalu," ungkap Musk, yang diwartakan oleh Techcrunch pada 8 Januari.
Pernyataan Musk sejalan dengan pendapat sejumlah ahli AI lainnya, termasuk mantan Kepala Ilmuwan OpenAI, Ilya Sutskever, yang berpendapat bahwa industri AI telah mencapai puncak data. Menurut Sutskever, kurangnya data pelatihan dunia nyata akan menjadi tantangan yang memaksa perubahan besar dalam pola pengembangan model AI. Musk menekankan bahwa untuk melanjutkan tahap pengembangan AI yang lebih lanjut, diperlukan penggunaan data sintetis yang dihasilkan oleh model AI itu sendiri. "Satu-satunya cara untuk melengkapi data dunia nyata adalah dengan data sintetis, di mana AI menciptakan data pelatihan," katanya.
Berikut beberapa poin penting mengenai penggunaan data sintetis dalam pengembangan AI:
Data Sintetis untuk Pembelajaran Mandiri: Data sintetis memungkinkan AI tidak hanya untuk belajar dari data yang telah ada, tetapi juga untuk mengevaluasi dirinya sendiri dan melalui proses pembelajaran mandiri.
Kompetisi di Kalangan Perusahaan Besar: Banyak perusahaan besar, termasuk Microsoft, Meta, OpenAI, dan Anthropic, telah memanfaatkan data sintetis dalam proses pelatihan model-model AI mereka. Gartner memperkirakan pada 2024, sekitar 60% data yang digunakan dalam proyek AI dan analitik akan dihasilkan secara sintetis.
- Penghematan Biaya dalam Pengembangan Model: Contoh nyata dapat dilihat dari startup AI, Writer, yang mengklaim model Palmyra X 004 yang terbuat hampir seluruhnya dari data sintetis hanya memerlukan biaya sekitar US$700.000 (setara Rp 11,3 miliar). Biaya ini jauh lebih rendah dibandingkan perkiraan biaya model OpenAI dengan ukuran serupa yang mencapai US$4,6 juta (Rp 74,4 miliar).
Meskipun penggunaan data sintetis menawarkan beragam keuntungan, seperti penghematan biaya, juga ada tantangan yang perlu diperhatikan. Penelitian menunjukkan bahwa ketergantungan yang berlebihan pada data sintetis dapat menyebabkan keruntuhan model. Model AI yang terlalu bergantung pada data ini dapat kehilangan kreativitas dan meningkatkan kemungkinan bias, yang pada gilirannya dapat merusak fungsionalitasnya.
Selain itu, potensi bias dan batasan yang ada dalam data yang digunakan untuk melatih model membuat hasil yang dihasilkan bisa terkontaminasi dengan cara yang sama. Hal ini menyiratkan bahwa meskipun data sintetis menawarkan kemungkinan baru dalam pengembangan AI, pengembang harus berhati-hati dalam mengatur proporsi antara data nyata dan sintetis untuk menjaga kualitas dan integritas model AI.
Dengan pemikiran-pemikiran tersebut, pernyataan Elon Musk tentang pengembangan AI yang sudah mentok dan perlunya inovasi dalam penggunaan data sintetis menggambarkan tantangan baru yang harus dihadapi oleh industri teknologi. Sektor ini perlu beradaptasi dan menciptakan model yang lebih maju demi mengatasi batasan-batasan yang ada. Sepertinya, masa depan AI akan ditentukan tidak hanya oleh kemampuan untuk mengumpulkan dan menggunakan data secara efektif, namun juga bagaimana mengelola sumber daya ini dengan bijak.