Alibaba Cloud Buka Akses Open Source untuk Model AI Terbaru

Alibaba Cloud telah resmi membuka akses open-source untuk model kecerdasan buatan (AI) penghasil konten video dalam upayanya mendukung komunitas open-source. Dalam pengumumannya, perusahaan cloud asal Tiongkok ini menghadirkan empat model dari seri Wan2.1, yang merupakan versi terbaru dari model dasar video Tongyi Wanxiang (Wan) dengan parameter mencapai 14 miliar dan 1,3 miliar.

Keempat model ini meliputi T2V-14B, T2V-1.3B, I2V-14B-720P, dan I2V-14B-480P. Model-model tersebut dirancang untuk menghasilkan gambar dan konten video berkualitas tinggi berdasarkan input teks maupun gambar. Para akademisi, peneliti, dan institusi komersial kini dapat mengunduh model-model ini melalui komunitas model AI Alibaba Cloud, Model Scope, serta platform kolaboratif AI Hugging Face.

Seri Wan2.1 yang diluncurkan awal tahun ini menjadi model penghasil konten video pertama yang mendukung efek teks dalam bahasa Mandarin dan Inggris. Model ini menonjol dalam menghasilkan visual yang realistis, menangani gerakan kompleks dengan akurasi tinggi, serta mengikuti prinsip fisika untuk menghasilkan gerakan yang wajar. Keunggulannya terlihat dalam hasil tolok ukur VBench, di mana Wan2.1 berhasil meraih skor keseluruhan 86,22%, menempati posisi teratas dalam leaderboard tersebut.

Akses terbuka ini memberikan peluang bagi lebih banyak bisnis untuk memanfaatkan AI dalam menciptakan konten visual berkualitas tinggi yang sesuai dengan kebutuhan mereka, dengan pengeluaran yang lebih efisien. Beberapa fitur utama dari model ini meliputi:

T2V-14B: Memproduksi visual berkualitas tinggi dengan dinamika gerakan yang laras.
T2V-1.3B: Menawarkan keseimbangan antara kualitas hasil dan efisiensi daya komputasi, ideal bagi para pengembang dan peneliti.
I2V-14B-720P dan I2V-14B-480P: Mendukung konversi gambar menjadi video, pengguna hanya perlu memasukkan gambar dan deskripsi teks singkat untuk menghasilkan video yang interaktif.

Sebagai ilustrasi, model T2V-1.3B memungkinkan pengguna dengan laptop standar untuk menghasilkan video berdurasi 5 detik dengan resolusi 480p dalam waktu sekitar 4 menit. Ini menunjukkan betapa mudahnya akses dan efisiensi penggunaan teknologi ini bagi mereka yang ingin mengeksplorasi potensi AI dalam pembuatan konten.

Alibaba Cloud juga mencatat bahwa mereka adalah salah satu perusahaan teknologi global terdepan yang membuka akses open-source untuk model AI skala besar yang mereka kembangkan. Sebelumnya, Alibaba Cloud telah merilis model open-source Qwen (Qwen-7B) pada Agustus 2023, yang secara konsisten menduduki peringkat teratas dalam Hugging Face Open LLM Leaderboards.

Dengan lebih dari 100.000 model turunan yang telah dikembangkan di Hugging Face, ekosistem model AI yang dihasilkan oleh Alibaba Cloud kini menjadi salah satu yang terbesar di dunia. Ini menunjukkan dampak positif yang ditawarkan oleh Alibaba Cloud dalam mendorong inovasi di bidang kecerdasan buatan melalui keterbukaan dan kolaborasi. Pembukaan akses ini diharapkan dapat mempercepat pemanfaatan teknologi AI di berbagai sektor, membuka jalan bagi lebih banyak inovasi dan kreativitas di masa depan.

Rizky MaulanaKamis, 6 Maret 2025

Follow Kami