AMD Dukung Frontier AI Training untuk Zyphra

AMD Dukung Frontier AI Training untuk Zyphra

AMD Dukung Frontier AI Training untuk Zyphra

KABARINDO, SURABAYA - AMD mengumumkan di Santa Clara, California, AS, bahwa Zyphra telah mencapai tonggak penting dalam pelatihan model AI berskala besar dengan pengembangan ZAYA1, model fondasi Mixture-of-Experts (MoE) pertama yang dilatih menggunakan platform GPU dan jaringan AMD.

Dengan memanfaatkan GPU AMD Instinct MI300X, jaringan AMD Pensando serta open software AMD ROCm, pencapaian ini dijelaskan dalam laporan teknis Zyphra. Hasil Zyphra menunjukkan bahwa model ini memberikan kinerja kompetitif atau lebih unggul dibandingkan model terbuka terkemuka dalam tolok ukur penalaran, matematika dan pemrograman. Hal ini membuktikan skalabilitas dan efisiensi GPU AMD Instinct untuk beban kerja AI produksi berskala besar.

“Kepemimpinan AMD dalam komputasi terakselerasi memberdayakan inovator seperti Zyphra untuk mendorong batas kemungkinan dalam AI. Tonggak ini menunjukkan kekuatan dan fleksibilitas GPU AMD Instinct dan jaringan Pensando untuk melatih model kompleks berskala besar,” kata Emad Barsoum, Corporate Vice President of AI and Engineering, Artificial Intelligence Group AMD pada Kamis (27/11/2025).

Krithik Puthalath, CEO of Zyphra, menambahkan efisiensi selalu menjadi prinsip utama di Zyphra. Hal ini membentuk cara Zyphra merancang arsitektur model, mengembangkan algoritme pelatihan dan inferensi, serta memilih perangkat keras dengan rasio harga-kinerja terbaik untuk menghadirkan kecerdasan frontier kepada pelanggan.

“ZAYA1 mencerminkan filosofi ini dan kami bangga menjadi perusahaan pertama yang mendemonstrasikan pelatihan berskala besar di platform AMD. Hasil kami menyoroti kekuatan co-design arsitektur model dengan silikon dan system. Kami bersemangat memperdalam kolaborasi dengan AMD dan IBM dalam membangun generasi berikutnya dari model fondasi multimodal canggih,” ujarnya.

GPU AMD Instinct MI300X dengan 192 GB memori bandwidth tinggi memungkinkan pelatihan berskala besar secara efisien, menghindari kebutuhan sharding ahli atau tensor yang mahal, sehingga mengurangi kompleksitas dan meningkatkan throughput di seluruh tumpukan model.

Zyphra juga melaporkan waktu penyimpanan model lebih dari 10x lebih cepat dengan menggunakan I/O terdistribusi yang dioptimalkan AMD, sehingga makin meningkatkan keandalan dan efisiensi pelatihan. Dengan hanya sebagian kecil parameter aktif, ZAYA1-Base (8,3B total, 760M aktif) menyamai atau melampaui kinerja model seperti Qwen3-4B (Alibaba), Gemma3-12B (Google), Llama-3-8B (Meta) dan OLMoE.

Melanjutkan kerja sama sebelumnya, Zyphra dengan AMD dan IBM merancang serta menerapkan kluster pelatihan berskala besar yang didukung GPU AMD Instinct dengan interkoneksi jaringan AMD Pensando. Sistem hasil rekayasa bersama AMD dan IBM yang diumumkan pada kuartal ini, menggabungkan GPU AMD Instinct MI300X dengan fabric dan arsitektur penyimpanan berperforma tinggi milik IBM Cloud, menyediakan pondasi bagi pretraining berskala besar ZAYA1.