Herkes Nvidia'ya karşı: Açık standart “UALink” yapay zeka kümelerini birbirine bağlıyor

celeron

Global Mod
Global Mod
Yapay zeka sunucularındaki patlayıcı pazar büyümesi, teknolojide devrim yaratıyor. Nvidia, yalnızca yapay zeka bilgi işlem hızlandırıcıları alanında pazara hakim olmakla kalmıyor, aynı zamanda tescilli NVLink ile bunun için gereken süper hızlı ağ teknolojisine de hakim.


Reklamcılık



Bu nedenle AMD, Broadcom, Cisco, Google, HPE, Intel, Meta ve Microsoft artık açık ara bağlantı Ultra Hızlandırıcı Bağlantısı (UALink) üzerinde işbirliği yapıyor. Ultra Ethernet ve PCIe 5.0 tabanlı Compute Express Link (CXL) de bunda rol oynuyor.

Ara bağlantı bilgi işlem hızlandırıcılarına bağlıdır


Mevcut yapay zeka yüksek performanslı bilgi işlem hızlandırıcı kümeleri, örneğin eski süper bilgisayarlardan farklı şekilde ağ bağlantılıdır. Bireysel bilgi işlem düğümlerindeki ara bağlantı artık ana işlemcilere (CPU'lar) değil, doğrudan AI hızlandırıcılara (GPU'lar) bağlıdır. Bir yandan bunlar, tek bir bilgi işlem hızlandırıcının yerel belleğine sığmayan yapay zeka modellerini hızlı bir şekilde işleyebilmek için düğüm içinde birbirine son derece hızlı bir şekilde bağlanır. Öte yandan yapay zeka hızlandırıcıların birçoğunun, yüksek bant genişliğine ve düşük gecikme süresine sahip bir anahtar aracılığıyla diğer düğümlere ulaşmak için harici bağlantıları da var.

Nvidia NVLink'i birkaç yıldır kullanıyor. Dört yıl önce şirket, ağ uzmanı Mellanox'u yedi milyar ABD doları karşılığında satın aldı.




AMD Instinct MI'lı AI sunucusunun blok diyagramı



AMD'nin yapay zeka hızlandırıcılarıyla birden fazla sunucuyu ağ üzerinden bağlamak için kullanılan 200G Ethernet adaptörleri CPU'ya değil yapay zekaya bağlı.


(Resim: AMD)



Rekabet geride kaldı


Bireysel düğümlerde, ilgili AI hızlandırıcı üreticileri, AMD Infinity Fabric veya açık standart Compute Express Link (CXL) gibi tescilli süreçleri kullanır. Gelecekte Ultra Hızlandırıcı Bağlantısı, bir yapay zeka kümesinin maksimum 1024 düğümü arasında harici köprü oluşturacak.

Infiniband yıllardır kümeler için hızlı bir ara bağlantı olmuştur. Ancak bu alandaki gelişmeler yeterince hızlı ilerlemiyor ve (hala) Infiniband donanımı üreten yalnızca birkaç şirket var.

Ethernet'te rekabet daha fazla oluyor, kablo ve anahtarların altyapısı daha esnek kullanılabiliyor. Intel, diğerlerinin yanı sıra halihazırda 800G Ethernet adaptörleri üzerinde, Broadcom ise anahtar çipleri üzerinde çalışıyor. 1,6 TBit Ethernet spesifikasyonu üzerinde halihazırda çalışılmaktadır (IEEE P802.3dj taslağı). Infiniband'a alternatif olarak kümelerin yüksek performanslı ağ iletişimi için Yakınsanmış Ethernet Üzerinden Uzaktan DMA (RoCE) gibi yöntemler mevcuttur.

Ultra Ethernet Konsorsiyumu (UEC), 2023 yılının sonundan bu yana Linux Vakfı çatısı altında çalışıyor. Her düzeyde veri aktarımlarını hızlandırmayı ve optimize etmeyi amaçlıyor: fiziksel katman, bağlantı katmanı, taşıma katmanı ve yazılım katmanı.

Önümüzdeki dört ay içinde Ultra Hızlandırıcı Bağlantı Konsorsiyumu spesifikasyonun ilk versiyonunu yayınlamayı, resmi olarak kendini kurmayı ve ardından kesinlikle bir web sitesi kurmayı planlıyor. Şu ana kadar yalnızca Computex 2024'ten birkaç gün önce yayınlanan bir basın bülteni var.




(ciw)



Haberin Sonu