Intel, Ponte Vecchio’nun ilk çıkışından önce GPU yönetimini ele alıyor • Kayıt


Intel, veri merkezi GPU pazarına girmeye hazırlanırken, yonga üreticisi bu hafta Almanya’nın Hamburg kentinde düzenlenen Uluslararası Süper Bilgi İşlem Konferansı’nda bu cihazların büyük ölçekte yönetimini basitleştirecek yeni bir yazılım platformunu tanıttı.

Intel XPU Manager olarak adlandırılan açık kaynaklı yazılım, bellenimi yükseltmek, sistem kullanımını izlemek ve bireysel düğüm düzeyinde GPU’ları yönetmek için bir bant içi uzaktan yönetim hizmetidir. Intel, yalnızca GPU silikonunda değil, aynı zamanda yazılım yönetiminde de lider olan Nvidia ve AMD ile rekabet etmeye hazırlanırken, kod önemli bir adımdır.

XPU Manager, Kubernetes’te çalışan ve RESTful API’leri kullanan mevcut küme yönetimine ve zamanlayıcılara entegre edilmek üzere tasarlanmış düşük düzeyli bir yönetim arabirimidir. Ayrıca CLI aracılığıyla yerel yönetimi destekler ve Ubuntu 20.04 veya Red Hat Enterprise Linux 8.4’te kullanım için onaylanmıştır.

Yazılım tarafından toplanan telemetri, diğerleri arasında GPU kullanımını, performans ölçümlerini, bellek bant genişliğini ve paket sıcaklıklarını içerir. Doğrudan Prometheus gibi popüler izleme yığınlarına aktarılabilir.

Platform, başlangıçta, yonga üreticisinin yakında çıkacak Ponte Vecchio ve Rialto Bridge GPU’ları gibi Intel tabanlı sistemler için mevcut, ancak açık kaynak yapısı sayesinde, Intel’in süper bilgisayar grubunun Başkan Yardımcısı ve Genel Müdürü Jeff McVeign, platformun diğer mimarilere taşınmasını bekliyor. çok geçmeden. Sonunda, bir veri merkezi, Intel, AMD, Nvidia GPU’ların bir karışımını ölçekte yönetmek için XPU yöneticisini kullanabilir, diye düşündü.

Intel’in CEO Pat Gelsinger’in son zamanlarda yaptığı vurguya uygun olarak XPU Manager’ın ticari bir sürümünü sunmayı planlayıp planlamadığı konusunda baskı yapıldı. yazılım gelirlerini artırmakMcVeign, bu şekilde metalaştırılan geçmiş açık kaynak projelerini öne sürerek olasılığı dışlamadı.

“Şu anda hedefimiz onu kullanılabilir kılmak… ve insanların onu etkin bir şekilde kullanabilmesi için dışarı çıkarmak. Ve sonra, ticari destek lisansı almak başkaları için değerliyse, onu eğlendireceğiz, ancak bunun motivasyonu bu değil” dedi. “Bu yazılım geliriyle ilgili değil. Gerçekten bu platformları nasıl yöneteceğimizle ilgili?”

Intel, daha yeşil veri merkezlerinin sadece bir tık ötenizde olduğunu söylüyor

Yazılıma yapılan bu vurgunun çoğu, donanım kullanımını iyileştirmeye ve süreç içinde veri merkezlerini daha sürdürülebilir hale getirmeye dayanmaktadır.

Intel’e göre, 2030 yılına kadar veri merkezleri küresel enerji tüketiminin yüzde 3-7’sinden sorumlu olabilir ve hesaplama donanımı elektrik kullanımının en büyük sürücüsü olacak. Intel’in Ponte Vecchio GPU’ları Bu yıl piyasaya sürüldüğünde 600W’ın üzerine çıkması bekleniyor, ancak bu yüksek TDP’ler Intel’e özgü değil. Nvidia’nın H100 SXM’si söz konusu olduğunda, rakiplerinden GPU’lar daha da fazla geri çekiyor – 700W.

Son aylarda Intel, bu sorunların çoğunu çözmek için yazılımlara yöneldi. Bu yılın başlarında Intel, yazılım girişimi Granulate’i satın aldı. uygulamaları optimize et çalışma zamanında donanımı için. Benzer şekilde Intel, simülasyonlar için gereken parametre sayısını azaltmak ve sonuca daha kısa sürede ulaşmak için 2020’de SigOpt’tan edindiği yazılımı kullanıyor.

Bu amaçla, bu hafta ISC’de Intel, veri merkezi ölçeğinde güç tüketimi üzerinde daha fazla kontrol sağlamak için Veri Merkezi Yöneticisi yazılım platformunu da güncelledi.

McVeign, “Intel Datacenter Manager bir süredir çalışmıyor, ancak buna gerçekten birçok yeni sürdürülebilirlik ve enerji verimliliği özelliği getiriyoruz,” dedi.

XPU yöneticisi, hızlandırıcıları düğüm düzeyinde yönetmek için tasarlanırken, Datacenter Manager adından da anlaşılacağı gibi, işlemleri küme düzeyinde yönetmek için tasarlanmıştır. Bu nedenle güncellemeler, termal haritalama gibi araçlar ve tüm bilgi işlem kümesi için güç tüketimini sınırlama yeteneği sağlar.

Intel, yazılımın tüm sorunlarını çözmesini beklemiyor. Şirket, yongalarının güç verimliliğini artırmak için büyük yatırımlar yaptı ve bu ayın başlarında bir $ açıkladı.700 milyon “mega laboratuvar” daldırma soğutma da dahil olmak üzere yeni sıvı soğutma teknolojisini araştırmak. ®


Kaynak : https://go.theregister.com/feed/www.theregister.com/2022/05/31/intel_xpu_manager/

Yorum yapın