Cerebras, LLM ve üretken AI araçları için yeni ortaklıkları açıkladı


Vatandaş geliştiricilerin becerilerini artırarak ve ölçeklendirerek başarılı bir şekilde yenilik yapmayı ve verimliliğe nasıl ulaşılacağını öğrenmek için Low-Code/No-Code Summit’teki isteğe bağlı oturumlara göz atın. İzle şimdi.


Büyük dil modelleri (LLM’ler) şu anda yapay zeka dünyasının en çok konuşulan konusu, ancak onları eğitmek zorlayıcı ve pahalı olabilir; Milyarlarca parametreye sahip modeller, deneyimli mühendislerin aylarca çalışmasını ve (güvenilir ve doğru bir şekilde) çalışmasını gerektirir.

Cerebras Systems ve Cirrascale Cloud Services tarafından sunulan yeni bir ortak teklif, kullanıcılara GPT sınıfı modelleri mevcut sağlayıcılardan çok daha ucuza ve yalnızca birkaç satır kodla eğitme yeteneği vererek yapay zekayı demokratikleştirmeyi amaçlıyor.

CEO’su ve kurucu ortağı Andrew Feldman, “LLM’lerin yeterince abartılmadığına inanıyoruz” dedi. Beyin Sistemleri bir ön brifingde söyledi. “Önümüzdeki yıl içinde, ekonominin çeşitli bölümlerinde LLM’lerin etkisinde kapsamlı bir artış göreceğiz.”

Benzer şekilde, üretici yapay zeka, sıradan metin girişlerinden belge yazma, görüntü oluşturma ve yazılım kodlama becerisini mümkün kıldığından, yakın tarihteki en önemli teknolojik gelişmelerden biri olabilir.

Etkinlik

Akıllı Güvenlik Zirvesi

Yapay zeka ve makine öğreniminin siber güvenlikteki kritik rolünü ve sektöre özel vaka incelemelerini 8 Aralık’ta öğrenin. Ücretsiz geçişiniz için bugün kaydolun.

Şimdi üye Ol

Üretken yapay zekanın benimsenmesini hızlandırmaya ve doğruluğunu artırmaya yardımcı olmak için Cerebras ayrıca bugün yapay zeka içerik platformuyla yeni bir ortaklık kurduğunu duyurdu. Jasper Al.

Jasper CEO’su Dave Rogenmoser, “Generative AI’nın bir sonraki bölümünün, sürekli olarak daha iyi hale gelen kişiselleştirilmiş modeller olduğunu gerçekten hissediyoruz” dedi.

Teknolojinin birinci aşaması “gerçekten heyecan vericiydi” dedi, ancak “çok, çok daha heyecanlı hale gelmek üzere.”

Araştırma fırsatlarının kilidini açmak

LLM’lere kıyasla, geleneksel bulut sağlayıcıları, çok sayıda GPU arasında gecikmeyi garanti edemedikleri için mücadele edebilirler. Feldman, değişken gecikme süresinin, büyük bir yapay zeka modelini GPU’lar arasında dağıtmada karmaşık ve zaman alıcı zorluklar yarattığını ve “eğitim süresinde büyük dalgalanmalar” olduğunu açıkladı.

üzerinde barındırılan yeni Cerebras AI Model Studio, Cirascale AI İnovasyon Bulutu, kullanıcıların Cerebras Wafer-Scale Kümelerinde GPT-J, GPT-3 ve GPT-NeoX dahil olmak üzere üretken Transformer (GPT) sınıfı modelleri eğitmesine olanak tanır. Buna yeni duyurulan Andromeda AI süper bilgisayarı da dahildir.

Kullanıcılar, 1,3 milyar parametreden 175 milyar parametreye kadar değişen son teknoloji GPT sınıfı modeller arasından seçim yapabilir ve eğitimi bir A100’e kıyasla sekiz kat daha hızlı doğrulukla ve geleneksel bulutun yarı fiyatına tamamlayabilir. sağlayıcılar, dedi Feldman.

Örneğin, geleneksel bir bulutla GPT-J’de eğitim süresi sıfırdan yaklaşık 64 gün sürer; Cerebras AI Model Studio, bunu sıfırdan sekiz güne indirir. Benzer şekilde, geleneksel bulutlarda, yalnızca GPU’larda üretim maliyetleri 61.000 ABD dolarına kadar çıkıyor; Cerebras’ta ise tam üretim çalışması için 45.000 $.

Yeni araç, devops ve dağıtılmış programlama ihtiyacını ortadan kaldırır; basma düğmeli model taraması, bir ila 20 milyar parametre arasında olabilir. Modeller daha uzun dizi uzunluklarıyla eğitilebilir, böylece yeni araştırma fırsatları açılır.

Cerebras ürün başkanı Andy Hock, “Bu ölçekte araştırma yapmak için temelde yeni bir yeteneğin kilidini açıyoruz” dedi.

Feldman’ın da belirttiği gibi, Cerebras’ın misyonu “derin öğrenmeye erişimi genişletmek ve yapay zeka iş yüklerinin performansını hızla hızlandırmak”.

Yeni AI Model Studio, “kolay ve son derece basit” dedi. “Bunu üzerine atlayabilmeniz, işaret edebilmeniz ve tıklayabilmeniz için düzenledik.”

AI’nın potansiyelini hızlandırma

Rogenmoser, bu arada genç Jasper’ın (2021’de kuruldu), yoğun hesaplamalı modellerini “çok kısa bir sürede” eğitmek için Cerebras’ın Andromeda AI süper bilgisayarını kullanacağını söyledi.

Belirttiği gibi, işletmeler kişiselleştirilmiş modeller istiyor ve “onları çok istiyorlar.”

“Bu modellerin daha iyi hale gelmesini, performansa dayalı geçmiş kullanım verilerine göre kendi kendini optimize etmesini istiyorlar” dedi.

Andromeda ile küçük iş yükleri üzerine yaptığı ilk çalışmasında – bu ay 2018’de duyurulmuştu. SC22yüksek performanslı bilgi işlem, ağ, depolama ve analiz için uluslararası konferans — Jasper, süper bilgisayarın binlerce GPU’nun yapamadığı işi tamamladığını buldu.

Şirket, GPT ağlarının yapay zeka çıktılarını son kullanıcı karmaşıklığının ve ayrıntı düzeyinin her düzeyine uyacak şekilde eğitilmesi de dahil olmak üzere “yapay zeka işini önemli ölçüde ilerletmeyi” bekliyor. Rogenmoser, bunun, Jasper’ın birden fazla müşteri sınıfında içeriği hızlı ve kolay bir şekilde kişiselleştirmesini sağlayacağını söyledi.

Ortaklık, “geleneksel altyapı ile pratik olmayan veya basitçe imkansız olan şeyleri yaparak üretken yapay zekanın geleceğini icat etmemizi sağlıyor” dedi.

Jasper’ın ürünleri 100.000 müşteri tarafından pazarlama, reklamlar, kitaplar ve diğer materyaller için kopya yazmak amacıyla kullanılıyor. Rogenmoser, şirketi “bir yapay zeka yardımcı pilotu” olarak hizmet ederek “boş sayfanın zorbalığını” ortadan kaldıran şirket olarak tanımladı.

Kendi ifadesiyle, bu, içerik oluşturucuların hikayelerinin “sıradan olmayan” ana unsurlarına odaklanmalarına olanak tanır.

VentureBeat’in misyonu teknik karar vericilerin dönüştürücü kurumsal teknoloji ve işlemler hakkında bilgi edinmeleri için dijital bir şehir meydanı olmaktır. Brifinglerimizi keşfedin.


Kaynak : https://venturebeat.com/ai/cerebras-unveils-new-partnerships-for-llm-and-generative-ai-tools/

Yorum yapın