50B+ parametreli meta açık kaynaklı gelişmiş AI metin çeviri sistemi



Meta Platforms Inc., metinleri 200 dile çevirebilen dahili olarak geliştirilmiş bir yapay zeka sistemi olan NLLB-200’ün kodunu bugün yayınladı.

Şirket ayrıca araştırmacıların yazılım projelerinde NLLB-200’ü daha kolay uygulamalarına yardımcı olmak için tasarlanmış bir dizi araç yayınlıyor.

NLLB-200’ün anladığı 200 dilin çoğu, Meta’ya göre diğer AI çeviri sistemleri tarafından iyi desteklenmiyor. Şirket, şu anda 25’ten az Afrika dilinin yaygın olarak kullanılan çeviri araçları tarafından desteklendiğini söylüyor. NLLB-200, 55 Afrika dilini destekler.

Meta, çeviri doğruluğunun NLLB-200’ün diğer araçlara göre bir üstünlüğü olduğu başka bir alandır. Şirket, makine tarafından çevrilmiş metnin kalitesini ölçmek için bir algoritma olan BLEU’yu kullanarak sistemin doğruluğunu değerlendirdi. Meta, NLLB-200’ün önceki rekordan ortalama %44 daha yüksek olan BLEU puanlarına ulaştığını söylüyor.

Meta CEO’su Mark Zuckerberg, “Çoğu mevcut çeviri sistemleri tarafından desteklenmeyen 200 farklı dilde tercüme yapabilen inşa ettiğimiz bir AI modelini az önce açık kaynaklı hale getirdik” dedi. “Bu projeye Geride Dil Kalmadı diyoruz ve kullandığımız yapay zeka modelleme teknikleri, dünya çapında milyarlarca insan tarafından konuşulan diller için yüksek kaliteli çeviriler yapılmasına yardımcı oluyor.”

NLLB-200, 50 milyardan fazla parametreye, bir AI sisteminin veri işleme konusunda nasıl ilerlediğini belirleyen yapılandırma ayarlarına sahiptir. Bir AI sistemi ne kadar çok parametre içeriyorsa, doğruluğu o kadar iyi olur.

NLLB-200’ün çok sayıda parametreye sahip olması, 200 dili yüksek doğrulukla destekleme yeteneğinin arkasındaki tek faktör değildir. Sistem ayrıca Meta mühendisleri tarafından geliştirilen bir dizi başka AI yeniliğinden de yararlanıyor.

Meta, makine öğrenimi araştırmasını desteklemek için LASER adlı dahili olarak geliştirilmiş bir araç seti kullanır. Araç setini kullanarak araştırmacılar, bir dilde belirli bir görevi yerine getirmek için bir sinir ağını eğitebilir ve daha sonra sinir ağını diğer dillere görece kolaylıkla uyarlayabilir, bu da çeviri kullanım durumları için yararlıdır. Meta, yeni NLLB-200 sistemini LASER3 olarak adlandırılan LAZER’in geliştirilmiş bir versiyonuyla geliştirdi.

LAZER’in orijinal versiyonu dahil LSTM sinir ağı olarak adlandırılan, metni yapay zeka sistemleri tarafından anlaşılabilen matematiksel bir temsile dönüştüren özel bir bileşen. Bu matematiksel temsil, daha doğru çeviriler üretmeye yardımcı olur. LASER3’te Meta, LSTM sinir ağını, aynı görevi daha etkin bir şekilde gerçekleştirebilen bir tür gelişmiş doğal dil işleme modeli olan Transformer ile değiştirdi.

Meta ayrıca NLLB-200’ün yeteneklerini geliştirmek için başka yöntemler de kullandı. Şirket, diğerlerinin yanı sıra, eğitim verilerini toplamak için kullandığı sistemi yükseltti ve AI eğitim iş akışında değişiklikler yaptı.

Araştırma Süper Kümesi (resimde) olarak adlandırılan dahili olarak geliştirilmiş bir süper bilgisayar kullanarak meta eğitimli NLLB-200. Süper bilgisayar ilk ortaya çıktığında detaylı Ocak ayında, Nvidia Corp.’un en yeni A100 veri merkezi grafik kartından 6.080 adedini içeriyordu. Meta, o sırada Research SuperCluster’ın sonunda 16.000 grafik kartı içereceğini belirtti.

Meta, Facebook, Instagram ve diğer platformlarında daha iyi otomatik çeviri özellikleri sağlamak için NLLB-200’ü kullanmayı planlıyor. Şirket, AI sisteminin her gün 25 milyardan fazla çeviriyi destekleyeceğini tahmin ediyor.

NLLB-200’ü dahili olarak kullanıma sunma çabasına paralel olarak Meta, diğer kuruluşların sistemi kendi yazılım projelerine uygulamalarına yardımcı olmayı planlıyor.

NLLB-200’ün yanı sıra Meta, yapay zekayı eğitmek için kullanılabilen açık kaynaklı kod ve çevirilerin doğruluğunu değerlendirmek için FLORES-200 adlı bir veri kümesidir. Şirket, kar amacı gütmeyen kuruluşların NLLB-200’ü benimsemesine yardımcı olmak için 200.000 dolara kadar hibe sağlayacak. Girişimin bir parçası olarak Meta, Wikipedia makalelerine otomatik çeviri teknolojisi uygulamak için Wikimedia Vakfı ile işbirliği yaptı.

Fotoğraf: Meta

Uzmanlardan oluşan Cube Club ve Cube Event Topluluğumuza katılarak misyonumuza desteğinizi gösterin. Amazon Web Servisleri ve Amazon.com CEO’su Andy Jassy, ​​Dell Technologies’in kurucusu ve CEO’su Michael Dell, Intel CEO’su Pat Gelsinger ve daha birçok aydınlatıcı ve uzmanı içeren topluluğa katılın.


Kaynak : https://siliconangle.com/2022/07/06/meta-open-sources-advanced-ai-translation-system-50b-parameters/

Yorum yapın