OpenAI Fısıltılarınızı Duyuyor | Hackaday


Bir şey satın almadan yüksek kaliteli ses tanımayı denemek isterseniz, iyi şanslar. Elbette, telefonunuzdaki konuşma tanımayı ödünç alabilir veya bir Raspberry Pi’deki bazı sanal asistanları işlemeyi sizin için halletmek için zorlayabilirsiniz, ancak bunlar, kapalı bir kaynağa bağlı olmak istemediğiniz büyük işler için iyi değildir. çözüm. OpenAI tanıtıldı Fısıltı, “İngilizce konuşma tanıma konusunda insan düzeyinde sağlamlığa ve doğruluğa yaklaşan” açık kaynaklı bir sinir ağı olduğunu iddia ediyorlar. En azından diğer bazı dillerde de çalışıyor gibi görünüyor.

Gösterileri denerseniz, hızlı veya hoş bir aksanla konuşmanın sonuçları etkilemediğini göreceksiniz. Gönderi, 680.000 saatlik denetimli veri üzerinde eğitildiğinden bahsediyor. Bir yapay zeka ile bu kadar çok konuşacak olsaydınız, uykusuz kalmanız 77 yılınızı alırdı!

Dahili olarak konuşma, bir spektrogramı besleyen 30 saniyelik parçalara bölünür. Kodlayıcılar spektrogramı işler ve kod çözücüler bazı tahmin ve diğer buluşsal yöntemleri kullanarak sonuçları sindirir. Verilerin yaklaşık üçte biri İngilizce konuşulmayan kaynaklardan alınmış ve daha sonra tercüme edilmiştir. şurayı okuyabilirsiniz kağıt genelleştirilmiş eğitimin standart ölçütlerde özel olarak eğitilmiş bazı modellerde nasıl daha düşük performans gösterdiği hakkında, ancak Whisper’ın belirli ölçütlerin ötesinde rastgele konuşmada daha iyi olduğuna inanıyorlar.

Modelin “minik” varyasyondaki boyutu hala 39 megabayt ve “büyük” varyant bir buçuk konserin üzerinde. Yani bu muhtemelen yakın zamanda Arduino’nuzda çalışmayacak. Yine de kodlamak istiyorsanız, hepsi açık GitHub.

Başka çözümler de var ama bu kadar sağlam değil. Asistan tabanlı rotaya gitmek istiyorsanız, işte size biraz ilham kaynağı.



Kaynak : https://hackaday.com/2022/09/22/openai-hears-you-whisper/

Yorum yapın