Büyük dil modelleri söz konusu olduğunda, oluşturmalı veya satın almalı mısınız? • TechCrunch


Geçen yaz olabilir özellikle büyük dil modellerinin patlayıcı bir giriş yaptığı bir “AI yazı” olarak tanımlanabilir. OpenAI’nin GPT-3’ü ve onun daha yeni, abartılı ürünü ChatGPT’den daha ünlü olmayan, son derece etkileyici görevleri yerine getirebilen devasa bir veri topluluğu üzerinde eğitilmiş devasa sinir ağları gördük.

Sektörlerdeki her şekil ve büyüklükteki şirket, bu yeni teknolojiyi nasıl dahil edeceğini ve ondan nasıl değer çıkaracağını bulmak için acele ediyor. Ancak OpenAI’nin iş modeli, doğal dil işlemeye yaptığı katkılardan daha az dönüştürücü olmamıştır. Bir amiral gemisi modelin hemen hemen her önceki sürümünün aksine, bu model açık kaynaklı önceden eğitilmiş ağırlıklarla gelmiyor; yani, makine öğrenimi ekipleri modelleri indirip kendi kullanım durumları için ince ayar yapamıyor.

Bunun yerine, ya onları olduğu gibi kullanmak için ödeme yapmalı ya da modellerde ince ayar yapmak için ödeme yapmalı ve ardından onu kullanmak için olduğu gibi kullanım oranının dört katını ödemelidirler. Tabii ki, şirketler yine de diğer benzer açık kaynaklı modelleri seçebilir.

Bu, asırlık bir kurumsal – ancak makine öğrenimi için tamamen yeni – bir soruya yol açtı: Bu teknolojiyi satın almak mı yoksa inşa etmek mi daha iyi olur?

Bu sorunun herkese uyan tek bir yanıtı olmadığına dikkat etmek önemlidir; Tümünü kapsayan bir yanıt vermeye çalışmıyorum. Her iki yolun da artılarını ve eksilerini vurgulamak ve şirketlerin kendileri için neyin işe yaradığını değerlendirmelerine yardımcı olabilecek bir çerçeve sunmak ve aynı zamanda her iki dünyanın bileşenlerini dahil etmeye çalışan bazı orta yollar sağlamak istiyorum.

Satın alma: Hızlı, ancak açık tuzaklarla

İnşaat uzun vadede çekici görünse de, güçlü bir risk iştahına sahip liderliğin yanı sıra söz konusu iştahı destekleyecek derin kasalar gerektirir.

Satın almakla başlayalım. API’ler olarak özel modeller sunan ve istek başına ücret alan çok sayıda hizmet olarak model sağlayıcı vardır. Bu yaklaşım hızlı, güvenilirdir ve çok az ön sermaye harcaması gerektirir veya hiç gerektirmez. Bu yaklaşım, özellikle alana giren şirketler için makine öğrenimi projelerinin risklerini etkili bir şekilde azaltır ve yazılım mühendislerinin ötesinde sınırlı şirket içi uzmanlık gerektirir.

Projeler, deneyimli makine öğrenimi personeli gerektirmeden başlatılabilir ve makine öğrenimi bileşeninin çıktıyla ilgili bir dizi garantiyle satın alındığı göz önüne alındığında, model sonuçları makul ölçüde tahmin edilebilir olabilir.

Ne yazık ki, bu yaklaşım, birincil olarak sınırlı ürün savunulabilirliği olan çok açık tuzaklarla birlikte gelir. Herkesin satın alabileceği ve onu sistemlerinize entegre edebileceği bir model satın alıyorsanız, rakiplerinizin de aynı hızla ve güvenilir bir şekilde ürün denkliğine ulaşabileceğini varsaymak çok da abartılı olmaz. Tekrarlanamayan veri toplama teknikleriyle yukarı yönde bir hendek veya entegrasyonlar yoluyla aşağı yönde bir hendek oluşturamazsanız bu doğru olacaktır.

Dahası, yüksek verimli çözümler için bu yaklaşım, ölçekte son derece pahalı olabilir. Bağlam açısından, OpenAI’nin DaVinci’sinin maliyeti bin token başına 0,02 ABD dolarıdır. İstek başına 250 belirteç ve benzer boyutta yanıtlar varsayarsak, istek başına 0,01 ABD doları ödüyorsunuz. Günde 100.000 istek alan bir ürün için yılda 300.000 dolardan fazla ödemeniz gerekir. Açıkçası, metin ağırlıklı uygulamalar (bir makale oluşturmaya veya sohbet etmeye çalışmak) daha da yüksek maliyetlere yol açacaktır.

Bu yaklaşıma bağlı sınırlı esnekliği de hesaba katmalısınız: Modelleri olduğu gibi kullanırsınız veya ince ayar yapmak için önemli ölçüde daha fazla ödeme yaparsınız. İnce ayarlı modeller sizin değil onların dijital gözetiminde tutulacağından, ikinci yaklaşımın sağlayıcıyla konuşulmayan bir “kilitlenme” dönemini içereceğini hatırlamakta fayda var.

Bina: Esnek ve savunulabilir ancak pahalı ve riskli

Öte yandan, kendi teknolojinizi oluşturmak, bu zorlukların bazılarını aşmanıza olanak tanır.


Kaynak : https://techcrunch.com/2023/01/25/when-it-comes-to-large-language-models-should-you-build-or-buy/

Yorum yapın