7 MLops efsanesi çürütüldü | GirişimBeat


Transform 2022’yi 19 Temmuz’da ve neredeyse 20 – 28 Temmuz’da geri getirmekten heyecan duyuyoruz. Bilgili görüşmeler ve heyecan verici ağ oluşturma fırsatları için yapay zeka ve veri liderlerine katılın. Bugün kayıt Ol!


Makine öğrenimi (ML) destekli hizmetlerin muazzam büyümesiyle, MLops terimi konuşmanın düzenli bir parçası haline geldi ve bunun iyi bir nedeni var. “Makine öğrenimi operasyonları”nın kısaltması olan MLops, makine öğrenimi modellerinin üretimde güvenilir ve verimli bir şekilde devreye alınmasını ve sürdürülmesini sağlamak için geniş bir araç seti, çalışma işlevi ve en iyi uygulamaları ifade eder. Uygulaması, üretim sınıfı modellerin özüdür – hızlı dağıtım sağlamak, gelişmiş performans için deneyleri kolaylaştırmak ve model yanlılığından veya tahmin kalitesinde kayıptan kaçınmak. Onsuz, ML ölçekte imkansız hale gelir.

Yaklaşan herhangi bir uygulama ile, gerçekte ne anlama geldiği konusunda kafa karıştırmak kolaydır. Yardımcı olmak için, MLop’lardan kaçınılması gereken yedi yaygın efsaneyi listeledik, böylece ML’den geniş ölçekte başarılı bir şekilde yararlanma yoluna gidebilirsiniz.

Efsane 1: MLops, Lansmanda sona erer

Gerçek: Bir makine öğrenimi modelini başlatmak, sürekli bir süreçte yalnızca bir adımdır.

ML, doğası gereği deneysel bir uygulamadır. İlk lansmandan sonra bile, sinyal ve parametrelerde ince ayar yaparken yeni hipotezleri test etmek gerekir. Bu, modelin zaman içinde doğruluk ve performans açısından iyileşmesini sağlar. MLops süreçleri, mühendislerin deney sürecini etkin bir şekilde yönetmesine yardımcı olur.

Örneğin, MLops’un temel bir bileşeni sürüm yönetimidir. Bu, ekiplerin en uygun olanın seçilmesini sağlamak için geniş bir model varyantları setinde temel metrikleri izlemesine olanak tanırken bir hata durumunda kolay geri dönüşe izin verir.

Veri kayması riski nedeniyle zaman içinde model performansını izlemek de önemlidir. Veri kayması, üretimde bir modelin incelediği veriler, modelin orijinal olarak eğitildiği verilerden önemli ölçüde değiştiğinde meydana gelir ve bu da düşük kaliteli tahminlere yol açar. Örneğin, COVID-19 pandemi öncesi tüketici davranışları için eğitilen birçok makine öğrenimi modeli, karantinalar yaşam biçimimizi değiştirdikten sonra kalite açısından ciddi bir düşüş yaşadı. MLops, güçlü izleme uygulamaları oluşturarak ve büyük bir değişiklik meydana geldiğinde hızla uyum sağlamak için altyapı oluşturarak bu senaryoları ele almak için çalışır. Bir model başlatmanın çok ötesine geçiyor.

Efsane #2: MLops, model geliştirme ile aynıdır

Gerçek: MLops, model geliştirme ile üretimde ML’nin başarılı kullanımı arasındaki köprüdür.

Test ortamında bir model geliştirmek için kullanılan süreç, tipik olarak, üretimde başarılı olmasını sağlayacak süreçle aynı değildir. Modelleri üretimde çalıştırmak, modelleri kaynaklamak, işlemek ve eğitmek için genellikle geliştirmede bulunanlardan çok daha büyük veri kümelerine yayılan sağlam veri hatları gerektirir.

Veritabanlarının ve bilgi işlem gücünün, artan yükü yönetmek için tipik olarak dağıtılmış ortamlara taşınması gerekir. Güvenilir dağıtımların ve ölçekte hızlı bir şekilde yineleme yeteneğinin sağlanması için bu sürecin çoğunun otomatikleştirilmesi gerekir. Üretim ortamları, testte mevcut olanın dışındaki verileri göreceğinden ve bu nedenle beklenmeyen potansiyel çok daha büyük olduğundan, izleme de çok daha sağlam olmalıdır. MLops, geliştirmeden lansmana kadar bir model almak için tüm bu uygulamalardan oluşur.

Efsane #3: MLops, devops ile aynıdır

Gerçek: MLops, devops ile benzer hedeflere doğru çalışır, ancak uygulanması birkaç yönden farklılık gösterir.

Hem MLop’lar hem de geliştiriciler, dağıtımı ölçeklenebilir ve verimli hale getirmeye çalışırken, ML sistemleri için bu hedefe ulaşmak için yeni bir dizi uygulama gerekir. MLops, geliştiricilere göre denemeye daha fazla önem verir. Standart yazılım dağıtımından farklı olarak, ML modelleri genellikle aynı anda birçok değişkenle birlikte dağıtılır, bu nedenle en uygun sürümü seçmek için aralarında karşılaştırma yapmak için model izlemeye ihtiyaç vardır. Her yeniden dağıtım için yalnızca kodu indirmek yeterli değildir – modellerin her değişiklik olduğunda yeniden eğitilmesi gerekir. İşlem hattının artık bir yeniden eğitim ve doğrulama aşaması içermesi gerektiğinden, bu standart devops dağıtımlarından farklıdır.

Devops’un yaygın uygulamalarının çoğu için MLops, kapsamı belirli ihtiyaçlarını karşılayacak şekilde genişletir. MLops için sürekli entegrasyon, yalnızca kodun test edilmesinin ötesine geçer, aynı zamanda model doğrulama ile birlikte veri kalitesi kontrollerini de içerir. Sürekli dağıtım, yalnızca bir dizi yazılım paketinden daha fazlasıdır, ancak artık modellerdeki değişiklikleri değiştirmek veya geri almak için bir işlem hattı da içerir.

Efsane #4: Bir hatayı düzeltmek sadece kod satırlarını değiştirmektir

Gerçek: Üretimde makine öğrenimi modeli hatalarını düzeltmek, önceden planlama ve birden çok geri dönüş gerektirir.

Yeni bir dağıtım, performansta düşüşe veya başka bir hataya yol açarsa, MLops ekiplerinin sorunu çözmek için ellerinde bir dizi seçenek olması gerekir. Modellerin dağıtımdan önce yeniden eğitilmesi gerektiği göz önüne alındığında, yalnızca önceki koda geri dönmek genellikle yeterli değildir. Bunun yerine, bir hata durumunda her zaman üretime hazır bir sürümün mevcut olduğundan emin olmak için ekipler modellerin birden çok sürümünü el altında tutmalıdır.

Ayrıca, veri kaybının veya üretim verisi dağıtımında önemli bir kaymanın olduğu senaryolarda, sistemin en azından bir miktar performans seviyesini koruyabilmesi için ekiplerin basit geri dönüş buluşsal yöntemlerine sahip olması gerekir. Tüm bunlar, MLops’un temel bir yönü olan önemli bir ön planlama gerektirir.

Efsane #5: Yönetim, MLop’lardan tamamen farklıdır

Gerçek: Yönetişimin MLop’lardan farklı hedefleri olsa da, MLop’ların çoğu yönetişim hedeflerini desteklemeye yardımcı olabilir.

Model yönetişimi, ML sistem kullanımıyla ilişkili mevzuat uyumluluğunu ve riski yönetir. Bu, uygun kullanıcı veri koruma politikalarını sürdürmek ve model tahminlerinde önyargı veya ayrımcı sonuçlardan kaçınmak gibi şeyleri içerir. MLops tipik olarak modellerin performans sağlamasını sağlamak olarak görülse de, bu, neler sunabileceğine dair dar bir bakış açısıdır.

Üretimdeki modellerin izlenmesi ve izlenmesi, modellerin açıklanabilirliğini geliştirmek ve sonuçlarda yanlılığı bulmak için analizlerle desteklenebilir. Model eğitimi ve dağıtım ardışık düzenlerinde şeffaflık, veri işleme uyumluluğu hedeflerini kolaylaştırabilir. MLop’lar, performans, yönetişim ve model risk yönetimi dahil olmak üzere tüm iş hedefleri için ölçeklenebilir ML’yi etkinleştiren bir uygulama olarak görülmelidir.

Efsane #6: Makine öğrenimi sistemlerinin yönetimi silolarda yapılabilir

Gerçek: Başarılı MLops sistemleri, hibrit becerilere sahip işbirlikçi ekipler gerektirir.

ML modeli dağıtımı, veri bilimcileri, veri mühendisleri, ML mühendisleri ve devops mühendisleri dahil olmak üzere birçok rolü kapsar. İşbirliği ve birbirlerinin çalışmalarını anlamadan, etkili ML sistemleri büyük ölçekte hantal hale gelebilir.

Örneğin, bir veri bilimcisi, çok fazla dış görünürlük veya girdi olmadan modeller geliştirebilir ve bu da performans ve ölçekleme sorunları nedeniyle dağıtımda zorluklara yol açabilir. Belki de bir geliştirme ekibi, temel ML uygulamalarına ilişkin içgörüsü olmayan, yinelemeli model denemesini etkinleştirmek için uygun izlemeyi geliştiremeyebilir.

Bu nedenle, tüm ekip üyelerinin ilk günden itibaren işbirliği ile model geliştirme hattı ve ML uygulamaları hakkında geniş bir anlayışa sahip olması önemlidir.

Efsane #7: Makine öğrenimi sistemlerini yönetmek riskli ve savunulamaz

Gerçek: Herhangi bir ekip, doğru araçlar ve uygulamalarla ML’den geniş ölçekte yararlanabilir.

MLops hala büyüyen bir alan olduğundan, çok fazla karmaşıklık varmış gibi görünebilir. Bununla birlikte, ekosistem hızla olgunlaşıyor ve ekiplerin MLops yaşam döngüsünün her adımında başarılı olmasına yardımcı olacak çok sayıda kullanılabilir kaynak ve araç var.

Uygun süreçler uygulandığında, büyük ölçekte makine öğreniminin tüm potansiyelini ortaya çıkarabilirsiniz.

Krishnaram Kenthapadi, Fiddler AI’ın baş bilim adamıdır..

DataDecisionMakers

VentureBeat topluluğuna hoş geldiniz!

DataDecisionMakers, veri işi yapan teknik kişiler de dahil olmak üzere uzmanların verilerle ilgili içgörüleri ve yenilikleri paylaşabileceği yerdir.

En yeni fikirleri ve güncel bilgileri, en iyi uygulamaları ve veri ve veri teknolojisinin geleceğini okumak istiyorsanız DataDecisionMakers’da bize katılın.

Kendi makalenize katkıda bulunmayı bile düşünebilirsiniz!

DataDecisionMakers’dan Daha Fazlasını Okuyun


Kaynak : https://venturebeat.com/2022/06/19/7-mlops-myths-debunked/

Yorum yapın