Amazon Web Services Salı günü yıllık re:Invent konferansında, biyoinformatikçilerin, araştırmacıların ve bilim adamlarının hassas tıp alanındaki bilimsel ilerlemeleri hızlandırmak için genomik ve diğer biyolojik veri türlerini depolamasına ve analiz etmesine yardımcı olmak üzere tasarlanmış Amazon Omics adlı yeni bir hizmeti başlattı.
Omics tipik olarak genomik, transkriptomik (bir hücrede RNA’nın incelenmesi), proteomik (proteomların veya protein kümelerinin incelenmesi) ve metabolomik (çalışma) gibi “omik” soneki ile biten biyolojideki çalışma alanlarını ifade eder. hücre içindeki moleküllerin sayısı). Omikler tipik olarak büyük veri kümeleriyle büyük ölçekli çalışmaları içerir.
Şirkete göre yeni hizmet, bilim adamları tarafından yalnızca büyük bir veri deposu oluşturmak için değil, aynı zamanda genom dizileri veya hassas tıpta kullanılan diğer veri dosyaları gibi büyük ham veri dosyalarını (genom ve protein kullanan bir tıp alanı) içe aktarmak için de kullanılabilir. hastalıkların tedavisini optimize etmek için veriler.
AWS, Amazon Omics’in mevcut AWS analitiği ve makine öğrenimi hizmetlerini kullanarak temel biyoinformatik iş akışının kurulmasına ve sonuçların analiz edilmesine de yardımcı olabileceğini belirterek, hizmetin kullanım arttıkça temel altyapıyı otomatik olarak tedarik ettiğini de sözlerine ekledi.
Biyoinformatik için optimize edilmiş veri depolama
Amazon’un baş geliştirici savunucusu Channy Yun, bir blog yazısında, yeni hizmetin üç ana bileşene dayandığını yazdı: optimize edilmiş depolama, iş akışları için yönetilen bilgi işlem ve belirli analitik türleri için tasarlanmış veri depoları.
Maliyetleri düşürmek için Amazon Omics, ham dizi verilerini depolamak için biyoinformatiğe duyarlı depolama seçeneklerini kullanır. Şirkete göre Amazon Omics, analiz yürütmek için verileri optimize etmek amacıyla ham verileri bir varyant deposuna aktarıyor ve bunu Apache Iceberg Tablosu olarak kullanılabilen sorguya hazır bir şemaya dönüştürüyor.
Hizmet, etkin ve arşiv olmak üzere iki depolama sınıfıyla birlikte gelir.
“Otomatik arşivleme varsayılan olarak açıktır, yani Amazon Simple Storage Service (Amazon S3) Intelligent-Tiering’e benzer şekilde, Amazon Omics düzenli olarak erişilmediği takdirde (30 günden fazla) verileri otomatik olarak daha ucuz depolama sınıfına taşıyacaktır. AWS’de Health AI genel müdürü Tehsin Syed, bir blog gönderisinde şöyle yazdı: depolama sınıfı, müşteriler için maliyet tasarrufu sağlıyor.
Amazon Omics, ham verilerin bir Annotation Store’a aktarılmasını da destekler. Dosya türlerine göre işaretlenen veya etiketlenen verilere açıklamalı veriler denir.
Bilim adamları ve diğer kullanıcılar, hizmetin konsolu aracılığıyla verileri nesne deposuna aktarmaya başlayabilir.
Hizmetin yönetilen bilgi işlem bileşeni, bilim insanlarına, Amazon Omics depolama veya Amazon S3’ten küçük miktarlardaki analitik verilere kadar büyük miktarlarda ham dizi verisini ayrıştırmak için tasarlanmış bir dizi koordineli görevin komut dosyalarını içeren biyoinformatik iş akışlarını çalıştırmaları için kaynaklar sağlar. Şirket, genom mutasyonları olarak, bilim adamlarının ve diğer kullanıcıların her görev için gereken bilgi işlem kaynaklarını belirtmeleri gerektiğini de sözlerine ekledi.
Syed, “Bu da, bu iş akışlarını uygun ölçekte çalıştırma ve yönetmeyle ilgili tüm farklılaştırılmamış ağır yükleri ortadan kaldırıyor” diye yazdı ve iş akışlarının içindeki komut dosyalarının Nextflow veya Workflow Açıklama Dili gibi dillerde yazılabileceğini ekledi.
Amazon HealthLake gibi diğer hizmetlerle birlikte kullanılabilen yeni hizmet artık ABD Doğu (Kuzey Virginia), ABD Batı (Oregon), Asya Pasifik (Singapur), Avrupa (Frankfurt), Avrupa (İrlanda)’da kullanıma sunuldu. ) ve Avrupa (Londra) bölgeleri.
Yakında daha fazla bölge için desteğin gelmesi beklenirken, hizmetin fiyatlandırmasıyla ilgili ayrıntılar hemen mevcut değildi.
Telif hakkı © 2022 IDG Communications, Inc.
Kaynak : https://www.infoworld.com/article/3681551/amazon-omics-aims-to-optimize-biological-data-analysis-at-scale.html#tk.rss_all