全部產品
Search
文件中心

:AGS概覽

更新時間:Jul 17, 2024

阿里雲基因計算AGS(Alibaba Cloud Genomics Service)是由阿里雲推出極速、低成本、高精度的基因組測序二級分析的雲端服務,主要提供以容器平台為基礎的生物資訊工作流程服務和無需搭建叢集,開箱即用的加速API服務。本文介紹什麼是AGS及其應用優勢。

什麼是AGS

AGS主要應用於基因組測序二級分析,通過AGS加速API只需要15分鐘即可完成一個30X WGS的基因比對、排序、去重、變異檢測全流程,相比經典流程可加速120倍,比目前全球最快的FPGA/GPU方案仍能提速2~4倍。

通過分析個體基因序列的突變機制,可為遺傳病檢測、腫瘤篩查等提供有力支撐,未來將在臨床醫學和基因診斷方面發揮巨大作用。人類全基因組有約30億個堿基對,一個30X的WGS測序資料量大約在100 GB。AGS在計算速度、精準度、成本、易用性、與上遊測序儀的整合度上具有極大優勢,同時適用於DNA的SNP/INDEL以及CNV結構變異檢測,以及DNA/RNA病毒檢測等情境。

AGS的優勢

  • 極速、精準:經過實際測試,整套方案在15分鐘內完成了8組30X WGS樣本二級分析處理。在保證精度的前提下,實現15分鐘對7200億堿基拼裝、排序、去重、變異檢測,完成基因檢測全流程120倍加速。且通過NA12878測試資料集與金標準VCF比較,二級分析的精度高於或等於BWA-0.7.17/GATK 4.1.3的資料產出,SNP精度到達99.80%。 AGS_overview_01

    資料集:30X NA12878

    SNP

    RECALL

    PRECISION

    F1

    GATK 4.1版

    99.86%

    99.79%

    99.82%

    AGS版

    99.86%

    99.80%

    99.83%

    INDEL

    RECALL

    PRECISION

    F1

    GATK 4.1版

    99.28%

    99.70%

    99.49%

    AGS版

    99.27%

    99.68%

    99.47%

  • 成本大幅最佳化:阿里雲ACK/AGS提供雲上PaaS加速能力,以混合雲方式協助華大基因完成自主測序儀大批量下機資料二級分析。同時實現二級分析計算行業內低成本,縮短交付周期95%。

  • 適用情境廣,具體表現在以下兩個方面:

    • 在保證分析通量的同時滿足靈活性需求,可根據不同平台和資料定製分析流程。為各大測序服務商、研究機構等提供更簡單更高效的儲存、自動化分析、資料轉送、專案協作以及生物資訊工具開發等方面的解決方案。

    • AGS能夠提供Kubernetes-native工作流程機制,協助使用者在Kubernetes叢集上運行支援DAG的工作流程。在處理基因計算,資料計算等情境具有良好的通用性。

  • 簡單易用:AGS憑藉雲端的自動調整特性,實現大規模彈性調度計算。在使用上,該方案使用者無需關心基因資料處理過程中的計算資源、處理邏輯、資料緩衝等細節,只需將下機資料(FASTQ檔案)上傳至OSS,以及授權Bucket給AGS服務,即可高效、快速完成整個資料分析流程,並將結果資料上傳到使用者期望的儲存空間。

相關文檔

除了上述所提及特點,AGS產品還成功解決了工作流程組裝管理,海量資料存放區、遷移與傳輸、安全合規等行業痛點問題。詳情請參見以下文檔。