Illumina 使用 AWS 將基因體學從樣本轉變為答案
2021
在過去的十年中,基因體學已經從一個專業研究領域發展成為一種強大的臨床工具,開創了以患者為中心的醫療保健新時代。基因體定序和分析變得更簡單、更便宜和更全面,讓臨床醫生能為個別患者安排基因檢測,研究人員能檢查數千個樣本以取得遺傳變異與人類疾病之間的連結。雖然第一個人類基因組歷經數十年才能定序,但科學家現在可以在 24 小時內有效率地對整個人類基因組進行定序。
Illumina 的使命為開啟基因體的力量以改善人類健康。作為 AWS 合作夥伴,該公司一直是基因體學技術進步的驅動力,自 2013 年以來,從定序儀器供應商發展為完整的基因體解決方案提供者,並在 Amazon Web Services (AWS) 上部署軟體解決方案。Illumina 的 AWS 支援軟體解決方案正在降低入門檻,並協助研究人員每天都有新的發現、推動藥物發現等等。
Illumina 的財務長 Susan Tousi 表示:「從直接面對消費者的測試到個人化的癌症疫苗,基因體學產業正在向各個方向擴展。Illumina 的目標是在全球普及基因體學技術;我們從一開始就與 AWS 合作,為我們的客戶提供他們需要的答案。過去十年中,我們已擴展了在 AWS 上可用的軟體組合,以提供無縫、整體的解決方案套組,可以開箱即用地部署或訂製以滿足特定需求。」
我們正在安全的 AWS 環境中提供完整的工作流程,從樣品製備到三級分析,允許匯總和分析定序前後產升的所有資訊。」
Rami Mehio
Illumina 生物資訊學和儀器軟體部副總裁
從樣本導航到答案
完整的次世代基因體學工作流程從樣本收集、製備和定序開始,但這僅僅是開始。之後是繁重的生物資訊學提升,從原始讀取品質控制、資料預處理和調正開始。然後,科學家可以進行二次分析,如變異點偵測,最後根據他們有興趣的部分進行進階的三級分析。這些三級分析可以包括系統發育註解、基因型 - 表型關聯等等。對於不是生物資訊學專家的研究人員和臨床醫生來說,在單獨的平台上執行每一步驟很快就會變得不堪負荷。
Illumina 為客戶簡化了整個基因體學工作流程,為每一步驟提供整合的解決方案。從一開始,BaseSpaceTM Clarity LIMS (實驗室資訊管理系統) 就協助基因體學客戶追蹤樣本並優化定序的工作流程。定序儀器可以將資料直接上傳至 Illumina 連接分析 (ICA) 平台,使用者可以在 AWS 上管理資料集並利用平台內的分析工具。DRAGENTM Bio-IT 平台可提供準確、超快速的二次分析結果。同時,BaseSpace 關聯引擎將個人資料集和查詢整合至開放存取和控制存取公共資料集的儲存庫中,以啟用各種三級分析。
這些平台的資料儲存在 Amazon Simple Storage Service (Amazon S3) 上,這是一種可擴展的目標儲存服務。Illumina 的客戶使用在 Amazon Elastic Compute Cloud (Amazon EC2) 上運行的 DRAGEN 來驅動並顯著加速他們的分析,這是一種在雲端中提供安全、可調整運算容量大小的 Web 服務。
Illumina 軟體和生物資訊學部副總裁 Rami Mehio 表示:「我們正在安全的 AWS 環境中提供完整的工作流程,從樣品製備到三級分析,允許匯總和分析定序前後產升的所有資訊。這對於希望隨著時間的推移追蹤樣本、將資料與公開資料庫交叉引用以及收集見解以獲得更快結果的客戶來說非常強大。」
雖然進階使用者可以選擇訂製 ICA 和 DRAGEN 等工具來執行利基研究,但 Illumina 還提供具有開箱即用功能的端對端雲端解決方案,以滿足特定用途。其中包括 TruSightTM 軟體套組,一種用於發現罕見疾病見解的變異分析軟件解決方案,以及 TruSight Oncology 500,一種用於分析腫瘤和識別免疫腫瘤學生物標記的微調定序分析。
Mehio 表示:「我們憑藉 AWS 工具的效力作為支柱,使我們能夠專注於設計基因體學特定的演算法。隨著研究人員和臨床醫生的需求變更,我們可以輕鬆部署我們產品的新功能和版本。」
透過在 AWS 上節省成本來降低整體成本
自成立以來,Illumina 以超過摩爾定律的速度降低了基因體學技術的成本。 2001 年,對單一人類基因體進行定序的成本超過 1 億美元;20 年後,其成本可以低至 600 美元。
Tousi 表示:「我們希望普及基因體學技術;將節省的成本回饋給我們的客戶是這項成果的重要職責。成本不應成為研究或臨床應用的決定因素,人們應該完全根據他們預期使用資料的方式來進行定序和分析。」
Amazon S3 儲存類別可以根據不同的資料需求進行訂製,使 Illumina 可以輕鬆以最大限度節省成本來進行優化。透過在 Amazon S3 Glacier Deep Archive 中儲存數 PB 不常存取的資料,Illumina 客戶節省了 90% 以上的儲存成本。同樣,DRAGEN 在 Amazon EC2 F1 執行個體上執行,這些執行個體提供經濟實惠的加速運算,可以支援 Illumina 需要的平行處理。F1 執行個體提供客製化的硬體加速和 DRAGEN 現場可程式化閘道陣列 (FPGA)。 為了跨越 F1 執行個體擴展 DRAGEN,該公司使用 AWS Batch,這是一種完全託管的批次處理服務,用於計劃、排程和執行批次處理運算工作負載。
Mehio 表示:「AWS 為我們提供了優化速度、靈活性和成本的選項,並滿足終端客戶的使用案例和需求。一些使用者可能希望盡快進行基因分析,而一些學術使用者可能會選擇犧牲一些速度來降低成本並節省研究費用。透過利用不同的 F1 執行個體類型和儲存選項,我們的使用者可以保持靈活性以及根據需要進行縱向擴展和縮減的能力。」
Illumina 還透過在 Amazon EC2 Spot 執行個體上執行其平台的許多運算作業來降低客戶的成本,與依要求的定價相比,這些作業可享受高達 90% 的折扣。 Tousi 表示:「僅在過去一年,我們的客戶就使用了數十萬小時的 Spot 執行個體,這為他們節省了大量成本。」
成本節省和技術優勢可以齊頭並進。Illumina 最近將三級分析關聯引擎 遷移至 AWS,節省了成本,同時將資料擷取管道擴展了六倍,使知識庫增長更快,變得更強大。
用於擴展全球基因體學的安全解決方案
人類基因體資料可能與高度個人化的健康資訊相關聯,而資料洩露對全球醫療保健組織來說是一個不斷增長的風險。因此,安全性是 Illumina 及其客戶的首要考慮因素,其中許多客戶必須遵守日益嚴格的資料管理法規。
Tousi 表示:「安全是比任何第一要務都更重要,是我們所做一切的核心。在最基礎,我們可以依賴 AWS 共同責任模式來確保我們基本的雲端基礎設施保持企業級安全性和法規符合性。透過全球利用 Amazon EC2 區域,我們將運算引入資訊,為所有區域的客戶提供支援,同時讓他們保持資料主權。」
AWS 支持數以千計的安全標準和法規符合性認證,包括 HIPAA、GDPR、ISO 27001 和 ISO 13485,協助客戶在其基因體學工作流程中滿足法規符合性要求。Illumina 透過在 Amazon Virtual Private Cloud (Amazon VPC) 中提供資料管理讓客戶更加安心,該雲端在邏輯隔離的自訂虛擬網路中啟動其他 AWS 資源,將一個客戶的資料與另一個客戶的資料分開。
這種全球的可擴展性和部署促進了長期專案和權宜危機應對的有意義合作。2020 年和 2021 年上半年,全球研究人員在 Illumina 的 COVID-19 BaseSpace 應用程式上處理了超過 371,000 個與 COVID-19 相關的樣本。Tousi 表示:「如果客戶只能在內部部署執行此操作,我們將遭遇嚴重的限制。因此,雲端是在該層級上為全球流行病應對提供動力的關鍵。」
建置基因體學和生物科技的未來
隨著大規模族群遺傳學的興起以及對 ICA 等強大分析軟體解決方案的存取範圍不斷擴大,Illumina 正在充分利用基因體學中「大數據」的力量,幫助客戶從大量定序資料中挖掘豐富的見解。這些專案將推動個人化基因體學的新時代,使研究人員能夠在基因和健康狀況間建立連結,這些連結在較小的樣本中並不明顯。
Illumina 平台還協助研究無縫過渡到多體學的未來。例如,以雲端為基礎的 DRAGEN 單細胞 RNA 管道允許科學家註解單個細胞中的基因表現。藉由 DRAGEN 加速,該平台可以在大約 53 分鐘內同時並行處理三個細胞樣本。
Mehio 表示:「藉由在 AWS 上部署的 ICA、DRAGEN 和其他工具,我們提供的解決方案使客戶能夠匯集任何資料類型,包括 NGS 和健康資料,以從這些大型群組中提取新資訊並大規模改善人類健康。」
進一步了解
了解 AWS 如何支援其他領先的生命科學組織尋求改善人類健康。
關於 Illumina
Illumina 開發、製造和銷售用於分析遺傳變異和生物功能的整合系統。
AWS 的優勢
- 便於存取簡化、統一、客製化的樣本到分析工作流程
- 使用 Amazon EC2 Spot 執行個體和 Amazon S3 Glacier 顯著降低運算和儲存成本
- 在安全和符合法規的環境中,全球部署了強大的基因體學解決方案組合
- 加速研究並促進全球客戶的合作,處理超過 371,000 個 COVID-19 相關的樣本
使用的 AWS 服務
Amazon EC2
Amazon Elastic Compute Cloud (Amazon EC2) 是一種 Web 服務,可在雲端提供安全、可調整大小的運算容量。該服務旨在降低開發人員進行 Web 規模雲端運算的難度。
Amazon S3
Amazon Simple Storage Service (Amazon S3) 物件儲存服務提供領先業界的可擴展性、資料可用性、安全性及效能。
AWS 虛擬私有雲端
Amazon Virtual Private Cloud (Amazon VPC) 服務可讓您在您定義的邏輯隔離虛擬網路中啟動 AWS 資源。
Amazon EC2 Spot 執行個體
透過 Amazon EC2 Spot 執行個體,您可以利用 AWS 雲端中未使用的 EC2 容量。與隨需價格相比,Spot 執行個體最高可享受 90% 的折扣。
開始使用
各行各業、各種規模的公司每天都在使用 AWS 來轉型業務。聯絡我們的專家,立即開始 AWS 雲端之旅。