Regeneron 使用 AWS 將大規模基因體學用於藥物發現
2022 年
單單在 2020 年,12 家最大的生物製藥公司在藥品研發上的支出就超過 960 億美元,藥物開發成本持續穩定成長。每年只有少數新藥成功獲得批准並實現商業化,絕大多數實驗性藥物未能上市。為了提高成功率,生物製藥企業正在將基因體學引入藥物研發過程,利用基因資料來更好地了解藥物反應。儘管仍處於採用的早期階段,但這種稱為藥物基因體學的做法已經讓成功率翻倍。如今,人類基因體中只有百分之五的基因是已批准藥物的標靶,儘管與疾病有關的基因要多得多。
國際生物技術和製藥公司 Regeneron 正在使用 Amazon Web Services (AWS) 整合基因體洞察,協助該產業轉向加速及改善藥物發現。Regeneron Genetics Center (RGC) 是一項研究計畫,聚焦於對外顯子組 (人類基因體的基因編碼區域) 進行測序,並支援對基因體和健康資料進行大規模分析,以獲得可用於 Regeneron 自家藥物開發計畫和更廣泛研究社區的可操作科學結果。
「如果沒有 AWS 雲端基礎設施無與倫比的可擴展性,我們就無法進行富有洞察力的大規模不可知分析。」
Jeffrey Reid 博士
Regeneron Genetics Center 資料長
在採用 AWS 技術的平台上進行大規模基因體發現
一次分析成千上萬個基因體,能讓研究人員發現疾病與特定遺傳變異之間的關聯,若僅分析少數人群就不易發現這種關聯。資料集越大、越多樣化,科學發現就越有可能適用於各種患者。為了在全球範圍內建立這些全面的資料集,Regeneron 與 UK Biobank 和 AWS 合作夥伴 DNAnexus 等組織密切合作,從數百萬志願者處取得基因樣本和健康資訊。
Regeneron 及其協作者使用可在雲端中提供安全、可調整運算容量的 Amazon Elastic Compute Cloud (Amazon EC2) 網路服務,因而得以加快這些基因樣本的外顯子組測序和處理。取得的數 PB 經匿名處理的健康和基因體資料則使用物件儲存服務 Amazon Simple Storage Service (Amazon S3) 安全地儲存。相較於內部部署伺服器,將這些資訊儲存在 Amazon S3 上為 Regeneron 節省了 90% 的成本。到 2021 年,RGC 對超過一百萬個基因體進行了測序,其測序速度是本機儲存和運算所能達到的速度的 10 倍。
獲得基因體資料後,AWS 提供了 Regeneron 根據資料做出科學發現所需的分析能力。特別是,RGC 在執行深度分析程序 (「全方位分析」) 方面處於領先地位,其中涉及搜尋大量基因體資料集,以確定資料庫中存在的任何表型和基因型之間的所有關聯,最終為藥物發現和開發工作提供資訊。
「全方位分析的關聯結果表包含超過一兆個細胞。」RGC 資料長 Jeffrey Reid 博士表示,「如果沒有 AWS 雲端基礎設施無與倫比的可擴展性,我們就無法進行這些富有洞察力的大規模不可知分析。」
RGC 已與各種學術和製藥產業團體展開研究合作,為自訂計畫型分析提供資料。研究人員可以使用 Amazon Elastic File System (Amazon EFS) 安全地存取 Amazon S3 上的資料並管理計畫所需的檔案。Amazon EFS 是一種簡單、無伺服器、一勞永逸的彈性檔案系統,能讓個人共享檔案資料,而無需佈建或管理儲存。
「使用 AWS,我們能夠實現兩全其美,讓研究像在學術環境中一樣進行,同時讓研究人員能更好地控制他們使用的基礎設施,例如他們啟動的運算執行個體。」Reid 表示,「為了發揮資料的最大影響,必須最大限度地存取資料。這就是我們使用 AWS 所做的。如果沒有 AWS 解決方案,我們就不可能在這段時間內向全世界這麼多合作夥伴提供如此大規模的資料。」
使用 AWS 實現全球協作以改善人類健康
國際產業協作是加速新基因體發現的關鍵。「我們需要跨越多個機構和地區的工作方式,這也是我們專注於雲端運算的原因之一。」Reid 表示,「使用 AWS 幫助我們提供安全的資料科學平台,我們可以在其中產生資料,並與世界各地的協作者共享資料,應用大規模分析,然後傳播這些結果。」
最大限度地發揮基因體資料的影響力,意味著要最大限度地提高樣本和正在進行的不同研究計畫中的代表性。RGC 在全球有 100 多名協作者共同努力收集多樣化的基因體資料集,這將讓分析更強大,結果更廣泛適用。
「我們正在積極努力改善資料庫中遺傳血統的多樣性,因為我們知道,由於歷史上對歐洲血統的關注,有許多洞察尚未被發現。」Reid 表示,「透過在 AWS 上建置,我們可以普及全球存取,確保將來使用精準醫療和多基因風險評等來真正改善所有血統人群的公平照護。」
關於 Regeneron
Regeneron 是一家生物技術和製藥公司,致力於加速和改善傳統藥物開發程序。
AWS 的優勢
- 以 10 倍的速度對超過 100 萬個外顯子組進行測序
- 在 AWS 上儲存基因體資料,較內部部署儲存節省 90% 的成本
- 支援不可知的全面資料分析,以發現基因體洞察
- 普及存取以改善為精準醫療提供資訊之基因體資料集的多樣性
- 發現基於基因標靶的新型藥物
使用的 AWS 服務
Amazon Elastic File System
Amazon Elastic File System 提供了簡單、無伺服器、一勞永逸的彈性檔案系統,能讓您為 AWS 運算服務快速而簡單地建立和設定共享檔案系統。
Amazon Elastic Compute Cloud
Amazon Elastic Compute Cloud (Amazon EC2) 提供最廣泛、最深入的運算平台,擁有超過 475 個執行個體,可選擇最新處理器、儲存、聯網、作業系統和購買模型,以協助您最有效地滿足工作負載需求。
Amazon S3
Amazon Simple Storage Service (Amazon S3) 物件儲存服務提供領先業界的可擴展性、資料可用性、安全性及效能。
入門
各行各業各種規模的組織每天都在使用 AWS 來變革其業務和履行其使命。
聯絡我們的專家,立即開始您的專屬 AWS 雲端之旅。