概觀
使用 AWS HealthOmics 時,您只需依用量付費。系統根據資料儲存量以及用於處理工作流程的運算執行個體計費。AWS HealthOmics 可用於儲存序列和參考資料物件或變體和註釋資料。您也可以執行生物資訊學工作流程來分析和轉換基因體學、轉錄組學和其他體學資料。 AWS HealthOmics 已針對體學資料的儲存與運算進行優化,並可與 Amazon SageMaker、Amazon Simple Storage Service (S3) 和 Amazon Athena 等其他 AWS 服務搭配使用。
免費方案
AWS 免費方案可讓您免費開始使用 AWS HealthOmics。免費方案從您建立第一個 AWS HealthOmics 資源的第一個月開始計算。下表提供 AWS HealthOmics 免費方案的詳細資訊。
前 2 個月的每月免費方案用量 |
|
AWS HealthOmics 儲存 | 作用中儲存類別為 1,500 Gb (每月),封存儲存類別為 1,500 Gb (每月) |
AWS HealthOmics 工作流程 | omics.m.xlarge 執行個體或同等運算執行個體 275 個小時,以及 49,000 GB (每小時) 執行儲存 |
AWS HealthOmics 分析 | 200 GB (每月) |
AWS 客戶每月可免費將 100 GB (彙總所有 AWS 服務和區域 (中國和 GovCloud 除外) 的用量) 資料傳出至網際網路。
AWS HealthOmics 儲存定價
當您在 AWS HealthOmics 儲存體中存放基因組序列時,可按月支付每 Gb 的儲存費用。1 Gb (gigabase) 表示所匯入序列檔案 (例如 FASTQ、BAM 和 CRAM) 中的 10 億個基底。 AWS HealthOmics 儲存體會存放來源檔案中的基底、品質得分、比對以及其他中繼資料。您可按儲存的 Gb 數付費,因此無須擔心最佳檔案格式或壓縮技術。 AWS HealthOmics 會負責處理所有工作。
序列物件稱為讀取集,在邏輯上等同於 FASTQ、BAM 或 CRAM 檔案。 AWS HealthOmics 儲存體會提供讀取集的作用中儲存類別與封存儲存類別。封存類別讀取集的每月儲存費用低於作用中類別的讀取集。系統僅需數毫秒時間即可存取作用中類別讀取集,而封存方案讀取集必須經過啟動方可存取。若 30 天未存取讀取集,系統會將這些讀取集自動移入較低成本的封存儲存類別,除非受到重新啟用。
讀取集無匯入費用。 AWS HealthOmics 儲存體資料需支付 30 天最低儲存費用,30 天內刪除的資料會依比例計費,等同與剩餘儲存天數的費用。 AWS HealthOmics 儲存體旨在將長效但不常存取的資料保留數年。
存取 AWS HealthOmics 儲存資料有兩種方式:透過 HealthOmics API 讀取、寫入和更新,以及透過 S3 API 讀取。 若是透過 HealthOmics API 存取,您需要為讀取集物件產生的 GET 請求付費。讀取集的所有其他 HealthOmics 請求類型則免費。若要透過 S3 API 存取,COPY 和 LIST 請求會與所有其他請求類型分開計費。
AWS HealthOmics 分析定價
AWS HealthOmics 分析可協助您準備基因組變體資料與基因組註釋,以便與 Amazon Athena 和 Amazon SageMaker 等廣泛的 AWS 分析與機器學習套件服務搭配使用。您可儲存任意數量的基因組變體資料,且僅需支付儲存內容的費用。資料大小定義為所轉換資料的大小。不過,當您在其他服務中查詢和分析資料時,則需支付這些服務的使用費用。
AWS HealthOmics 分析資料需支付 30 天最低儲存費用,30 天內刪除的資料會依比例計費,等同與剩餘儲存天數的費用。
AWS HealthOmics Ready2Run 工作流程定價
Ready2Run 工作流程是由業界第三方軟體公司和開放原始碼管道封裝的預置工作流程。您只需使用 Ready2Run 工作流程,即可使用最常用的工作流程 (例如 Germline 和 GATK-BP) 來處理資料。Ready2Run 工作流程是依執行付費,表示每個工作流程會向您收取相同價格的費用。若要檢視每個 Ready2Run 工作流程的詳細資訊,請造訪 HealthOmics 主控台。
AWS HealthOmics 私有工作流程定價
私有工作流程可讓您使用以最常用工作流程語言所編寫的專屬生物資訊學指令碼。您可透過單一執行來執行私有工作流程。您僅需依要求付費,系統會針對 Omics 執行個體類型與執行儲存個別計費。工作流程中的所有任務,皆會對應至最適合其定義資源的執行個體。例如,定義為使用 8 個 CPU 和 60 GB RAM 的任務,會對應至 omics.r.2xlarge 執行個體類型以供執行。對於執行儲存,您可以選擇具有較高檔案系統輸送量的統計佈建檔案系統,或是可動態擴展的檔案系統。
資料傳輸
您將支付 HealthOmics 所有傳出頻寬的費用。資料傳輸費不適用於傳輸到與資料存放區在同一 AWS 區域內的任何 AWS 服務的資料。以下定價是根據 AWS HealthOmics 資料量的「傳入」和「傳出」來計算 (透過公有網際網路)†††。進一步了解 AWS Direct Connect 定價。超過 500TB/月的資料傳輸,請聯絡我們。
費率層級考慮了所有 AWS 服務將資料傳送到網際網路的彙總使用量。
††† 在您提前終止連線的情況下,傳出的資料可能和您的應用程式收到的資料不同,例如,如果您請求 10 GB 的物件並在收到前 2 GB 資料後終止連線。AWS HealthOmics 嘗試停止串流資料,但無法立即執行。在此範例中,傳出的資料可能為 3 GB (比您收到的 2 GB 大 1 GB)。因此,將針對傳出的 3 GB 資料向您收費。
定價範例
範例 1
群體測序計畫開始對收集在人體生物資料庫中的個人進行測序。該計畫選擇在西歐 (愛爾蘭) 地區執行此工作。其針對每 130 Gb、50 Gb 的 100,000 名個人進行測序,並將原始測序資料存放在 AWS HealthOmics 儲存體中。在接下來的五年中,這些資料在匯入 30 天過後會保留於封存儲存類別,並且在轉換為作用中儲存類別 30 天中平均受到兩次存取。他們使用 S3 API 來存取檔案。每個基因組分為 500 個部分下載,產生 500 次 GET API 呼叫。單個基因組的五年期總成本為:
作用中儲存類別:0.005769 USD Gb/月 * 130 Gb * 90 天 = 2.22 USD
封存儲存類別:0.001154 USD Gb/月 * 130 Gb * (1825 – 90) 天 = 8.56 USD。
S3 GET API:0.0004 USD/1000 個 API 呼叫 * (2 * 500 個 API 呼叫) = 0.0004 USD
5 年期總成本:2.22 USD + 8.56 USD + 0.0004 USD = 10.78 USD (或 2.15 USD/年)
範例 2
在美國東部 (維吉尼亞北部) 地區,一位生物資訊學科學家想在 AWS HealthOmics 工作流程中執行 Nextflow 工作流程。她的工作流程中有三項任務。第一項任務是保留 16 個 vCPU 和 30 GB 記憶體,執行時間為 3 小時。第二項任務是保留 32 個 vCPU 和 160 GB 記憶體,執行時間為 2 小時。第三項任務是保留 4 個 vCPU 和 10 GB 記憶體,執行時間為 10 分鐘。該客戶註冊工作流程,並透過預設的 1200 GB 檔案系統呼叫 StartRun API。整體成本如下:
任務 1 (omics.c.4xlarge):0.9180 USD/小時 * 3 小時 = 2.754 USD
任務 2 (omics.r.8xlarge):2.7216 USD/小時 * 2 小時 = 5.4432 USD
任務 3 (omics.m.xlarge):0.2592 USD/小時 * 1/6 小時 = 0.0432 USD
靜態執行儲存:0.0001918 USD/GB-小時 * (1200GB*(3小時+2 小時+1/6 小時)) = 1.18916 USD
總計:9.42956 USD
範例 3
在美國東部 (維吉尼亞北部) 地區,一位生物資訊學科學家正在 AWS HealthOmics 中開發新的 WDL 工作流程。她的工作流程中有兩項任務。第一項任務是保留 16 個 vCPU 和 30 GB 記憶體,執行時間為 3.5 小時。第二項任務是保留 32 個 vCPU 和 160 GB 記憶體,執行時間為 2.25 小時。該客戶註冊工作流程,並透過預設的動態檔案系統呼叫 StartRun API。在 5.75 小時的工作流程執行過程中,檔案系統從 0 GB 線性增長至 1043 GB,總共 3000 GB/小時的檔案儲存空間。整體成本如下:
任務 1 (omics.c.4xlarge):0.9180 USD/小時 * 3.5 小時 = 3.213 USD
任務 2 (omics.r.8xlarge):2.7216 USD/小時 * 2.25 小時 = 6.1236 USD
動態執行儲存:0.0004110 USD/GB/小時 * 3,000 GB/小時 = 1.233 USD
總計:10.5696 USD
範例 4
在美國東部 (維吉尼亞北部) 地區,一位資料科學家想使用 Amazon Athena 分析 3,202 個變體呼叫格式 (VCF) 檔案。他先建立了變體存放區,然後使用 AWS HealthOmics API 擷取這些檔案。擷取到的資料大小為 1.5 TB。在接下來的一個月中,他使用 Athena 執行了 1,000 次查詢,針對不同子群體計算對偶基因頻率,平均每次耗用 50 GB。每月整體成本如下:
變體存放區:0.035 USD GB/月 * (1024 GB/TB * 1.5 TB) = 53.76 USD
Amazon Athena:5 USD / TB * 1000 * 50 / 1024 = 244.14 USD
範例 5
一位計算科學家希望在美國東部 (維吉尼亞北部) 區域,針對 30 倍的基因體 Ready2Run 工作流程執行 GATK-BP Germline fq2vcf,以取得 3 個樣本。客戶輸入其資料,並針對每個樣本呼叫 StartRun API。3 次執行的成本如下:
用於 30 倍基因體 Ready2Run 工作流程的 GATK-BP Germline fq2vcf: 10.00 USD/執行 * 3 = 30.00 USD
總計: 30.00 USD