Prezzi di Amazon Bedrock

Panoramica dei prezzi

Amazon Bedrock è un servizio completamente gestito che offre una scelta di modelli di fondazione (FM) ad alte prestazioni attraverso una singola API, insieme a un'ampia gamma di funzionalità necessarie per creare applicazioni di IA generativa garantendo sicurezza, privacy e IA responsabile.

Amazon Bedrock prevede l'addebito dei costi relativi all'inferenza e alla personalizzazione dei modelli. È possibile scegliere tra due piani tariffari per inferenza: 1. On demand e batch: questa modalità consente di utilizzare gli FM con pagamento in base al consumo senza vincoli temporali. 2. Throughput assegnato: questa modalità consente di eseguire il provisioning di un throughput sufficiente per soddisfare i requisiti prestazionali dell'applicazione in cambio di un vincolo temporale.

Modelli di prezzo

Con la modalità On-Demand, paghi solo quello che usi, senza impegni a termine basati sul tempo. Per i modelli di generazione di testo, ti viene addebitato ogni token di input elaborato e ogni token di output generato. Per i modelli di incorporamento, ti viene addebitato un costo per ogni token di input elaborato. Un token è composto da pochi caratteri e si riferisce all'unità di testo di base che un modello impara per comprendere l'input e il prompt dell'utente. Per i modelli di generazione di immagini, viene addebitato un costo per ogni immagine generata. Inferenza multiregionale: la modalità on demand supporta anche l'inferenza multiregionale per alcuni modelli. Consente agli sviluppatori di gestire senza problemi i picchi di traffico utilizzando il calcolo in diverse regioni AWS e di ottenere limiti di throughput più elevati e una maggiore resilienza. Non sono previsti costi aggiuntivi per l'utilizzo dell'inferenza multiregionale e il prezzo viene calcolato in base alla regione in cui è stata effettuata la richiesta (regione di origine).

Con la modalità Batch, puoi fornire una serie di prompt come un singolo file di input e ricevere risposte come un singolo file di output, consentendo di ottenere previsioni simultanee su larga scala. Le risposte vengono elaborate e archiviate nel tuo bucket Amazon S3 in modo da potervi accedere in un secondo momento. Amazon Bedrock offre modelli di fondazione (FM) selezionati dei principali fornitori di IA come Anthropic, Meta, Mistral AI e Amazon per l'inferenza in batch a un prezzo inferiore del 50% rispetto ai prezzi di inferenza on demand. Fare riferimento all'elenco dei modelli qui.

Con la modalità Provisioned Throughput, è possibile acquistare unità modello per uno specifico modello base o personalizzato. La modalità Provisioned Throughput è progettata principalmente per carichi di lavoro di inferenza consistenti di grandi dimensioni che richiedono una velocità di trasmissione effettiva garantita. È possibile accedere ai modelli personalizzati solo utilizzando Provisioned Throughput. Un'unità modello fornisce una determinata velocità di trasmissione effettiva misurata dal numero massimo di token di input o output elaborati al minuto. Con i prezzi Provisioned Throughput, ti vengono addebitati a ore, hai la flessibilità di scegliere tra termini di impegno di 1 mese o 6 mesi.

Con Amazon Bedrock, puoi personalizzare gli FM con i tuoi dati per fornire risposte su misura per attività specifiche e il tuo contesto aziendale. È possibile ottimizzare i modelli con dati etichettati o utilizzare un pre-training continuo con dati non etichettati. Per la personalizzazione di un modello di generazione di testo, viene addebitato il costo dell'addestramento del modello in base al numero totale di token elaborati dal modello (numero di token nel corpus di dati di addestramento moltiplicato per il numero di epoche) e per l'archiviazione del modello addebitato al mese per modello. Un'epoca si riferisce a un passaggio completo del set di dati di allenamento durante la messa a punto o il pre-allenamento continuo. Le inferenze che utilizzano modelli personalizzati vengono addebitate in base al piano Provisioned Throughput e richiedono l'acquisto di Provisioned Throughput. Un'unità modello è resa disponibile senza alcun termine di impegno per l'inferenza su un modello personalizzato. Ti verrà addebitato il numero di ore trascorse che utilizzi nella prima unità modello per l'inferenza del modello personalizzato. Acquistando un periodo di impegno di 1 o 6 mesi, è possibile aumentare il throughput di trasmissione effettivo oltre un'unità modello.

L'importazione di modelli personalizzati consente di sfruttare i precedenti investimenti per la personalizzazione dei modelli all'interno di Amazon Bedrock e di utilizzarli nello stesso modo completamente gestito dei modelli di fondazione esistenti in hosting di Bedrock. È possibile importare pesi personalizzati per le architetture di modelli supportate e servire il modello personalizzato utilizzando la modalità on demand. L'importazione di un modello personalizzato su Bedrock è gratuita. Una volta importato un modello, sarà possibile accedervi on demand senza dover eseguire alcuna azione sul piano di controllo (control-plane). Viene addebitata solo l'inferenza del modello, in base al numero di copie del modello personalizzato necessarie per gestire il volume di inferenza e alla durata di attivazione di ciascuna copia del modello, fatturata in finestre di 5 minuti. Una copia del modello è una singola istanza di un modello importato pronto a soddisfare le richieste di inferenza. Il prezzo per copia del modello al minuto dipende da fattori quali architettura, lunghezza del contesto, regione AWS, versione dell'unità di calcolo (generazione di hardware) ed è classificato in base alla dimensione della copia del modello.

Strumenti avanzati

Amazon Bedrock Agents offre la possibilità di creare e configurare agenti autonomi all'interno di un'applicazione. Tali agenti si connettono in modo sicuro alle origini dati dell'azienda e arricchiscono le richieste degli utenti con le informazioni giuste per generare risposte accurate. Bastano pochi passaggi per creare un agente in Amazon Bedrock, riducendo il tempo necessario per sviluppare applicazioni di IA generativa. Questi agenti supportano l'interpretazione del codice per generare ed eseguire dinamicamente il codice e il ritorno del controllo, consentendo di definire uno schema di azione e riottenere il controllo ogni volta che l'agente richiama l'operazione. Inoltre, gli agenti Amazon Bedrock possono conservare la memoria tra le interazioni, offrendo esperienze utente più personalizzate e fluide.

Amazon Bedrock Guardrails consente di implementare protezioni personalizzate e policy di IA responsabile per le applicazioni di IA generativa. Fornisce protezioni di sicurezza aggiuntive personalizzabili oltre alle protezioni native offerte dagli FM. È l'unica funzionalità di IA responsabile offerta da un importante provider di cloud che consente ai clienti di creare e personalizzare protezioni di sicurezza, privacy e veridicità per le loro applicazioni di IA generativa in un'unica soluzione ed è compatibile con tutti gli FM di Amazon Bedrock e con i modelli ottimizzati. Bedrock Guardrails può anche essere integrato con Amazon Bedrock Agents e Amazon Bedrock Knowledge Bases per creare applicazioni di IA generativa in linea con le policy di IA responsabile dell'azienda. Inoltre, offre l'API ApplyGuardrail per valutare gli input degli utenti e modellare le risposte generate da qualsiasi FM personalizzato o di terze parti al di fuori di Bedrock.

Con la valutazione dei modelli su Amazon Bedrock paghi in base all'utilizzo, senza impegni di volume sul numero di richieste o risposte. Per la valutazione automatica, paghi solo l'inferenza derivante dal modello scelto nella valutazione. I punteggi algoritmici generati automaticamente vengono forniti senza costi aggiuntivi. Per la valutazione basata sull'uomo, in cui coinvolgi il tuo team di lavoro, ti verrà addebitato l'inferenza del modello nella valutazione e un costo di 0,21 USD per attività umana completata. Un'attività umana è definita come un'istanza in cui un lavoratore umano invia una valutazione di un singolo prompt e delle relative risposte di inferenza nell'interfaccia utente di valutazione umana. Il prezzo è lo stesso indipendentemente dal fatto che tu abbia uno o due modelli nel tuo lavoro di valutazione e lo stesso indipendentemente dal numero di parametri di valutazione e metodi di valutazione che includi. I costi per le attività umane appariranno nella sezione Amazon SageMaker della fattura AWS e sono gli stessi per tutte le Regioni AWS. Non è previsto alcun costo separato per la forza lavoro, poiché la forza lavoro viene fornita da te. Per una valutazione gestita da AWS, i prezzi sono personalizzati in base alle tue esigenze di valutazione, mediante un accordo privato con il team di valutazione degli esperti di AWS.

Amazon Bedrock Knowledge Bases fornisce un flusso di lavoro di generazione potenziata tramite recupero (RAG) end-to-end completamente gestito, che consente a FM e agenti di accedere a informazioni contestuali dalle origini dati private dell'azienda. Ciò consente loro di fornire risposte più pertinenti, accurate e personalizzate. È possibile connettere in modo sicuro FM e agenti a più origini dati come Amazon S3, Confluence, Salesforce e SharePoint. Se non è presente un database vettoriale, Amazon Bedrock crea per conto del cliente un archivio vettoriale Amazon OpenSearch Serverless. In alternativa, è possibile specificare un archivio vettoriale esistente in uno dei database supportati, tra cui Amazon OpenSearch Serverless, Pinecone, Redis Enterprise Cloud, Amazon Aurora e MongoDB. Inoltre, è possibile ottimizzare il recupero e l'inserimento per ottenere una maggiore precisione in tutti i casi d'uso utilizzando le opzioni di analisi avanzate per dati non strutturati, le opzioni di suddivisione in blocchi dei dati (come la suddivisione in blocchi personalizzati) o le strategie di suddivisione in blocchi integrate (tra cui predefinita, a dimensione fissa, senza suddivisione in blocchi, suddivisione gerarchica o suddivisione in blocchi semantica).

Dettagli sui prezzi

Il prezzo dipende dalla modalità, dal fornitore e dal modello. Seleziona il fornitore del modello per visualizzare i prezzi dettagliati.

Amazon Bedrock offre modelli di fondazione (FM) selezionati dei principali fornitori di intelligenza artificiale come Anthropic, Meta, Mistral AI e Amazon per l'inferenza in batch a un prezzo inferiore del 50% rispetto ai prezzi di inferenza on demand. Fai riferimento all'elenco dei modelli qui.

  • AI21 Labs
  • AI21 Labs

    Prezzi on-demand

    Modelli AI21 Labs Prezzo per 1.000 token di input Prezzo per 1.000 token di output
    Jamba 1.5 Large 0,002 USD 0,008 USD
    Jamba 1.5 Mini 0,0002 USD 0,0004 USD
    Jurassic-2 Mid 0,0125 USD 0,0125 USD
    Jurassic 2 Ultra 0,0188 USD 0,0188 USD
    Jamba-Instruct 0,0005 USD 0,0007 USD
  • Amazon
  • Amazon

  • Anthropic
  • Anthropic

    Prezzi su richiesta e in batch

    Regione: Stati Uniti orientali (Virginia settentrionale) e Stati Uniti occidentali (Oregon)

    Modelli antropici Prezzo per 1.000 token di input Prezzo di 1.000 token di output Prezzo di 1.000 token di input (batch) Prezzo di 1.000 token di output (batch)

    Claude 3.5 Sonnet**

    0,003 USD

    0,015 USD

    0,0015 USD

    0,0075 USD

    Claude 3 Opus*

    0,015 USD

    0,075 USD

    0,0075 USD

    0,0375 USD

    Claude 3 Haiku

    0,00025 USD

    0,00125 USD

    0,000125 USD

    0,000625 USD

    Claude 3 Sonnet

    0,003 USD

    0,015 USD

    0,0015 USD

    0,0075 USD

    Claude 2.1

    0,008 USD

    0,024 USD

    N/D

    N/D

    Claude 2.0

    0,008 USD

    0,024 USD

    N/D

    N/D

    Claude Instant

    0,0008 USD

    0,0024 USD

    N/D

    N/D

    *Claude 3 Opus è al momento disponibile solo nella regione degli Stati Uniti occidentali (Oregon)
    **I prezzi di Claude 3.5 Sonnet si applicano a tutte le versioni di Claude 3.5 Sonnet (v1 e v2) - Claude 3.5 Sonnet v2 è attualmente disponibile nella regione Stati Uniti occidentali (Oregon)

    Regione: Europa (Londra)

    Modelli Anthropic Prezzo per 1.000 token di input Prezzo di 1.000 token di output Prezzo di 1.000 token di input (batch) Prezzo di 1.000 token di output (batch)

    Claude 3 Sonnet

    0,003 USD

    0,015 USD

    0,0015 USD 0,0075 USD

    Claude 3 Haiku

    0,00025 USD

    0,00125 USD

    0,000125 USD

    0,000625 USD

    Regione: Sud America (San Paolo)

    Modelli antropici Prezzo per 1.000 token di input Prezzo di 1.000 token di output Prezzo di 1.000 token di input (batch) Prezzo di 1.000 token di output (batch)

    Claude 3 Sonnet

    0,003 USD

    0,015 USD

    0,0015 USD

    0,0075 USD

     

    Claude 3 Haiku

    0,00025 USD

    0,00125 USD

    0,000125 USD

     

    0,000625 USD

     

    Regione: Canada (Centrale)

    Modelli antropici Prezzo per 1.000 token di input Prezzo di 1.000 token di output Prezzo di 1.000 token di input (batch) Prezzo di 1.000 token di output (batch)

    Claude 3 Sonnet

    0,003 USD

    0,015 USD

    0,0015 USD

     

    0,0075 USD

    Claude 3 Haiku

    0,00025 USD

    0,00125 USD

    0,000125 USD

     

    0,000625 USD

    Regione: Asia Pacifico (Mumbai)

    Modelli antropici Prezzo per 1.000 token di input Prezzo di 1.000 token di output Prezzo di 1.000 token di input (batch) Prezzo di 1.000 token di output (batch)

    Claude 3 Sonnet

    0,003 USD

    0,015 USD

    0,0015 USD

     

    0,0075 USD

    Claude 3 Haiku

    0,00025 USD

    0,00125 USD

    0,000125 USD

     

    0,000625 USD

    Regione: Asia Pacifico (Sydney)

    Modelli antropici Prezzo per 1.000 token di input Prezzo di 1.000 token di output Prezzo di 1.000 token di input (batch) Prezzo di 1.000 token di output (batch)

    Claude 3 Sonnet

    0,003 USD

    0,015 USD

    0,0015 USD

     

    0,0075 USD

    Claude 3 Haiku

    0,00025 USD

    0,00125 USD

    0,000125 USD

     

    0,000625 USD

    Regione: Asia Pacifico (Tokyo)

    Modelli antropici Prezzo per 1.000 token di input Prezzo di 1.000 token di output Prezzo di 1.000 token di input (batch) Prezzo di 1.000 token di output (batch)

    Claude Instant

    0,0008 USD

    0,0024 USD

    N/D

     

    N/D

    Claude 2.0/2.1

    0,008 USD

    0,024 USD

    N/D

    N/D

    Claude 3 Haiku

    0,00025 USD

    0,00125 USD

    0,000125 USD

     

    0,000625 USD

    Claude 3.5 Sonnet

    0,003 USD

    0,015 USD

    0,0015 USD

     

    0,0075 USD

    Regione: Asia Pacifico (Singapore)

    Modelli antropici Prezzo per 1.000 token di input Prezzo di 1.000 token di output Prezzo di 1.000 token di input (batch) Prezzo di 1.000 token di output (batch)

    Claude Instant

    0,0008 USD

    0,0024 USD

    0,0004 USD

     

    0,0012 USD

    Claude 2.0/2.1

    0,008 USD

    0,024 USD

    0,004 USD

     

    0,012 USD

    Claude 3 Haiku

    0,00025 USD

    0,00125 USD

    0,000125 USD

     

    0,000625 USD

    Claude 3.5 Sonnet

    0,003 USD

    0,015 USD

    N/D

    N/D

    Regione: Europa (Parigi)

    Modelli antropici Prezzo per 1.000 token di input Prezzo di 1.000 token di output Prezzo di 1.000 token di input (batch) Prezzo di 1.000 token di output (batch)

    Claude 3 Haiku

    0,00025 USD

    0,00125 USD

    0,000125 USD

     

    0,000625 USD

    Claude 3 Sonnet

    0,003 USD

    0,015 USD

    0,0015 USD

     

    0,0075 USD

    Regione: Europa (Francoforte)

    Modelli antropici Prezzo per 1.000 token di input Prezzo di 1.000 token di output Prezzo di 1.000 token di input (batch) Prezzo di 1.000 token di output (batch)

    Claude Instant

    0,0008 USD

    0,0024 USD

    N/D

    N/D

    Claude 2.0/2.1

    0,008 USD

    0,024 USD

    N/D

    N/D

    Claude 3 Sonnet

    0,003 USD

    0,015 USD

    0,0015 USD

     

    0,0075 USD

    Claude 3.5 Sonnet

    0,003 USD

    0,015 USD

    0,0015 USD

     

    0,0075 USD

    Claude 3 Haiku

    0,00025 USD

    0,00125 USD

    0,000125 USD

     

    0,000625 USD

    Regione: Asia Pacifico (Seoul)

    Modelli Anthropic Prezzo per 1.000 token di input Prezzo di 1.000 token di output Prezzo di 1.000 token di input (batch) Prezzo di 1.000 token di output (batch)

    Claude 3.5 Sonnet

    0,003 USD

    0,015 USD

    N/D

     

    N/D

    Claude 3 Haiku

    0,00025 USD

    0,00125 USD

    N/D

     

    N/D

    Regione: Stati Uniti orientali (Ohio)

    Modelli Anthropic Prezzo per 1.000 token di input Prezzo di 1.000 token di output Prezzo di 1.000 token di input (batch) Prezzo di 1.000 token di output (batch)

    Claude 3.5 Sonnet

    0,003 USD

    0,015 USD

    N/D

     

    N/D

    Claude 3 Haiku

    0,00025 USD

    0,00125 USD

    N/D

     

    N/D

    Prezzi del throughput assegnato

    Regione: Stati Uniti orientali (Virginia settentrionale) e Stati Uniti occidentali (Oregon)

    Modelli antropici Prezzo orario per modello con
    nessun impegno
    Prezzo orario per unità modello con impegno di 1 mese Prezzo orario per unità modello con impegno di 6 mesi

    Claude Instant

    44,00 USD

    39,60 USD

    22,00 USD

    Claude 2.0/2.1

    70,00 USD

    63,00 USD

    35,00 USD

    Modelli antropici Prezzo orario per modello con
    nessun impegno
    Prezzo orario per unità modello con impegno di 1 mese Prezzo orario per unità modello con impegno di 6 mesi

    Claude Instant

    44,00 USD

    39,60 USD

    22,00 USD

    Claude 2.0/2.1

    70,00 USD

    63,00 USD

    35,00 USD

    Regione: Asia Pacifico (Tokyo)

    Modelli antropici Prezzo orario per unità modello con impegno di 1 mese Prezzo orario per unità modello con impegno di 6 mesi

    Claude Instant

    53,00 USD

    29,00 USD

    Claude 2.0/2.1

    86,00 USD

    48,00 USD

    Regione: Europa (Francoforte)

    Modelli antropici Prezzo orario per unità modello con impegno di 1 mese Prezzo orario per unità modello con impegno di 6 mesi

    Claude Instant

    49,00 USD

    27,00 USD

    Claude 2.0/2.1

    79,00 USD

    44,00 USD

    Contatta il team del tuo account AWS per maggiori dettagli sulle unità modello. 

  • Cohere
  • Cohere

    Prezzi on-demand

    Modelli Cohere Prezzo per 1.000 token di input Prezzo per 1.000 token di output
    Command 0,0015 USD 0,0020 USD
    Command-Light 0,0003 USD 0,0006 USD
    Command R+ 0,0030 USD 0,0150 USD
    Command R 0,0005 USD 0,0015 USD
    Integrato - Inglese 0,0001 USD N/D
    Integrato - Multilingue 0,0001 USD N/D

    Prezzi per la personalizzazione (messa a punto)

    Modelli Cohere Prezzo per addestrare 1.000 gettoni Prezzo mensile per memorizzare ogni modello personalizzato Prezzo da dedurre da un modello personalizzato per unità di modello all'ora (con prezzi Provisioned Throughput senza impegno)

    Cohere Command

    0,004 USD

    1,95 USD

    49,50 USD

    Command-Light Cohere 0,001 USD

    1,95 USD

    8,56 USD

    *Token totali addestrati = numero di token nel corpus di dati di addestramento x numero di epoche

    Prezzi del throughput fornito

    Modelli Cohere Prezzo orario per modello 
    senza impegno
    Prezzo orario per unità modello con impegno di 1 mese

    Prezzo orario per unità modello con impegno di 6 mesi

    Cohere Command

    49,50 USD

    39,60 USD

    23,77 USD

    Cohere Command - Light 8,56 USD

    6,85 USD

    4,11 USD
    Integrato - Inglese 7,12 USD

    6,76 USD

    6,41 USD
    Integrato - Multilingue 7,12 USD

    6,76 USD

    6,41 USD

    Contatta il tuo account AWS o il team di vendita per maggiori dettagli sulle unità modello. 

  • Meta Llama
  • Meta Llama

    Llama 3.2

    Prezzi on demand e in batch

    Llama 3.1

    Prezzi su richiesta e in batch

    Prezzi per la personalizzazione del modello (fine-tuning)

    Prezzi del throughput assegnato

    Llama 3

    Prezzi on demand

    Llama 2

    Prezzi on demand

    Regione: Stati Uniti orientali (Virginia settentrionale) e Stati Uniti occidentali (Oregon)

    Meta modelli Prezzo per 1.000 token di input Prezzo per 1.000 token di output

    Chat Llama 2 (13B)

    0,00075 USD

    0,001 USD

    Chat Llama 2 (70B)

    0,00195 USD

    0,00256 USD

    Prezzi per la personalizzazione del modello (messa a punto)

    Meta modelli Prezzo per addestrare 1.000 gettoni Prezzo per l'archiviazione di ogni modello personalizzato* al mese Prezzo da dedurre da un modello personalizzato per 1 unità modello all'ora (con prezzi del throughput assegnato senza impegno)

    Llama 2 Preaddestrato (13B)

    0,00149 USD

    1,95 USD

    23,50 USD

    Llama 2 Preaddestrato (70B)

    0,00799 USD

    1,95 USD 23,50 USD

    *Archiviazione per modelli personalizzati = 1,95 USD

    Prezzi del throughput fornito

    Meta modelli Prezzo orario per unità modello con impegno di 1 mese Prezzo orario per unità modello con impegno di 6 mesi

    Llama 2 Preaddestrato e Chat (13B)

    21,18 USD

    13,08 USD

    Llama 2 Preaddestrato (70B)

    21,18 USD

    13,08 USD

    *I modelli preaddestrati di Llama 2 sono disponibili solo in provisioned throughput previa personalizzazione.

    Contatta il team del tuo account AWS o il team di vendita per maggiori dettagli sulle unità modello.

  • Mistral AI
  • Mistral AI

  • Stability AI
  • Stability AI

    Prezzi on demand

    Modello Stability AI Prezzo per immagine generata
    Stable Image Core 0,04 USD
    SD3 Large 0,08 USD
    Stable Image Ultra 0,14 USD

    La precedente generazione dei modelli di immagine offerti da Stability AI ha un prezzo per immagine, che dipende dal numero di passaggi e dalla risoluzione dell'immagine.

    Modello Stability AI Risoluzione dell'immagine Prezzo per immagine generata per una qualità standard (<=50 passaggi) Prezzo per immagine generata per una qualità premium (>50 passaggi)
    SDXL 1,0 Fino a 1024 x 1024 0,04 USD 0,08 USD

    Prezzi del throughput fornito

    Modello Stability AI Prezzo orario per unità modello con impegno di 1 mese* Prezzo orario per unità modello per un impegno di 6 mesi*

    SDXL 1,0

    49,86 USD

    46,18 USD

    *Include l'inferenza per i modelli base e personalizzati

    Contatta il tuo account AWS o il team di vendita per maggiori dettagli sulle unità modello.

    Attualmente, la personalizzazione del modello (messa a punto) non è supportata per i modelli Stability AI su Amazon Bedrock.

  • Importazione di modelli personalizzati
  • Importazione di modelli personalizzati

    • Llama
    • Regioni: Stati Uniti orientali (Virginia settentrionale) e Stati Uniti occidentali (Oregon)

      Versione unità di modello personalizzate v1.0
      Prezzo per unità di modello personalizzate al min* 0,0785 USD
      Costo mensile di archiviazione per unità di modello personalizzate 1,95 USD
       
      Le unità di modello personalizzate necessarie per ospitare un modello dipendono da una serie di fattori, in particolare dall'architettura del modello, dal numero di parametri del modello e dalla lunghezza del contesto. Il numero esatto di unità di modello personalizzate necessarie sarà determinato al momento dell'importazione. A titolo di riferimento, il modello Llama 3.1 8B 128K richiede 2 unità di modello personalizzate, mentre il modello Llama 3.1 70B 128k richiede 8 unità di modello personalizzate.
      *Fatturato in intervalli da 5 minuti
    • Lama multimodale
    • Regioni: Stati Uniti orientali (Virginia settentrionale) e Stati Uniti occidentali (Oregon)

      Versione unità di modello personalizzate v1.0
      Prezzo per unità di modello personalizzate al min* 0,0785 USD
      Costo mensile di archiviazione per unità di modello personalizzate 1,95 USD
       
      Le unità di modello personalizzate necessarie per ospitare un modello dipendono da una serie di fattori, in particolare dall'architettura del modello, dal numero di parametri del modello e dalla lunghezza del contesto. Il numero esatto di unità di modello personalizzate necessarie sarà determinato al momento dell'importazione. A titolo di riferimento, il modello Llama 3.2 11B 128K richiede 4 unità di modello personalizzate.
      *Fatturato in intervalli da 5 minuti
    • Mistral
    • Regioni: Stati Uniti orientali (Virginia settentrionale) e Stati Uniti occidentali (Oregon)

      Versione unità di modello personalizzate v1.0
      Prezzo per unità di modello personalizzate al min* 0,0785 USD
      Costo mensile di archiviazione per unità di modello personalizzate 1,95 USD
       
      Le unità di modello personalizzate necessarie per ospitare un modello dipendono da una serie di fattori, in particolare dall'architettura del modello, dal numero di parametri del modello e dalla lunghezza del contesto. Il numero esatto di unità di modello personalizzate necessarie sarà determinato al momento dell'importazione. A titolo di riferimento, il modello Mistral 7B 32K richiede 1 unità di modello personalizzata.
      *Fatturato in intervalli da 5 minuti
    • Mixtral
    • Regioni: Stati Uniti orientali (Virginia settentrionale) e Stati Uniti occidentali (Oregon)

      Versione unità di modello personalizzate v1.0
      Prezzo per unità di modello personalizzate al min* 0,0785 USD
      Costo mensile di archiviazione per unità di modello personalizzate 1,95 USD
       
      Le unità di modello personalizzate necessarie per ospitare un modello dipendono da una serie di fattori, in particolare dall'architettura del modello, dal numero di parametri del modello e dalla lunghezza del contesto. Il numero esatto di unità di modello personalizzate necessarie sarà determinato al momento dell'importazione. A titolo di riferimento, il modello Mixtral 8x7B 32K richiede 4 unità di modello personalizzate.
      *Fatturato in intervalli da 5 minuti
    • Flan
    • Regioni: Stati Uniti orientali (Virginia settentrionale) e Stati Uniti occidentali (Oregon)

      Versione unità di modello personalizzate v1.0
      Prezzo per unità di modello personalizzate al min* 0,0785 USD
      Costo mensile di archiviazione per unità di modello personalizzate 1,95 USD
       
      Le unità di modello personalizzate necessarie per ospitare un modello dipendono da una serie di fattori, in particolare dall'architettura del modello, dal numero di parametri del modello e dalla lunghezza del contesto. Il numero esatto di unità di modello personalizzate necessarie sarà determinato al momento dell'importazione. A titolo di riferimento, il modello Flan-T5 XL 512 richiede 1 unità di modello personalizzata. 
      *Fatturato in intervalli da 5 minuti

    Prezzi di inferenza on demand:
    La fatturazione viene effettuata in finestre di 5 minuti per la durata in cui la copia del modello è attiva a partire dalla prima invocazione avvenuta con successo. Il limite massimo di throughput e concorrenza per copia del modello dipende da fattori quali la combinazione di token di input/output, il tipo di hardware, le dimensioni del modello, l'architettura, le ottimizzazioni dell'inferenza e viene determinato durante il flusso di lavoro di importazione del modello.

    Bedrock scala automaticamente il numero di copie del modello in base ai modelli di utilizzo. Se non ci sono invocazioni per un periodo di 5 minuti, Bedrock si ridurrà verticalmente a zero per poi scalare nuovamente verso l'alto quando il modello verrà invocato. Durante il processo di aumento verticale, è possibile che si verifichi una durata dell'avvio a freddo (in decine di secondi) a seconda delle dimensioni del modello. Bedrock aumenta verticalmente anche il numero di copie del modello se il volume di inferenza supera costantemente i limiti di concorrenza di una singola copia del modello. Nota: per impostazione predefinita, è previsto un massimo di 3 copie del modello per account per modello importato che è possibile aumentare tramite Service Quotas.

Strumenti avanzati per la determinazione dei prezzi (dettagli)

  • Guardrail di Amazon Bedrock
  • Guardrail di Amazon Bedrock

    Politica guardrail*

    Prezzo per 1.000 unità di testo**

    Filtri per i contenuti

    0,75 USD

    Argomenti negati

    1 USD

    Verifica contestuale di base***

    0,1 USD

    Filtro per informazioni sensibili (PII)

    0,1 USD

    Filtro per informazioni sensibili (espressione regolare) 

    Gratis

    Filtri per parola

    Gratis

    Prezzi on demand

    * Ogni politica guardrail è opzionale e può essere abilitata in base ai requisiti dell'applicazione. Gli addebiti avverranno in base al tipo di polizza utilizzata nel guardrail. Ad esempio, se un guardrail è configurato con filtri di contenuto e argomenti negati, verranno addebitati costi per queste due politiche, mentre non ci saranno addebiti associati ai filtri di informazioni sensibili.

    **Un'unità di testo può contenere fino a 1.000 caratteri. Se un input di testo è superiore a 1.000 caratteri, viene elaborato come più unità di testo, ciascuna contenente 1.000 caratteri o meno. Ad esempio, se un input di testo contiene 5.600 caratteri, verranno addebitate 6 unità di testo.

    *** La verifica contestuale di base utilizza una fonte di riferimento e una query per determinare se la risposta del modello è fondata sulla fonte e pertinente alla query. Il numero totale di unità di testo addebitate viene calcolato combinando tutti i caratteri della risposta di origine, della query e del modello.

    I guardrail non sono supportati per immagini ed embedding.

  • Valutazione del modello
  • Valutazione del modello

    La valutazione del modello viene addebitata per l'inferenza del modello scelto. I punteggi algoritmici generati automaticamente vengono forniti senza costi aggiuntivi. Per la valutazione su base umana, in cui l'utente porta il proprio flusso di lavoro, viene addebitato il costo dell'inferenza del modello nella valutazione e un costo di 0,21 USD per ogni attività umana completata.

    Modello

    Prezzo di 1.000 token di input

    Prezzo di 1.000 token di output

    Prezzo per attività umana

     

    Modello selezionato per la valutazione

    In base al modello selezionato

    In base al modello selezionato

     

    0,21 USD

     

Esempi di prezzo

  • Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock: una richiesta al modello Jurassic-2 Mid di AI21 per riepilogare un input di 10.000 token di testo di input in un output di 2.000 token.

    Costo totale sostenuto = 10.000 token/1.000 x 0,0125 USD + 2.000 token/1.000 x 0,0125 USD = 0,15 USD

  • Prezzi su richiesta

    Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock su base oraria: una richiesta al modello Amazon Titan Text Lite per riepilogare un input di 2.000 token di testo di input in un output di 1.000 token.

    Costo orario totale sostenuto = 2.000 token/1.000 x 0,0003 USD + 1.000 token/1.000 x 0,0004 USD = 0,001 USD.

    Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock: una richiesta al modello base di Amazon Titan Image Generator per generare 1.000 immagini di dimensione 1024 x 1024 di qualità standard.

    Costo totale sostenuto = 1.000 immagini x 0,01 USD per immagine = 10 USD

    Prezzi di personalizzazione (ottimizzazione e pre-addestramento continuo)

    Uno sviluppatore di applicazioni personalizza un modello Amazon Titan Image Generator utilizzando 1.000 coppie immagine-testo. Dopo l'addestramento, lo sviluppatore utilizza il throughput fornito dal modello personalizzato per un'ora allo scopo di valutare le prestazioni del modello. Il modello ottimizzato viene archiviato per un mese. Dopo la valutazione, lo sviluppatore utilizza il throughput fornito (durata dell'impegno di 1 mese) per ospitare il modello personalizzato.

    Il costo mensile sostenuto per l'ottimizzazione è: formazione sull'ottimizzazione (0,005 USD x 500 x 64), dove 0,005 USD è il prezzo per immagine visualizzata, 500 è il numero di passaggi e 64 è la dimensione del batch + archiviazione del modello personalizzato al mese (1,95 USD) + un'ora di inferenza del modello personalizzato (21 USD) = 160 USD + 1,95 USD + 21 = 182,95 USD

    Prezzi del throughput fornito

    Uno sviluppatore di applicazioni acquista due unità di modello di Amazon Titan Text Express con un vincolo di 1 mese per il suo caso d'uso di riepilogo di testo.

    Costo mensile totale sostenuto: 2 unità di modello x 18,40 USD/ora x 24 ore x 31 giorni = 27.379,20 USD

    Uno sviluppatore di applicazioni acquista un'unità di modello del modello Amazon Titan Image Generator base con un vincolo di 1 mese.

    Costo totale sostenuto = 1 unità modello x 16,20 USD x 24 ore x 31 giorni = 12.052,80 USD

  • Prezzi su richiesta

    Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock nella regione Stati Uniti occidentali (Oregon): una richiesta al modello Claude di Anthropic per riepilogare un input di 11.000 token di testo di input in un output di 4.000 token.

    Costo totale sostenuto= 11.000 token/1.000 x 0,008 USD + 4.000 token/1.000 x 0,024 USD = 0,088 USD + 0,096 USD = 0,184 USD

    Prezzi del throughput fornito

    Uno sviluppatore di applicazioni acquista un'unità di modello di Anthropic Claude Instant nella regione Stati Uniti occidentali (Oregon):

    Costo mensile totale sostenuto: 1 unità di modello x 39,60 USD x 24 ore x 31 giorni = 29.462,40 USD

  • Prezzi su richiesta

    Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock: una richiesta al modello Command di Cohere per riepilogare un input di 6.000 token di testo di input in un output di 2.000 token.

    Costo totale sostenuto = 6.000 token/1.000 x 0,0015 USD + 2.000 token/1.000 x 0,0020 USD = 0,013 USD

    Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock: una richiesta al modello Command-Light di Cohere per riepilogare un input di 6.000 token di testo di input in un output di 2.000 token.

    Costo totale sostenuto = 6.000 token/1.000 x 0,0003 USD + 2.000 token/1.000 x 0,0006 USD = 0,003 USD

    Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock: una richiesta al modello Embed inglese o multilingue di Cohere per generare integrazioni per 10.000 token di input.

    Costo totale sostenuto = 10.000 token/1.000 x 0,0001 USD = 0,001 USD

    Prezzi per la personalizzazione (ottimizzazione)

    Uno sviluppatore di applicazioni personalizza un modello Cohere Command utilizzando 1.000 token di dati. Dopo l'addestramento, utilizza il throughput fornito dal modello personalizzato per 1 ora per valutare le prestazioni del modello. Il modello ottimizzato viene archiviato per un mese. Dopo la valutazione, lo sviluppatore utilizza il throughput fornito (impegno di 1 mese) per ospitare il modello personalizzato.

    Costo mensile sostenuto per l'ottimizzazione: addestramento di ottimizzazione (0,004 USD x 1.000) + archiviazione del modello personalizzato al mese (1,95 USD) + un'ora di inferenza del modello personalizzato (49,50 USD) = 55,45 USD

    Costo mensile sostenuto per il throughput previsto (impegno di 1 mese) del modello personalizzato = 39,60 USD

    Prezzi del throughput fornito

    Uno sviluppatore di applicazioni acquista un'unità di modello di Cohere Command con un vincolo di 1 mese per il suo caso d'uso di riepilogo di testo.

    Costo mensile totale sostenuto: 1 unità di modello x 39,60 USD x 24 ore x 31 giorni = 29.462,40 USD

  • Prezzi su richiesta

    Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock: una richiesta al modello Llama 2 Chat (13B) di Meta per riepilogare un input di 2.000 token di testo di input in un output di 500 token.

    Costo totale sostenuto = 2.000 token/1.000 x 0,00075 USD + 500 token/1.000 x 0,001 USD = 0,002 USD

    Prezzi per la personalizzazione (ottimizzazione)

    Uno sviluppatore di applicazioni personalizza il modello Llama 2 pre-addestrato (70B) utilizzando 1.000 token di dati. Dopo l'addestramento, utilizza il throughput fornito dal modello personalizzato per 1 ora per valutare le prestazioni del modello. Il modello ottimizzato viene archiviato per un mese. Dopo la valutazione, lo sviluppatore utilizza il throughput fornito (impegno di 1 mese) per ospitare il modello personalizzato.

    Costo mensile sostenuto per l'ottimizzazione: addestramento di ottimizzazione (0,00799 USD x 1.000) + archiviazione del modello personalizzato al mese (1,95 USD) + un'ora di inferenza del modello personalizzato (23,50 USD) = 33,44 USD

    Costo mensile sostenuto per il throughput fornito (impegno di 1 mese) del modello personalizzato = 21,18 USD

    Prezzi del throughput fornito

    Uno sviluppatore di applicazioni acquista un'unità di modello di Meta Llama 2 con un impegno di 1 mese per il suo caso d'uso di riepilogo di testo.

    Costo mensile totale sostenuto: 1 unità di modello x 21,18 USD x 24 ore x 31 giorni = 15.757,92 USD

  • Prezzi su richiesta

    Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock su base oraria: una richiesta al modello Mistral 7B per riepilogare un input di 2.000 token di testo di input in un output di 1.000 token.

    Costo orario totale sostenuto = 2.000 token/1.000 x 0,00015 USD + 1.000 token/1.000 x 0,0002 USD = 0,0005 USD

    Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock su base oraria: una richiesta al modello Mixtral 8x7B per riepilogare un input di 2.000 token di testo di input in un output di 1.000 token.

    Costo orario totale sostenuto = 2.000 token/1.000 x 0,00045 USD + 1.000 token/1.000 x 0,0007 USD = 0,0016 USD

    Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock su base oraria: una richiesta al modello Mistral Large per riepilogare un input di 2.000 token di testo di input in un output di 1.000 token. 

    Costo orario totale sostenuto = 2.000 token/1.000 x 0,008 USD + 1.000 token/1.000 x 0,024 USD = 0,04 USD

  • Prezzi su richiesta

    Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock: una richiesta al modello SDXL per generare un'immagine di 512 x 512 con dimensione del passo di 70 (qualità eccellente).

    Costo totale sostenuto = 1 immagine x 0,036 USD per immagine = 0,036 USD

    Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock: una richiesta al modello SDXL1.0 per generare un'immagine di 1024 x 1024 con dimensione del passo di 70 (qualità eccellente).

    Costo totale sostenuto = 1 immagine x 0,08 USD per immagine = 0,08 USD

    Prezzi del throughput fornito

    Uno sviluppatore di applicazioni acquista un'unità di modello di SDXL1.0 con un impegno di 1 mese.

    Costo totale sostenuto = 1 x 49,86 USD x 24 ore x 31 giorni = 37.095,84 USD

  • Esempio di valutazione del modello 1:

    Prezzi on demand
    Uno sviluppatore di applicazioni invia un set di dati per la valutazione del modello basato sull'uomo utilizzando Anthropic Claude 2.1 e Anthropic Claude Instant nella Regione AWS Stati Uniti orientali (Virginia settentrionale).

    Il set di dati contiene 50 prompt e lo sviluppatore richiede 1 worker per valutare ogni set di prompt e risposte (configurabile nella creazione del lavoro di valutazione come parametro "worker per prompt").

    Ci saranno 50 attività in questo processo di valutazione (1 attività per ogni coppia prompt-risposta per ogni worker). I 50 prompt si combinano in 5.000 token di input e le risposte associate si combinano in 15.000 token per Anthropic Claude Instant e 20.000 token per Anthropic Claude 2.1.

    Per questo lavoro di valutazione del modello sono previsti i seguenti costi:

    Elemento Numero di token di input Prezzo per 1.000 token di input Costo dell'input Numero di token di uscita Prezzo per 1.000 token di output Costo dell’output Numero di attività umane Prezzo per attività umana Costo delle attività umane Totale
    Inferenza istantanea di Claude 5.000 0,0008 USD 0,004 USD 15.000 0,0024 USD 0,036 USD       0,04 USD
    Inferenza Claude 2.1 5.000 0,008 USD 0,04 USD 20.000 0,024 USD 0,48 USD       0,52 USD
    Attività umane             50 0,21 USD 10,50 USD 10,50 USD
    Totale                   11,06 USD

    Esempio di valutazione del modello 2:

    Prezzi on demand
    Uno sviluppatore di applicazioni invia un set di dati per la valutazione del modello basato sull'uomo utilizzando Anthropic Claude 2.1 e Anthropic Claude Instant nella Regione AWS Stati Uniti orientali (Virginia settentrionale).

    Il set di dati contiene 50 prompt e lo sviluppatore richiede 2 worker per valutare ogni set di prompt e risposte (configurabile nella creazione del lavoro di valutazione come parametro "worker per prompt"). Ci saranno 100 attività in questo lavoro di valutazione (1 attività per ogni coppia prompt-risposta per ogni worker: 2 worker x 50 set di risposta rapida = 100 attività umane).

    I 50 prompt si combinano in 5.000 token di input e le risposte associate si combinano in 15.000 token per Anthropic Claude Instant e 20.000 token per Anthropic Claude 2.1.

    Per questo lavoro di valutazione del modello sono previsti i seguenti costi:

    Elemento Numero di token di input Prezzo per 1.000 token di input Costo dell'input Numero di token di uscita Prezzo per 1.000 token di output Costo dell’output Numero di attività umane Prezzo per attività umana Costo delle attività umane Totale
    Inferenza istantanea di Claude 5.000 0,0008 USD 0,0040 USD 15.000 0,0024 USD 0,036 USD       0,04 USD
    Inferenza Claude 2.1 5.000 0,008 USD 0,0400 USD 20.000 0,024 USD 0,48 USD       0,52 USD
    Attività umane             100 0,21 USD 21,00 USD 21,00 USD
    Totale                   21,56 USD
  • Esempio 1: chatbot per l'assistenza clienti
    Uno sviluppatore di applicazioni crea un chatbot per l'assistenza clienti e utilizza i filtri dei contenuti per bloccare i contenuti dannosi e gli argomenti negati per filtrare domande e risposte indesiderate.

    Il chatbot risponde a 1.000 richieste di utenti all'ora. Ogni richiesta utente ha una lunghezza media di input di 200 caratteri e riceve una risposta FM di 1.500 caratteri.

    Ogni richiesta utente di 200 caratteri corrisponde a 1 unità di testo.

    Ogni risposta FM di 1.500 caratteri corrisponde a 2 unità di testo.

    Unità di testo elaborate ogni ora = (1 + 2) x 1.000 interrogazioni = 3.000 unità di testo

    Costo totale sostenuto all'ora per i filtri dei contenuti e l'argomento negato = 3.000 x (0,75 USD + 1,00 USD)/1.000 = 5,25 USD

     

    Esempio 2: riepilogo della trascrizione del call center
    Uno sviluppatore di applicazioni crea un'applicazione per riepilogare le trascrizioni delle chat tra utenti e agenti dell'assistenza. Utilizza un filtro per informazioni sensibili per oscurare le informazioni di identificazione personale (PII) nei riepiloghi generati per 10.000 conversazioni.

    Ogni riepilogo generato ha una media di 3.500 caratteri che corrispondono a 4 unità di testo.

    Costo totale sostenuto per riassumere 10.000 conversazioni = 10.000 x 4 x (0,1/1.000 USD) = 4 USD

    Elemento Numero di token di input Prezzo per 1.000 token di input Costo dell'input Numero di token di uscita Prezzo per 1.000 token di output Costo dell’output Numero di attività umane Prezzo per attività umana Costo delle attività umane Totale
    Inferenza istantanea di Claude 5.000 0,0008 USD 0,004 USD 15.000 0,0024 USD 0,036 USD       0,04 USD
    Inferenza Claude 2.1 5.000 0,008 USD 0,04 USD 20.000 0,024 USD 0,48 USD       0,52 USD
    Attività umane             100 0,21 USD 21,00 USD 21,00 USD
    Totale                   21,56 USD
  • Esempio di prezzo: uno sviluppatore di applicazioni importa un modello di tipo Llama 3.1 personalizzato con una dimensione di 8B di parametri con una lunghezza di sequenza di 128K nella regione us-east-1 ed elimina il modello dopo 1 mese. Ciò richiede 2 unità di modello personalizzate. Il prezzo al minuto sarà, quindi, di 0,1570 USD perché sono necessarie 2 unità di modello personalizzate. I costi di archiviazione del modello per 2 unità di modello personalizzate sono 3,90 USD al mese.

    L'importazione del modello è gratuita. La prima invocazione riuscita è alle 08:03, momento in cui inizia la misurazione. Le finestre di misurazione di 5 minuti sono dalle 08:03 alle 08:07; dalle 08:07 alle 08:11 e così via. Se viene effettuata almeno un'invocazione durante un periodo di 5 minuti, la finestra sarà considerata attiva per la fatturazione. Se non viene effettuata alcuna invocazione dalle 08:07 alle 08:11, la misurazione si interromperà alle 08:11. In questo caso, la fattura verrebbe calcolata come segue: 0,1570 USD × 5 minuti × 3 intervalli da cinque minuti = 2,355 USD.