Prezzi di Amazon Bedrock

Panoramica dei prezzi

Amazon Bedrock è un servizio completamente gestito che offre una scelta di modelli di fondazione (FM) ad alte prestazioni attraverso una singola API, insieme a un'ampia gamma di funzionalità necessarie per creare applicazioni di IA generativa garantendo sicurezza, privacy e IA responsabile.

Amazon Bedrock prevede l'addebito dei costi relativi all'inferenza e alla personalizzazione dei modelli. È possibile scegliere tra due piani tariffari per inferenza: 1. On demand e batch: questa modalità consente di utilizzare gli FM con pagamento in base al consumo senza vincoli temporali. 2. Throughput assegnato: questa modalità consente di eseguire il provisioning di un throughput sufficiente per soddisfare i requisiti prestazionali dell'applicazione in cambio di un vincolo temporale.

Modelli di prezzo

On demand e in batch

Con la modalità On-Demand, paghi solo quello che usi, senza impegni a termine basati sul tempo. Per i modelli di generazione di testo, ti viene addebitato ogni token di input elaborato e ogni token di output generato. Per i modelli di incorporamento, ti viene addebitato un costo per ogni token di input elaborato. Un token è composto da pochi caratteri e si riferisce all'unità di testo di base che un modello impara per comprendere l'input e il prompt dell'utente. Per i modelli di generazione di immagini, viene addebitato un costo per ogni immagine generata.

Inferenza multiregionale: la modalità on demand supporta anche l'inferenza multiregionale per alcuni modelli. Consente agli sviluppatori di gestire senza problemi i picchi di traffico utilizzando il calcolo in diverse regioni AWS e di ottenere limiti di throughput più elevati e una maggiore resilienza. Non sono previsti costi aggiuntivi per l'utilizzo dell'inferenza multiregionale e il prezzo viene calcolato in base alla regione in cui è stata effettuata la richiesta (regione di origine).

Con la modalità Batch, puoi fornire una serie di prompt come un singolo file di input e ricevere risposte come un singolo file di output, consentendo di ottenere previsioni simultanee su larga scala. Le risposte vengono elaborate e archiviate nel tuo bucket Amazon S3 in modo da potervi accedere in un secondo momento. Amazon Bedrock offre modelli di fondazione (FM) selezionati dei principali fornitori di IA come Anthropic, Meta, Mistral AI e Amazon per l'inferenza in batch a un prezzo inferiore del 50% rispetto ai prezzi di inferenza on demand. Fare riferimento all'elenco dei modelli qui.

Latenza ottimizzata (anteprima pubblica)

L'inferenza ottimizzata per la latenza per i modelli di fondazione in Amazon Bedrock garantisce tempi di risposta dei modelli più rapidi e aiuta a migliorare la reattività delle applicazioni di IA generativa. È possibile utilizzare l'inferenza ottimizzata per la latenza per Amazon Nova Pro, il modello Claude 3.5 Haiku di Anthropic e per i modelli Llama 3.1 405B e 70B di Meta. Come verificato da Anthropic, grazie all'inferenza ottimizzata per la latenza in Amazon Bedrock, Claude 3.5 Haiku viene eseguito più velocemente su AWS che altrove. Inoltre, con l'inferenza ottimizzata per la latenza in Bedrock, Llama 3.1 405B e 70B vengono eseguiti più velocemente su AWS rispetto a qualsiasi altro importante provider di cloud. Ulteriori informazioni sono disponibili qui.

Throughput assegnato

Con la modalità Provisioned Throughput, è possibile acquistare unità modello per uno specifico modello base o personalizzato. La modalità Provisioned Throughput è progettata principalmente per carichi di lavoro di inferenza consistenti di grandi dimensioni che richiedono una velocità di trasmissione effettiva garantita. È possibile accedere ai modelli personalizzati solo utilizzando Provisioned Throughput. Un'unità modello fornisce una determinata velocità di trasmissione effettiva misurata dal numero massimo di token di input o output elaborati al minuto. Con i prezzi Provisioned Throughput, ti vengono addebitati a ore, hai la flessibilità di scegliere tra termini di impegno di 1 mese o 6 mesi.

Importazione di modelli personalizzati

L'importazione di modelli personalizzati consente di sfruttare i precedenti investimenti per la personalizzazione dei modelli all'interno di Amazon Bedrock e di utilizzarli nello stesso modo completamente gestito dei modelli di fondazione esistenti in hosting di Bedrock. È possibile importare pesi personalizzati per le architetture di modelli supportate e servire il modello personalizzato utilizzando la modalità on demand. L'importazione di un modello personalizzato su Bedrock è gratuita. Una volta importato un modello, sarà possibile accedervi on demand senza dover eseguire alcuna azione sul piano di controllo (control-plane). Viene addebitata solo l'inferenza del modello, in base al numero di copie del modello personalizzato necessarie per gestire il volume di inferenza e alla durata di attivazione di ciascuna copia del modello, fatturata in finestre di 5 minuti. Una copia del modello è una singola istanza di un modello importato pronto a soddisfare le richieste di inferenza. Il prezzo per copia del modello al minuto dipende da fattori quali architettura, lunghezza del contesto, regione AWS, versione dell'unità di calcolo (generazione di hardware) ed è classificato in base alla dimensione della copia del modello.

Modelli di Marketplace

Amazon Bedrock Marketplace ti consente di scoprire, testare e utilizzare in Bedrock oltre 100 modelli di fondazione affermati, emergenti e specializzati. I modelli di Amazon Bedrock Marketplace vengono distribuiti su endpoint in cui puoi selezionare il numero e i tipi di istanze desiderati, nonché configurare le policy di scalabilità automatica per soddisfare le esigenze del tuo carico di lavoro. Per i modelli proprietari, ti verrà addebitato il prezzo del software stabilito dal fornitore del modello (su base oraria, fatturabile a incrementi di secondo o per richiesta) e un prezzo per l'infrastruttura basato sull'istanza che selezioni. Puoi visualizzare questi prezzi prima di abbonarti al modello del fornitore e anche dall'elenco dei modelli in AWS Marketplace. Per i modelli disponibili al pubblico, ti viene addebitato solo il prezzo dell'infrastruttura in base all'istanza selezionata. Scopri ulteriori informazioni qui.

Personalizzazione e ottimizzazione

Personalizzazione del modello

Con Amazon Bedrock, puoi personalizzare gli FM con i tuoi dati per fornire risposte su misura per attività specifiche e il tuo contesto aziendale. È possibile ottimizzare i modelli con dati etichettati o utilizzare un pre-training continuo con dati non etichettati. Per la personalizzazione di un modello di generazione di testo, viene addebitato il costo dell'addestramento del modello in base al numero totale di token elaborati dal modello (numero di token nel corpus di dati di addestramento moltiplicato per il numero di epoche) e per l'archiviazione del modello addebitato al mese per modello. Un'epoca si riferisce a un passaggio completo del set di dati di allenamento durante la messa a punto o il pre-allenamento continuo. Le inferenze che utilizzano modelli personalizzati vengono addebitate in base al piano Provisioned Throughput e richiedono l'acquisto di Provisioned Throughput. Un'unità modello è resa disponibile senza alcun termine di impegno per l'inferenza su un modello personalizzato. Ti verrà addebitato il numero di ore trascorse che utilizzi nella prima unità modello per l'inferenza del modello personalizzato. Acquistando un periodo di impegno di 1 o 6 mesi, è possibile aumentare il throughput di trasmissione effettivo oltre un'unità modello.

Distillazione di modelli

Con la distillazione di modelli di Amazon Bedrock si paga in base all'uso. La generazione di dati sintetici viene addebitata in base al prezzo su richiesta del modello di insegnante selezionato. L’ottimizzazione del modello studenti viene addebitata in base alle tariffe di personalizzazione del modello. Poiché un modello distillato è un modello personalizzato, gli addebiti alle inferenze che utilizzano modelli personalizzati vengono calcolati in base al piano Throughput assegnato e richiedono l'acquisto di Throughput assegnato.

Memorizzazione nella cache di prompt

Con il caching dei prompt su Amazon Bedrock, puoi memorizzare nella cache il contesto ripetuto tra le chiamate API per ridurre i costi e le latenze di risposta. I prompt spesso contengono contesto o prefissi comuni come lunghe conversazioni a più turni, esempi con più riprese e istruzioni dettagliate che perfezionano il comportamento del modello. L’uso delle API Amazon Bedrock esistenti consente di specificare i prefissi dei prompt da memorizzare nella cache per cinque minuti in una cache specifica dell'account AWS. Durante questo periodo, qualsiasi richiesta con prefissi corrispondenti riceverà uno sconto fino al 90% sui token memorizzati nella cache e un miglioramento della latenza fino all'85%. I prezzi e i miglioramenti delle prestazioni variano in base al modello e alla durata dei prompt, ma le cache sono sempre isolate nel tuo account AWS.

Strumenti

Guardrail

Amazon Bedrock Guardrails consente di implementare protezioni personalizzate e policy di IA responsabile per le applicazioni di IA generativa. Fornisce protezioni di sicurezza aggiuntive personalizzabili oltre alle protezioni native offerte dagli FM. È l'unica funzionalità di IA responsabile offerta da un importante provider di cloud che consente ai clienti di creare e personalizzare protezioni di sicurezza, privacy e veridicità per le loro applicazioni di IA generativa in un'unica soluzione. Guardrail per Bedrock funziona con un'ampia gamma di modelli di fondazione (FM), inclusi FM supportati in Amazon Bedrock, modelli ottimizzati con fine-tuning e con hosting autonomo esterni ad Amazon Bedrock. Bedrock Guardrails può anche essere integrato con Amazon Bedrock Agents e Amazon Bedrock Knowledge Bases per creare applicazioni di IA generativa in linea con le policy di IA responsabile dell'azienda. Inoltre, Guardrail offre un'API ApplyGuardrail autonoma che può essere utilizzata per valutare gli input degli utenti e le risposte dei modelli per qualsiasi modello esterno ad Amazon Bedrock, inclusi i modelli offerti dai concorrenti di AWS. Gli input degli utenti possono essere valutati anche senza richiamare il modello di fondazione.

Knowledge Base e automazione dei dati

Le Knowledge Base di Amazon Bedrock offrono un flusso di lavoro RAG (Retrieval-Augmented Generation) completamente gestito che consente ai clienti di creare applicazioni basate su IA generativa estremamente precise, a bassa latenza, sicure e personalizzate, integrando informazioni contestuali provenienti dalle origini dati della propria azienda. Supporta varie origini dati, tra cui S3 e Confluence, Salesforce e SharePoint, in anteprima. Offre inoltre l'acquisizione di documenti per lo streaming dei dati. Le Knowledge Base Bedrock convertono i dati non strutturati in embedding, li archiviano in database vettoriali e consentono il recupero da diversi archivi di dati. Si integrano inoltre con Kendra per il recupero gestito e supportano il recupero di dati strutturati utilizzando il linguaggio naturale in SQL.

L’automazione dei dati Amazon Bedrock trasforma contenuti multimodali non strutturati in formati di dati strutturati per casi d'uso come l’elaborazione intelligente dei documenti, l’analisi video e RAG. L’automazione dei dati Amazon Bedrock è in grado di generare contenuti in output standard utilizzando impostazioni predefinite specifiche della modalità, come descrizioni di video scena per scena, trascrizioni audio o analisi automatizzate dei documenti. I clienti possono inoltre creare output personalizzati specificando i requisiti di output nei blueprint in base al proprio schema di dati che possono quindi caricare facilmente in un database o data warehouse esistente. Attraverso l'integrazione con le Knowledge Base, l’automazione dei dati Bedrock può essere utilizzata anche per analizzare il contenuto per le applicazioni RAG, migliorando l'accuratezza e la pertinenza dei risultati tramite l’inclusione di informazioni incorporate sia nelle immagini che nel testo.

Agenti

Amazon Bedrock Agents offre la possibilità di creare e configurare agenti autonomi all'interno di un'applicazione. Tali agenti si connettono in modo sicuro alle origini dati dell'azienda e arricchiscono le richieste degli utenti con le informazioni giuste per generare risposte accurate. Bastano pochi passaggi per creare un'unica applicazione multiagente, riducendo il tempo necessario per sviluppare applicazioni di IA generativa. Questi agenti supportano l'interpretazione del codice per generare ed eseguire dinamicamente il codice e il ritorno del controllo, consentendo di definire uno schema di azione e riottenere il controllo ogni volta che l'agente richiama l'operazione. Inoltre, gli agenti Amazon Bedrock possono conservare la memoria tra le interazioni, offrendo esperienze utente più personalizzate e fluide.

Flows

Amazon Bedrock Flows è una funzionalità di creazione ed esecuzione di flussi di lavoro di Bedrock per applicazioni di IA generativa. Accelera la creazione, il test e l'implementazione di flussi di lavoro di IA generativa definiti dall'utente attraverso un visual builder intuitivo e un set di API. Consente di collegare senza problemi i modelli di fondazione più recenti, i prompt, gli agenti, la Knowledge Base, i guardrail e i servizi AWS (come Amazon Lex, AWS Lambda, Amazon S3) insieme alla logica aziendale per creare flussi di lavoro di IA generativa. Puoi facilmente testare e modificare le versioni dei tuoi flussi di lavoro ed eseguirli in un ambiente serverless sicuro tramite un'interfaccia visiva o un'API senza dover configurare la tua infrastruttura.

Valutazioni

Valutazione del modello: con la valutazione del modello di Amazon Bedrock paghi in base all'utilizzo, senza impegni di volume minimo sul numero di prompt o risposte. Per la valutazione automatica (programmatica), paghi solo l'inferenza derivante dal modello scelto nella valutazione. I punteggi algoritmici generati automaticamente vengono forniti senza costi aggiuntivi. Per la valutazione automatica (modello/LLM-as-a-Judge), paghi solo l'inferenza derivante dal modello generatore e dal modello di valutazione selezionati. In un processo di valutazione del modello LLM-as-a-Judge, le metriche integrate utilizzano modelli di prompt giudice di sistema univoci per ogni metrica e modello giudice disponibile. Questi modelli verranno addebitati nell'ambito dell'utilizzo dei token. Per trasparenza, i prompt giudice sono disponibili nella documentazione pubblica di AWS. Per la valutazione basata sull'uomo, in cui coinvolgi il tuo team di lavoro, ti verrà addebitato l'inferenza del modello nella valutazione e un costo di 0,21 USD per attività umana completata. Un'attività umana è definita come l'evento in cui un lavoratore umano invia una valutazione di un singolo prompt e delle relative risposte di inferenza nell'interfaccia utente di valutazione umana. Il prezzo per attività è lo stesso a prescindere dal numero di modelli utilizzati nel processo di valutazione (uno o due modelli) e dal numero di parametri di valutazione e metodi di valutazione inclusi. I costi per le attività umane appariranno nella sezione Amazon SageMaker della fattura AWS e sono gli stessi per tutte le Regioni AWS. Non è previsto alcun costo separato per la forza lavoro, poiché la forza lavoro viene fornita da te. Se durante il processo di valutazione utilizzi risposte di inferenza proprie (funzionalità “bring your own inference responses”) invece di chiamare un modello Bedrock, ti verranno addebitati solo l'inferenza del modello valutatore (processi LLM-as-a-Judge) o 0,21USD per attività umana completata (processi di valutazione basati sull'uomo). Per una valutazione gestita da AWS, i prezzi sono personalizzati in base alle tue esigenze di valutazione, mediante un accordo privato con il team di valutazione degli esperti di AWS.

Valutazione RAG: con la valutazione RAG di Amazon Bedrock paghi in base all'utilizzo, senza impegni di volume minimo sul numero di prompt o risposte. Se stai valutando una Knowledge Base Amazon Bedrock, paghi solo l'inferenza derivante dal modello generatore e dal modello di valutazione che hai scelto (il processo di valutazione utilizza un LLM-as-a-Judge), oltre a eventuali costi sostenuti per l'utilizzo della Knowledge Base nel processo di valutazione secondo i prezzi di Knowledge Base per Amazon Bedrock. Se utilizzi risposte di inferenza proprie (funzionalità “bring your own inference responses”), ti verrà addebitata solo l'inferenza del modello valutatore. In un processo di valutazione RAG, le metriche integrate utilizzano modelli di prompt giudice di sistema univoci per ogni metrica e modello giudice disponibile. Questi modelli verranno addebitati nell'ambito dell'utilizzo dei token. Per trasparenza, i prompt giudice sono disponibili nella documentazione pubblica di AWS. Alcune metriche prevedono l'esecuzione di un'inferenza del modello giudice sul contesto recuperato dalla Knowledge Base/dal sistema RAG o dalle risposte di base in aggiunta al prompt di input, il che influisce sui costi associati a ciascuna metrica. Ulteriori informazioni su ciascuna metrica sono disponibili nella documentazione pubblica di AWS per le valutazioni.

Dettagli sui prezzi del modello

Il prezzo dipende dalla modalità, dal fornitore e dal modello. Seleziona il fornitore del modello per visualizzare i prezzi dettagliati.

Amazon Bedrock offre modelli di fondazione (FM) selezionati dei principali fornitori di intelligenza artificiale come Anthropic, Meta, Mistral AI e Amazon per l'inferenza in batch a un prezzo inferiore del 50% rispetto ai prezzi di inferenza on demand. Fai riferimento all'elenco dei modelli qui.

AI21 Labs

AI21 Labs

Prezzi on-demand

Modelli AI21 Labs	Prezzo per 1.000 token di input	Prezzo per 1.000 token di output
Jamba 1.5 Large	0,002 USD	0,008 USD
Jamba 1.5 Mini	0,0002 USD	0,0004 USD
Jurassic-2 Mid	0,0125 USD	0,0125 USD
Jurassic 2 Ultra	0,0188 USD	0,0188 USD
Jamba-Instruct	0,0005 USD	0,0007 USD

Amazon

Amazon Nova
Amazon Titan
Altro Amazon

Amazon Nova

Amazon Nova

Prezzi dei modelli di comprensione

Prezzi per i modelli di generazione di contenuti creativi

Prezzi per i modelli di comprensione e generazione vocale

Regione:
Stati Uniti orientali (Virginia)

Prezzi on demand per i modelli di fondazione di sintesi vocale

Modelli Amazon Nova	Prezzo di 1.000 token di input		Prezzo di 1.000 token di output
	Vocale	Testo*	Vocale	Testo*
Amazon Nova Sonic	0,0034 USD	0,00006 USD	0,0136 USD	0,00024 USD

Nota: *I prezzi per i token di testo in input e output si applicano a casi d'uso specifici, come la trascrizione speech-to-text, l'esecuzione di strumenti per completare attività o per il knowledge grounding, l'aggiunta della cronologia delle conversazioni alla sessione, ecc.

Amazon Titan
Amazon Titan
Altro Amazon

Anthropic

Anthropic

Prezzi on demand e in batch

Regione: regioni degli Stati Uniti

Modelli antropici	Prezzo per 1.000 token di input	Prezzo di 1.000 token di output	Prezzo di 1.000 token di input (batch)	Prezzo di 1.000 token di output (batch)	Prezzo di 1.000 token di input (scrittura cache)	Prezzo di 1.000 token di input (lettura cache)
Claude 3.7 Sonnet***	0,003 USD	0,015 USD	N/D	N/D	0,00375 USD	0,0003 USD
Claude 3.5 Sonnet**	0,003 USD	0,015 USD	0,0015 USD	0,0075 USD	0,00375 USD	0,0003 USD
Claude 3.5 Haiku	0,0008 USD	0,004 USD	0,0005 USD	0,0025 USD	0,001 USD	0,00008 USD
Claude 3 Opus*	0,015 USD	0,075 USD	0,0075 USD	0,0375 USD	NA	NA
Claude 3 Haiku	0,00025 USD	0,00125 USD	0,000125 USD	0,000625 USD	NA	NA
Claude 3 Sonnet	0,003 USD	0,015 USD	0,0015 USD	0,0075 USD	NA	NA
Claude 2.1	0,008 USD	0,024 USD	NA	ND	ND	NA
Claude 2.0	0,008 USD	0,024 USD	NA	ND	ND	NA
Claude Instant	0,0008 USD	0,0024 USD	NA	ND	ND	NA
*Claude 3 Opus è al momento disponibile solo nella regione degli Stati Uniti occidentali (Oregon)
**I prezzi di Claude 3.5 Sonnet si applicano a tutte le versioni di Claude 3.5 Sonnet (v1 e v2) - Claude 3.5 Sonnet v2 è attualmente disponibile nella regione Stati Uniti occidentali (Oregon)
***Claude 3.7 Sonnet è disponibile anche nella regione Stati Uniti orientali (Ohio)

Modelli antropici	Prezzo per 1.000 token di input	Prezzo di 1.000 token di output	Prezzo di 1.000 token di input (batch)	Prezzo di 1.000 token di output (batch)	Prezzo di 1.000 token di input (scrittura cache)	Prezzo di 1.000 token di input (lettura cache)
Claude 3.5 Sonnet**	0,003 USD	0,015 USD	0,0015 USD	0,0075 USD	0,00375 USD	0,0003 USD
Claude 3.5 Haiku	0,001 USD	0,005 USD	0,0005 USD	0,0025 USD	0,001 USD	0,00008 USD
Claude 3 Opus*	0,015 USD	0,075 USD	0,0075 USD	0,0375 USD
Claude 3 Haiku	0,00025 USD	0,00125 USD	0,000125 USD	0,000625 USD
Claude 3 Sonnet	0,003 USD	0,015 USD	0,0015 USD	0,0075 USD
Claude 2.1	0,008 USD	0,024 USD	N/D	N/D
Claude 2.0	0,008 USD	0,024 USD	N/D	N/D
Claude Instant	0,0008 USD	0,0024 USD	N/D	N/D
*Claude 3 Opus è al momento disponibile solo nella regione degli Stati Uniti occidentali (Oregon)
**I prezzi di Claude 3.5 Sonnet si applicano a tutte le versioni di Claude 3.5 Sonnet (v1 e v2) - Claude 3.5 Sonnet v2 è attualmente disponibile nella regione Stati Uniti occidentali (Oregon)

Regione: Europa (Londra)

Modelli Anthropic	Prezzo per 1.000 token di input	Prezzo di 1.000 token di output	Prezzo di 1.000 token di input (batch)	Prezzo di 1.000 token di output (batch)
Claude 3 Sonnet	0,003 USD	0,015 USD	0,0015 USD	0,0075 USD
Claude 3 Haiku	0,00025 USD	0,00125 USD	0,000125 USD	0,000625 USD

Regione: Europa (Zurigo)

Modelli antropici

Prezzo per 1.000 token di input

Prezzo di 1.000 token di output

Prezzo di 1.000 token di input (batch)

Prezzo di 1.000 token di output (batch)

Claude 3.5 Sonnet

0,003 USD

0,015 USD

0,0015 USD

0,0075 USD

Claude 3 Haiku

0,00025 USD

0,00125 USD

0,000125 USD

0,000625 USD

Regione: Sud America (San Paolo)

Modelli antropici

Prezzo per 1.000 token di input

Prezzo di 1.000 token di output

Prezzo di 1.000 token di input (batch)

Prezzo di 1.000 token di output (batch)

Claude 3 Sonnet

0,003 USD

0,015 USD

0,0015 USD

0,0075 USD

Claude 3 Haiku

0,00025 USD

0,00125 USD

0,000125 USD

0,000625 USD

Regione: Canada (Centrale)

Modelli antropici

Prezzo per 1.000 token di input

Prezzo di 1.000 token di output

Prezzo di 1.000 token di input (batch)

Prezzo di 1.000 token di output (batch)

Claude 3 Sonnet

0,003 USD

0,015 USD

0,0015 USD

0,0075 USD

Claude 3 Haiku

0,00025 USD

0,00125 USD

0,000125 USD

0,000625 USD

Regione: Asia Pacifico (Mumbai)

Modelli antropici

Prezzo per 1.000 token di input

Prezzo di 1.000 token di output

Prezzo di 1.000 token di input (batch)

Prezzo di 1.000 token di output (batch)

Claude 3 Sonnet

0,003 USD

0,015 USD

0,0015 USD

0,0075 USD

Claude 3 Haiku

0,00025 USD

0,00125 USD

0,000125 USD

0,000625 USD

Regione: Asia Pacifico (Sydney)

Modelli antropici	Prezzo per 1.000 token di input	Prezzo di 1.000 token di output	Prezzo di 1.000 token di input (batch)	Prezzo di 1.000 token di output (batch)
Claude 3.5 Sonnet v2	0,003 USD	0,015 USD	0,0015 USD	0,0075 USD
Claude 3 Sonnet	0,003 USD	0,015 USD	0,0015 USD	0,0075 USD
Claude 3 Haiku	0,00025 USD	0,00125 USD	0,000125 USD	0,000625 USD

Regione: Asia Pacifico (Tokyo)

Modelli antropici	Prezzo per 1.000 token di input	Prezzo di 1.000 token di output	Prezzo di 1.000 token di input (batch)	Prezzo di 1.000 token di output (batch)
Claude Instant	0,0008 USD	0,0024 USD	N/D	N/D
Claude 2.0/2.1	0,008 USD	0,024 USD	N/D	N/D
Claude 3 Haiku	0,00025 USD	0,00125 USD	0,000125 USD	0,000625 USD
Claude 3.5 Sonnet	0,003 USD	0,015 USD	0,0015 USD	0,0075 USD

Regione: Asia Pacifico (Singapore)

Modelli antropici	Prezzo per 1.000 token di input	Prezzo di 1.000 token di output	Prezzo di 1.000 token di input (batch)	Prezzo di 1.000 token di output (batch)
Claude Instant	0,0008 USD	0,0024 USD	0,0004 USD	0,0012 USD
Claude 2.0/2.1	0,008 USD	0,024 USD	0,004 USD	0,012 USD
Claude 3 Haiku	0,00025 USD	0,00125 USD	0,000125 USD	0,000625 USD
Claude 3.5 Sonnet	0,003 USD	0,015 USD	N/D	N/D

Regione: Europa (Parigi)

Modelli antropici

Prezzo per 1.000 token di input

Prezzo di 1.000 token di output

Prezzo di 1.000 token di input (batch)

Prezzo di 1.000 token di output (batch)

Claude 3 Haiku

0,00025 USD

0,00125 USD

0,000125 USD

0,000625 USD

Claude 3 Sonnet

0,003 USD

0,015 USD

0,0015 USD

0,0075 USD

Regione: Europa (Francoforte)

Modelli antropici	Prezzo per 1.000 token di input	Prezzo di 1.000 token di output	Prezzo di 1.000 token di input (batch)	Prezzo di 1.000 token di output (batch)
Claude Instant	0,0008 USD	0,0024 USD	N/D	N/D
Claude 2.0/2.1	0,008 USD	0,024 USD	N/D	N/D
Claude 3 Sonnet	0,003 USD	0,015 USD	0,0015 USD	0,0075 USD
Claude 3.5 Sonnet	0,003 USD	0,015 USD	0,0015 USD	0,0075 USD
Claude 3 Haiku	0,00025 USD	0,00125 USD	0,000125 USD	0,000625 USD

Regione: Asia Pacifico (Seoul)

Modelli Anthropic

Prezzo per 1.000 token di input

Prezzo di 1.000 token di output

Prezzo di 1.000 token di input (batch)

Prezzo di 1.000 token di output (batch)

Claude 3.5 Sonnet

0,003 USD

0,015 USD

N/D

Claude 3 Haiku

0,00025 USD

0,00125 USD

N/D

Regione: Stati Uniti orientali (Ohio)

Modelli Anthropic

Prezzo per 1.000 token di input

Prezzo di 1.000 token di output

Prezzo di 1.000 token di input (batch)

Prezzo di 1.000 token di output (batch)

Claude 3.5 Sonnet

0,003 USD

0,015 USD

N/D

Claude 3 Haiku

0,00025 USD

0,00125 USD

N/D

Regione: AWS GovCloud (Stati Uniti-Ovest), AWS GovCloud (Stati Uniti-Est)

Modelli antropici	Prezzo per 1.000 token di input	Prezzo per 1.000 token di output
Claude 3.5 Sonnet	0,0036 USD	0,018 USD
Claude 3 Haiku	0,0003 USD	0,0015 USD

Inferenza ottimizzata per la latenza

Regione: Stati Uniti orientali (Ohio)

	Prezzo di 1.000 token di input	Prezzo di 1.000 token di output
Claude 3.5 Haiku	0,001 USD	0,005 USD

Regione: Stati Uniti orientali (Virginia settentrionale)

	Prezzo per 1.000 token di input	Prezzo di 1.000 token di output
Claude 3.5 Haiku	0,001 USD	0,005 USD

Regione: Stati Uniti occidentali (Oregon)

	Prezzo per 1.000 token di input	Prezzo di 1.000 token di output
Claude 3.5 Haiku	0,001 USD	0,005 USD

Prezzi del throughput fornito

Regione: Stati Uniti orientali (Virginia settentrionale) e Stati Uniti occidentali (Oregon)

Modelli antropici	Prezzo orario per modello con nessun impegno	Prezzo orario per unità modello con impegno di 1 mese	Prezzo orario per unità modello con impegno di 6 mesi
Claude Instant	44,00 USD	39,60 USD	22,00 USD
Claude 2.0/2.1	70,00 USD	63,00 USD	35,00 USD

Modelli antropici	Prezzo orario per modello con nessun impegno	Prezzo orario per unità modello con impegno di 1 mese	Prezzo orario per unità modello con impegno di 6 mesi
Claude Instant	44,00 USD	39,60 USD	22,00 USD
Claude 2.0/2.1	70,00 USD	63,00 USD	35,00 USD

Regione: Asia Pacifico (Tokyo)

Modelli antropici	Prezzo orario per unità modello con impegno di 1 mese	Prezzo orario per unità modello con impegno di 6 mesi
Claude Instant	53,00 USD	29,00 USD
Claude 2.0/2.1	86,00 USD	48,00 USD

Regione: Europa (Francoforte)

Modelli antropici	Prezzo orario per unità modello con impegno di 1 mese	Prezzo orario per unità modello con impegno di 6 mesi
Claude Instant	49,00 USD	27,00 USD
Claude 2.0/2.1	79,00 USD	44,00 USD

Contatta il team del tuo account AWS per maggiori dettagli sulle unità modello.

Cohere

Cohere

Prezzi on-demand

Modelli Cohere	Prezzo per 1.000 token di input	Prezzo per 1,000 token di output	Prezzo per immagine
Command	0,0015 USD	0,0020 USD	N/D
Command-Light	0,0003 USD	0,0006 USD	N/D
Command R+	0,0030 USD	0,0150 USD	N/D
Command R	0,0005 USD	0,0015 USD	N/D
Embed 3 inglese	0,0001 USD	N/D	0,0001 USD
Embed 3 multilingue	0,0001 USD	N/D	0,0001 USD

Modelli Cohere	Prezzo per 1.000 query**
Rerank 3.5	2,00 USD
**Ti viene addebitato il numero di query in cui una query può contenere fino a 100 blocchi di documenti. Se la query contiene più di 100 blocchi di documenti, viene conteggiata come query multipla. Ad esempio, se una richiesta contiene 350 documenti, verrà considerata come 4 query. Tieni presente che ogni documento può contenere solo fino a 500 token (inclusi i token totali della query e del documento) e, se la lunghezza del token è superiore a 512 token, viene suddiviso in più documenti.

Prezzi per la personalizzazione (messa a punto)

Modelli Cohere	Prezzo per addestrare 1.000 gettoni	Prezzo mensile per memorizzare ogni modello personalizzato	Prezzo da dedurre da un modello personalizzato per unità di modello all'ora (con prezzi Provisioned Throughput senza impegno)
Cohere Command	0,004 USD	1,95 USD	49,50 USD
Command-Light Cohere	0,001 USD	1,95 USD	8,56 USD

*Token totali addestrati = numero di token nel corpus di dati di addestramento x numero di epoche

Prezzi del throughput fornito

Modelli Cohere	Prezzo orario per modello senza impegno	Prezzo orario per unità modello con impegno di 1 mese	Prezzo orario per unità modello con impegno di 6 mesi
Cohere Command	49,50 USD	39,60 USD	23,77 USD
Cohere Command - Light	8,56 USD	6,85 USD	4,11 USD
Embed 3 inglese	7,12 USD	6,76 USD	6,41 USD
Embed 3 multilingue	7,12 USD	6,76 USD	6,41 USD

Contatta il team del tuo account AWS o il team di vendita per maggiori dettagli sulle unità modello.

DeepSeek

DeepSeek

Prezzi on demand

Regioni: Stati Uniti orientali (Virginia settentrionale), Stati Uniti orientali (Ohio) e Stati Uniti occidentali (Oregon)

Modelli DeepSeek	Prezzo di 1.000 token di input	Prezzo di 1.000 token di output
DeepSeek-R1	0,00135 USD	0,0054 USD

Luma AI

Prezzi on demand

Modelli Luma AI	Risoluzione video	Prezzo al secondo di video generato
Luma Ray2	720p, 24 fps	1,50 USD
Luma Ray2	540p, 24 fps	0,75 USD

Meta

Stability AI

Prezzi on demand

Modello Stability AI	Prezzo per immagine generata
Stable Diffusion 3.5 Large	0,08 USD
Stable Image Core	0,04 USD
Stable Diffusion 3 Large	0,08 USD
Stable Image Ultra	0,14 USD

La precedente generazione dei modelli di immagine offerti da Stability AI ha un prezzo per immagine, che dipende dal numero di passaggi e dalla risoluzione dell'immagine.

Modello Stability AI	Risoluzione dell'immagine	Prezzo per immagine generata per una qualità standard (<=50 passaggi)	Prezzo per immagine generata per una qualità premium (>50 passaggi)
SDXL 1,0	Fino a 1024 x 1024	0,04 USD	0,08 USD

Prezzi del throughput fornito

Modello Stability AI	Prezzo orario per unità modello con impegno di 1 mese*	Prezzo orario per unità modello per un impegno di 6 mesi*
SDXL 1,0	49,86 USD	46,18 USD

*Include l'inferenza per i modelli base e personalizzati

Contatta il tuo account AWS o il team di vendita per maggiori dettagli sulle unità modello.

Attualmente, la personalizzazione del modello (messa a punto) non è supportata per i modelli Stability AI su Amazon Bedrock.

Importazione di modelli personalizzati

Importazione di modelli personalizzati

Llama
Lama multimodale
Mistral
Mixtral
Flan

Llama

Regioni: Stati Uniti orientali (Virginia settentrionale) e Stati Uniti occidentali (Oregon)

Versione unità di modello personalizzate	v1.0
Prezzo per unità di modello personalizzate al min*	0,0785 USD
Costo mensile di archiviazione per unità di modello personalizzate	1,95 USD

Regione: Europa (Francoforte)

Versione unità di modello personalizzate	v1.0
Prezzo per unità di modello personalizzate al min*	0,0981 USD
Costo mensile di archiviazione per unità di modello personalizzate	1,95 USD

Nota: Le unità di modello personalizzate necessarie per ospitare un modello dipendono da una serie di fattori, in particolare dall'architettura del modello, dal numero di parametri del modello e dalla lunghezza del contesto. Il numero esatto di unità di modello personalizzate necessarie sarà determinato al momento dell'importazione. A titolo di riferimento, il modello Llama 3.1 8B 128K richiede 2 unità di modello personalizzate, mentre il modello Llama 3.1 70B 128k richiede 8 unità di modello personalizzate.

*Fatturato in intervalli da 5 minuti

Lama multimodale

Regioni: Stati Uniti orientali (Virginia settentrionale) e Stati Uniti occidentali (Oregon)

Versione unità di modello personalizzate	v1.0
Prezzo per unità di modello personalizzate al min*	0,0785 USD
Costo mensile di archiviazione per unità di modello personalizzate	1,95 USD

Regione: Europa (Francoforte)

Versione unità di modello personalizzate	v1.0
Prezzo per unità di modello personalizzate al min*	0,0981 USD
Costo mensile di archiviazione per unità di modello personalizzate	1,95 USD

*Fatturato in intervalli da 5 minuti

Mistral

Regioni: Stati Uniti orientali (Virginia settentrionale) e Stati Uniti occidentali (Oregon)

Versione unità di modello personalizzate	v1.0
Prezzo per unità di modello personalizzate al min*	0,0785 USD
Costo mensile di archiviazione per unità di modello personalizzate	1,95 USD

Regione: Europa (Francoforte)

Versione unità di modello personalizzate	v1.0
Prezzo per unità di modello personalizzate al min*	0,0981 USD
Costo mensile di archiviazione per unità di modello personalizzate	1,95 USD

*Fatturato in intervalli da 5 minuti

Mixtral

Regioni: Stati Uniti orientali (Virginia settentrionale) e Stati Uniti occidentali (Oregon)

Versione unità di modello personalizzate	v1.0
Prezzo per unità di modello personalizzate al min*	0,0785 USD
Costo mensile di archiviazione per unità di modello personalizzate	1,95 USD

Regione: Europa (Francoforte)

Versione unità di modello personalizzate	v1.0
Prezzo per unità di modello personalizzate al min*	0,0981 USD
Costo mensile di archiviazione per unità di modello personalizzate	1,95 USD

*Fatturato in intervalli da 5 minuti

Flan

Regioni: Stati Uniti orientali (Virginia settentrionale) e Stati Uniti occidentali (Oregon)

Versione unità di modello personalizzate	v1.0
Prezzo per unità di modello personalizzate al min*	0,0785 USD
Costo mensile di archiviazione per unità di modello personalizzate	1,95 USD

Regione: Europa (Francoforte)

Versione unità di modello personalizzate	v1.0
Prezzo per unità di modello personalizzate al min*	0,0981 USD
Costo mensile di archiviazione per unità di modello personalizzate	1,95 USD

*Fatturato in intervalli da 5 minuti

Prezzi di inferenza on demand:
La fatturazione viene effettuata in finestre di 5 minuti per la durata in cui la copia del modello è attiva a partire dalla prima invocazione avvenuta con successo. Il limite massimo di throughput e concorrenza per copia del modello dipende da fattori quali la combinazione di token di input/output, il tipo di hardware, le dimensioni del modello, l'architettura, le ottimizzazioni dell'inferenza e viene determinato durante il flusso di lavoro di importazione del modello.

Bedrock scala automaticamente il numero di copie del modello in base ai modelli di utilizzo. Se non ci sono invocazioni per un periodo di 5 minuti, Bedrock si ridurrà verticalmente a zero per poi scalare nuovamente verso l'alto quando il modello verrà invocato. Durante il processo di aumento verticale, è possibile che si verifichi una durata dell'avvio a freddo (in decine di secondi) a seconda delle dimensioni del modello. Bedrock aumenta verticalmente anche il numero di copie del modello se il volume di inferenza supera costantemente i limiti di concorrenza di una singola copia del modello. Nota: per impostazione predefinita, è previsto un massimo di 3 copie del modello per account per modello importato che è possibile aumentare tramite Service Quotas.

Dettagli sui prezzi per strumenti e ottimizzazione

Flows
Basi di conoscenza
Guardrail
Valutazione del modello
Automazione dei dati

Flows
Amazon Bedrock Flows

I costi addebitati dipendono dal numero di transizioni di nodo completate necessarie per eseguire un'applicazione. Bedrock Flows conta una transizione di nodo ogni volta che viene eseguito un nodo nel flusso di lavoro. Il costo viene calcolato in base al numero totale di transizioni di nodo per tutti i flussi.

Tutti gli addebiti vengono contabilizzati giornalmente e fatturati mensilmente a partire dal 1° febbraio 2025.

Prezzo per 1.000 transizioni di nodo

0,035 USD

Costi aggiuntivi

Potranno essere addebitati costi aggiuntivi se l'esecuzione del flusso di lavoro dell'applicazione prevede l'utilizzo di altri servizi AWS o di trasferimento dei dati. Ad esempio, se il flusso di lavoro invoca una policy Amazon Bedrock Guardrail, verrà fatturato il numero di unità di testo elaborate dalla policy.
Basi di conoscenza
Recupero di dati strutturati (generazione SQL)

Il recupero dei dati strutturati viene addebitato per ogni richiesta di generazione di una query SQL. La query SQL generata viene utilizzata per recuperare i dati dagli archivi di dati strutturati.

Modelli Rerank

I modelli Rerank sono progettati per migliorare la pertinenza e l'accuratezza delle risposte nelle applicazioni generazione potenziata tramite recupero (RAG). Vengono addebitati per query.

**Ti viene addebitato il numero di query in cui una query può contenere fino a 100 blocchi di documenti. Se la query contiene più di 100 blocchi di documenti, viene conteggiata come query multipla. Ad esempio, se una richiesta contiene 350 documenti, verrà considerata come 4 query. Tieni presente che ogni documento può contenere solo fino a 512 token (inclusi i token totali della query e del documento) e, se la lunghezza del token è superiore a 512 token, viene suddiviso in più documenti. Una query è equivalente a un'unità di ricerca.
Guardrail

Prezzo per 1.000 transizioni di nodo
0,035 USD

Guardrail di Amazon Bedrock

Policy sui guardrail*	Prezzo
Filtri di contenuto (contenuto testuale)	0,15 USD per 1.000 unità di testo
Filtri di contenuto (contenuto di immagini)	0,00075 USD per immagine elaborata
Argomenti negati	0,15 USD per 1.000 unità di testo
Filtri per informazioni sensibili	0,10 USD per 1.000 unità di testo
Filtri per informazioni sensibili (espressione regolare)	Gratis
Filtri per parola	Gratis
Verifica contestuale di base	0,10 USD per 1.000 unità di testo

Prezzi on demand

* Ogni politica guardrail è opzionale e può essere abilitata in base ai requisiti dell'applicazione. Gli addebiti avverranno in base al tipo di polizza utilizzata nel guardrail. Ad esempio, se un guardrail è configurato con filtri di contenuto e argomenti negati, verranno addebitati costi per queste due policy, mentre non ci saranno addebiti associati ai filtri di informazioni sensibili.

Nota: un'unità di testo può contenere fino a 1.000 caratteri. Se un input di testo è superiore a 1.000 caratteri, viene elaborato come unità di testo multiple, ciascuna contenente fino a 1.000 caratteri. Ad esempio, se un input di testo contiene 5.600 caratteri, verranno addebitate 6 unità di testo.

La verifica contestuale di base utilizza una fonte di riferimento e una query per stabilire se la risposta del modello si basa sulla fonte ed è pertinente alla query. Il numero totale di unità di testo addebitate viene calcolato combinando tutti i caratteri della fonte, della query e della risposta del modello.

Valutazione del modello

Valutazione del modello

La valutazione del modello viene addebitata per l'inferenza del modello scelto. I punteggi algoritmici generati automaticamente vengono forniti senza costi aggiuntivi. Per la valutazione su base umana, in cui l'utente porta il proprio flusso di lavoro, viene addebitato il costo dell'inferenza del modello nella valutazione e un costo di 0,21 USD per ogni attività umana completata.

Modello

Prezzo di 1.000 token di input

Prezzo di 1.000 token di output

Prezzo per attività umana

Modello selezionato per la valutazione

In base al modello selezionato

0,21 USD

Automazione dei dati
Automazione dei dati

Amazon Bedrock Knowledge Bases offre un'integrazione di Bedrock Data Automation per fornire risposte più pertinenti e accurate per i dati multimodali. Quando configuri una Knowledge Base, puoi selezionare Bedrock Data Automation come metodo di analisi per analizzare ed estrarre informazioni significative da immagini o documenti, che possono includere figure, grafici e diagrammi. Durante l'elaborazione, Bedrock Data Automation estrae informazioni significative dai documenti e dalle immagini inseriti, che vengono poi utilizzate nelle fasi successive della Knowledge Base per la suddivisione in blocchi, l'embedding e l'archiviazione. Se integrato con le Knowledge Base, Bedrock Data Automation fornisce e addebita un output standardizzato.

Esempi di prezzo

AI21 Labs

Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock: una richiesta al modello Jurassic-2 Mid di AI21 per riepilogare un input di 10.000 token di testo di input in un output di 2.000 token.

Costo totale sostenuto = 10.000 token/1.000 x 0,0125 USD + 2.000 token/1.000 x 0,0125 USD = 0,15 USD
Amazon

Prezzi on demand

Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock su base oraria: una richiesta al modello Amazon Titan Text Lite per riepilogare un input di 2.000 token di testo di input in un output di 1.000 token.

Costo orario totale sostenuto = 2.000 token/1.000 x 0,0003 USD + 1.000 token/1.000 x 0,0004 USD = 0,001 USD.

Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock: una richiesta al modello base di Amazon Titan Image Generator per generare 1.000 immagini di dimensione 1024 x 1024 di qualità standard.

Costo totale sostenuto = 1.000 immagini x 0,01 USD per immagine = 10 USD

Prezzi di personalizzazione (ottimizzazione e pre-addestramento continuo)

Uno sviluppatore di applicazioni personalizza un modello Amazon Titan Image Generator utilizzando 1.000 coppie immagine-testo. Dopo l'addestramento, lo sviluppatore utilizza il throughput fornito dal modello personalizzato per un'ora allo scopo di valutare le prestazioni del modello. Il modello ottimizzato viene archiviato per un mese. Dopo la valutazione, lo sviluppatore utilizza il throughput fornito (durata dell'impegno di 1 mese) per ospitare il modello personalizzato.

Il costo mensile sostenuto per l'ottimizzazione è: formazione sull'ottimizzazione (0,005 USD x 500 x 64), dove 0,005 USD è il prezzo per immagine visualizzata, 500 è il numero di passaggi e 64 è la dimensione del batch + archiviazione del modello personalizzato al mese (1,95 USD) + un'ora di inferenza del modello personalizzato (21 USD) = 160 USD + 1,95 USD + 21 = 182,95 USD

Prezzi del throughput fornito

Uno sviluppatore di applicazioni acquista due unità di modello di Amazon Titan Text Express con un vincolo di 1 mese per il suo caso d'uso di riepilogo di testo.

Costo mensile totale sostenuto: 2 unità di modello x 18,40 USD/ora x 24 ore x 31 giorni = 27.379,20 USD

Uno sviluppatore di applicazioni acquista un'unità di modello del modello Amazon Titan Image Generator base con un vincolo di 1 mese.

Costo totale sostenuto = 1 unità di modello x 16,20 USD x 24 ore x 31 giorni = 12.052,80 USD
Guardrail di Amazon Bedrock

Esempio 1: chatbot per l'assistenza clienti
Uno sviluppatore di applicazioni crea un chatbot per l'assistenza clienti e utilizza i filtri dei contenuti per bloccare i contenuti dannosi e gli argomenti negati per filtrare domande e risposte indesiderate.

Il chatbot risponde a 1.000 richieste di utenti all'ora. Ogni richiesta utente ha una lunghezza media di input di 200 caratteri e riceve una risposta FM di 1.500 caratteri.

Ogni richiesta utente di 200 caratteri corrisponde a 1 unità di testo.

Ogni risposta FM di 1.500 caratteri corrisponde a 2 unità di testo.

Unità di testo elaborate ogni ora = (1 + 2) x 1.000 query = 3.000 unità di testo

Costo totale sostenuto all'ora per i filtri dei contenuti e l'argomento negato = 3000 x (0,15 USD + 0,15 USD)/1000 = 0,90 USD

Esempio 2: riepilogo della trascrizione del call center
Uno sviluppatore di applicazioni crea un'applicazione per riepilogare le trascrizioni delle chat tra utenti e agenti dell'assistenza. Utilizza un filtro per informazioni sensibili per oscurare le informazioni di identificazione personale (PII) nei riepiloghi generati per 10.000 conversazioni.

Ogni riepilogo generato ha una media di 3.500 caratteri che corrispondono a 4 unità di testo.

Costo totale sostenuto per riassumere 10.000 conversazioni = 10.000 x 4 x (0,1/1.000 USD) = 4 USD
Basi di conoscenza di Amazon Bedrock

Esempio di prezzo 1 (riposizionamento utilizzando il modello Amazon Rerank 1.0)

In un dato mese, effettui 2 milioni di richieste all'API Rerank utilizzando il modello Amazon Rerank 1.0: 1 milione di richieste contengono meno di 100 documenti ciascuna e quindi verrà addebitata una richiesta ciascuna. Il restante milione di richieste contiene 120-150 documenti e quindi ogni richiesta sarà addebitata per 2 richieste.

Prezzo per una richiesta = 0,001 USD
Addebito totale = 1.000.000 USD x 0,001 USD + 1.000.000 x 2 x 0,001 USD = 3000 USD

Esempio di prezzo 2: (recupero di dati strutturati)

Uno sviluppatore di applicazioni crea un chatbot di supporto che interroga i dati strutturati archiviati in Amazon Redshift. Lo sviluppatore crea una Knowledge Base Bedrock e si connette ad Amazon Redshift. Il chatbot risponde a 10000 query di utenti all'ora. Ogni query utente costerà 0,002 USD per GenerateQuery API per generare SQL dalla query utente.

Costo totale sostenuto per la generazione di SQL all'ora = 0,002 USD*10000 = 20 USD.
Costo totale sostenuto nel mese = 20 x 24 x 30 USD = 1.440 USD
Anthropic

Prezzi on demand

Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock nella regione Stati Uniti occidentali (Oregon): una richiesta al modello Claude di Anthropic per riepilogare un input di 11.000 token di testo di input in un output di 4.000 token.

Costo totale sostenuto= 11.000 token/1.000 x 0,008 USD + 4.000 token/1.000 x 0,024 USD = 0,088 USD + 0,096 USD = 0,184 USD

Prezzi del throughput fornito

Uno sviluppatore di applicazioni acquista un'unità di modello di Anthropic Claude Instant nella regione Stati Uniti occidentali (Oregon):

Costo mensile totale sostenuto: 1 unità di modello x 39,60 USD x 24 ore x 31 giorni = 29.462,40 USD
Cohere

Prezzi su richiesta

Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock: una richiesta al modello Command di Cohere per riepilogare un input di 6.000 token di testo di input in un output di 2.000 token.

Costo totale sostenuto = 6.000 token/1.000 x 0,0015 USD + 2.000 token/1.000 x 0,0020 USD = 0,013 USD

Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock: una richiesta al modello Command-Light di Cohere per riepilogare un input di 6.000 token di testo di input in un output di 2.000 token.

Costo totale sostenuto = 6.000 token/1.000 x 0,0003 USD + 2.000 token/1.000 x 0,0006 USD = 0,003 USD

Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock: una richiesta al modello Embed inglese o multilingue di Cohere per generare integrazioni per 10.000 token di input.

Costo totale sostenuto = 10.000 token/1.000 x 0,0001 USD = 0,001 USD

Prezzi per la personalizzazione (ottimizzazione)

Uno sviluppatore di applicazioni personalizza un modello Cohere Command utilizzando 1.000 token di dati. Dopo l'addestramento, utilizza il throughput fornito dal modello personalizzato per 1 ora per valutare le prestazioni del modello. Il modello ottimizzato viene archiviato per un mese. Dopo la valutazione, lo sviluppatore utilizza il throughput fornito (impegno di 1 mese) per ospitare il modello personalizzato.

Costo mensile sostenuto per l'ottimizzazione: addestramento di ottimizzazione (0,004 USD x 1.000) + archiviazione del modello personalizzato al mese (1,95 USD) + un'ora di inferenza del modello personalizzato (49,50 USD) = 55,45 USD

Costo mensile sostenuto per il throughput previsto (impegno di 1 mese) del modello personalizzato = 39,60 USD

Prezzi del throughput fornito

Uno sviluppatore di applicazioni acquista un'unità di modello di Cohere Command con un vincolo di 1 mese per il suo caso d'uso di riepilogo di testo.

Costo mensile totale sostenuto: 1 unità di modello x 39,60 USD x 24 ore x 31 giorni = 29.462,40 USD
Importazione di modelli personalizzati

Esempio di prezzo: uno sviluppatore di applicazioni importa un modello di tipo Llama 3.1 personalizzato con una dimensione di 8B di parametri con una lunghezza di sequenza di 128K nella regione us-east-1 ed elimina il modello dopo 1 mese. Ciò richiede 2 unità di modello personalizzate. Il prezzo al minuto sarà, quindi, di 0,1570 USD perché sono necessarie 2 unità di modello personalizzate. I costi di archiviazione del modello per 2 unità di modello personalizzate sono 3,90 USD al mese.

L'importazione del modello è gratuita. La prima invocazione riuscita è alle 08:03, momento in cui inizia la misurazione. Le finestre di misurazione di 5 minuti sono dalle 08:03 alle 08:07; dalle 08:07 alle 08:11 e così via. Se viene effettuata almeno un'invocazione durante un periodo di 5 minuti, la finestra sarà considerata attiva per la fatturazione. Se viene effettuata un'invocazione alle 08:03 e non ci sono ulteriori invocazioni dopo le 08:07, la misurazione si interromperà alle 08:07. In questo caso, la fattura verrebbe calcolata come segue: 0,1570 USD × 5 minuti × 1 intervallo da cinque minuti = 0,785 USD.
Automazione dei dati

Esempio di prezzi 1:
Supponiamo che tu elabori un documento di 1.000 pagine utilizzando BDA Custom Output. Tutte le 1.000 pagine vengono elaborate utilizzando il blueprint 1 che ha 15 campi. Il prezzo per pagina per qualsiasi blueprint con 30 campi o meno è di 0,040 USD. Il costo totale sarebbe 40 USD.

Totale pagine elaborate = 1.000
Prezzo per pagina per i blueprint con meno di 30 campi = 0,040 USD
Addebito totale = 1,000 USD x 0.040 = 40 USD

Esempio di prezzi 2:
Supponiamo che tu elabori 2 documenti utilizzando BDA Custom Output. Il documento 1 ha 40 pagine e viene elaborato utilizzando il blueprint 1 che ha 20 campi. Il documento 2 ha 10 pagine e viene elaborato utilizzando il blueprint 2, che ha 40 campi. Il prezzo per pagina del blueprint 1 è di 0,040 USD poiché contiene 30 campi o meno. Il prezzo per pagina del blueprint 2 è di 0,045 USD. Il costo di elaborazione del Documento 1 utilizzando il blueprint 1 è di 1,60 USD. Il costo di elaborazione del Documento 2 utilizzando il blueprint 2 è di 0,45 USD. Il costo totale di elaborazione di entrambi i documenti sarebbe di 2,05 USD.

Totale pagine elaborate = 50
Prezzo per pagina per Blueprint 1 con meno di 30 campi = 0,040 USD
Prezzo per pagina per Blueprint 2 con 40 campi = 0,040 USD + (numero di campi aggiuntivi superiori a 30 x 0,0005 USD per campo)
Numero di campi aggiuntivi superiori a 30 = 40 - 30 = 10
Prezzo per pagina per Blueprint 2 con 40 campi = 0,040 USD + (10 x 0,0005 USD per campo) = 0,045 USD
Addebito per Documento 1 utilizzando Blueprint 1 = 40 pagine x 0,040 USD per pagina = 1,6 USD
Addebito per Documento 2 utilizzando Blueprint 2 = 10 pagine x 0,045 USD per pagina = 0,45 USD
Costo totale = Addebito per Documento 1 + Addebito per Documento 2 = 1,6 USD + 0,45 USD = 2,05 USD

Esempio di prezzi 3:
Supponiamo di configurare Bedrock Knowledge Bases per utilizzare Bedrock Data Automation come parser, per poi importare un documento di 1.000 pagine. Le strutture dei costi differiscono in base alle opzioni di analisi di Knowledge Bases. BDA utilizza un sistema di tariffe per pagina, mentre i prezzi dei parser dei modelli di fondazione vengono calcolati in base ai token di input e output. Per contestualizzare, l'elaborazione di 1.000 pagine, di cui il 30% contiene tabelle e il 30% contiene cifre, richiede in genere 2.900 token di input e 750 token di output. Il consumo di token varia in base al tipo di contenuto, pertanto invitiamo i clienti a effettuare test utilizzando i propri dati per ottenere stime più accurate. L'integrazione tra Bedrock Knowledge Bases e Bedrock Data Automation utilizza l'output standard, il cui prezzo per pagina è di 0,010 USD. Il costo totale sarebbe 10 USD.

Totale pagine elaborate = 1.000
Prezzo per pagina per output standard = 0,010 USD
Costo totale = 1.000 x 0,010 USD = 10 USD

Esempio di prezzi 4:
Supponiamo di elaborare un video di 60 minuti utilizzando l'output standard di BDA. Il prezzo al minuto per l'output video standard è di 0,050 USD. Il costo totale sarebbe 3.00 USD.

Minuti totali elaborati = 60
Prezzo al minuto per output video standard = 0,050 USD
Addebito totale = 60 x 0,050 USD = 3,00 USD

Esempio di prezzi 5:
Supponiamo di elaborare 2.000 immagini utilizzando l'output personalizzato di BDA. Le prime 1.000 immagini vengono elaborate utilizzando il blueprint 1, che ha 10 campi. Le ultime 1.000 pagine vengono elaborate utilizzando il blueprint 2, che ha 40 campi. Il prezzo per immagine del blueprint 1 è di 0,005 USD, poiché contiene 30 campi o meno. Il prezzo per immagine del blueprint 2 è di 0,01 USD. Il costo di elaborazione per le prime 1.000 immagini utilizzando il blueprint 1 è di 5,00 USD. Il costo di elaborazione per le seconde 1.000 immagini utilizzando il blueprint 2 è di 10,00 USD. Il costo totale di elaborazione di tutte le 2.000 immagini sarebbe di 15 USD

Costo per le prime 1.000 immagini = 1.000 immagini x 0,005 USD per immagine = 5,00 USD
Costo per le seconde 1.000 immagini = 1.000 immagini x (0,005 USD + (numero di campi aggiuntivi superiori a 30 x 0,0005 USD per campo))
= 1.000 x (0,005 USD + ((40-30) x 0,0005 USD))
= 1.000 x (0,005 USD + (10 x 0,0005 USD)) = 10,00 USD
Costo totale = 5,00 USD + 10,00 USD = 15,00 USD

Esempio di prezzi 6:
Supponiamo di utilizzare l'output standard di Bedrock Data Automation per elaborare 15.000 minuti di registrazioni audio di riunioni nella propria organizzazione. Il costo totale di elaborazione di tutti i 15.000 minuti audio sarebbe di 90 USD.

Minuti totali elaborati = 15.000 minuti
Costo totale = 15.000 min × 0,006 USD = 90 USD
DeepSeek

Prezzi on demand

Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock su base oraria: una richiesta al modello DeepSeek-R1 per riassumere un input di 2.000 token di testo di input in un output di 1.000 token (inclusi i token di ragionamento):

Costo orario totale sostenuto = 2.000 token/1.000 x 0,00135 USD + 1.000 token/1.000 x 0,0054 USD = 0,0081 USD
Flows

Esempio: riepilogo delle notizie
Uno sviluppatore di applicazioni crea un flusso per automatizzare il riepilogo delle notizie per i trader. Il flusso include un nodo di input che memorizza una posizione S3 e un nodo di recupero S3 che recupera 10 file che includono articoli di 10 importanti agenzie di stampa in S3 (transizioni a 2 nodi). Quindi utilizza un nodo iteratore per richiamare un modello con un nodo prompt per riepilogare ogni file (+ 10 file x 2 transizioni di nodi). Inoltre, raccoglie tutti i risultati utilizzando un nodo di raccolta, scrive i risultati su S3 utilizzando il nodo di archiviazione S3 e completa in quello di output (+ 3 transizioni di nodo). Eseguono questo flusso ogni mezz'ora di ogni giorno della settimana.

Il numero di transizioni di nodo per esecuzione di flusso è: 2 + 1 + 10 x 2 + 3 = 25 transizioni di nodo per esecuzione del flusso

Il numero di esecuzioni di flusso al mese è: 24 ore × 2 × 5 giorni × 4 settimane = 960 esecuzioni di flusso al mese.

La fattura mensile totale è: 25 × 960 × 0,035/1000 USD = 0,84 USD

Costi aggiuntivi
La fattura includerà anche costi aggiuntivi per i servizi AWS utilizzati nell'esecuzione del flusso di lavoro, inclusi gli utilizzi di Amazon S3 nei nodi di recupero e archiviazione e l'utilizzo del modello di fondazione Amazon Bedrock nel nodo prompt.
Meta

Prezzi on demand

Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock: una richiesta al modello Llama 2 Chat (13B) di Meta per riepilogare un input di 2.000 token di testo di input in un output di 500 token.

Costo totale sostenuto = 2.000 token/1.000 x 0,00075 USD + 500 token/1.000 x 0,001 USD = 0,002 USD

Prezzi per la personalizzazione (ottimizzazione)

Uno sviluppatore di applicazioni personalizza il modello Llama 2 pre-addestrato (70B) utilizzando 1.000 token di dati. Dopo l'addestramento, utilizza il throughput fornito dal modello personalizzato per 1 ora per valutare le prestazioni del modello. Il modello ottimizzato viene archiviato per un mese. Dopo la valutazione, lo sviluppatore utilizza il throughput fornito (impegno di 1 mese) per ospitare il modello personalizzato.

Costo mensile sostenuto per l'ottimizzazione: addestramento di ottimizzazione (0,00799 USD x 1.000) + archiviazione del modello personalizzato al mese (1,95 USD) + un'ora di inferenza del modello personalizzato (23,50 USD) = 33,44 USD

Costo mensile sostenuto per il throughput fornito (impegno di 1 mese) del modello personalizzato = 21,18 USD

Prezzi del throughput fornito

Uno sviluppatore di applicazioni acquista un'unità di modello di Meta Llama 2 con un impegno di 1 mese per il suo caso d'uso di riepilogo di testo.

Costo mensile totale sostenuto: 1 unità di modello x 21,18 USD x 24 ore x 31 giorni = 15.757,92 USD
Mistral AI

Prezzi on demand

Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock su base oraria: una richiesta al modello Mistral 7B per riepilogare un input di 2.000 token di testo di input in un output di 1.000 token.

Costo orario totale sostenuto = 2.000 token/1.000 x 0,00015 USD + 1.000 token/1.000 x 0,0002 USD = 0,0005 USD

Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock su base oraria: una richiesta al modello Mixtral 8x7B per riepilogare un input di 2.000 token di testo di input in un output di 1.000 token.

Costo orario totale sostenuto = 2.000 token/1.000 x 0,00045 USD + 1.000 token/1.000 x 0,0007 USD = 0,0016 USD

Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock su base oraria: una richiesta al modello Mistral Large per riepilogare un input di 2.000 token di testo di input in un output di 1.000 token.

Costo orario totale sostenuto = 2.000 token/1.000 x 0,008 USD + 1.000 token/1.000 x 0,024 USD = 0,04 USD

Valutazione del modello

Esempio di valutazione del modello 1:

Il set di dati contiene 50 prompt e lo sviluppatore richiede 1 worker per valutare ogni set di prompt e risposte (configurabile nella creazione del lavoro di valutazione come parametro "worker per prompt").

Ci saranno 50 attività in questo processo di valutazione (1 attività per ogni coppia prompt-risposta per ogni worker). I 50 prompt si combinano in 5.000 token di input e le risposte associate si combinano in 15.000 token per Anthropic Claude Instant e 20.000 token per Anthropic Claude 2.1.

Per questo lavoro di valutazione del modello sono previsti i seguenti costi:

Elemento	Numero di token di input	Prezzo per 1.000 token di input	Costo dell'input	Numero di token di uscita	Prezzo per 1.000 token di output	Costo dell’output	Numero di attività umane	Prezzo per attività umana	Costo delle attività umane	Totale
Inferenza istantanea di Claude	5.000	0,0008 USD	0,004 USD	15.000	0,0024 USD	0,036 USD				0,04 USD
Inferenza Claude 2.1	5.000	0,008 USD	0,04 USD	20.000	0,024 USD	0,48 USD				0,52 USD
Attività umane							50	0,21 USD	10,50 USD	10,50 USD
Totale										11,06 USD

Esempio di valutazione del modello 2:

Prezzi on demand
Uno sviluppatore di applicazioni invia un set di dati per la valutazione del modello basato sull'uomo utilizzando Anthropic Claude 2.1 e Anthropic Claude Instant nella Regione AWS Stati Uniti orientali (Virginia settentrionale).

Il set di dati contiene 50 prompt e lo sviluppatore richiede 2 worker per valutare ogni set di prompt e risposte (configurabile nella creazione del lavoro di valutazione come parametro "worker per prompt"). Ci saranno 100 attività in questo lavoro di valutazione (1 attività per ogni coppia prompt-risposta per ogni worker: 2 worker x 50 set di risposta rapida = 100 attività umane).

I 50 prompt si combinano in 5.000 token di input e le risposte associate si combinano in 15.000 token per Anthropic Claude Instant e 20.000 token per Anthropic Claude 2.1.

Per questo lavoro di valutazione del modello sono previsti i seguenti costi:

Elemento	Numero di token di input	Prezzo per 1.000 token di input	Costo dell'input	Numero di token di uscita	Prezzo per 1.000 token di output	Costo dell’output	Numero di attività umane	Prezzo per attività umana	Costo delle attività umane	Totale
Inferenza istantanea di Claude	5.000	0,0008 USD	0,0040 USD	15.000	0,0024 USD	0,036 USD				0,04 USD
Inferenza Claude 2.1	5.000	0,008 USD	0,0400 USD	20.000	0,024 USD	0,48 USD				0,52 USD
Attività umane							100	0,21 USD	21,00 USD	21,00 USD
Totale										21,56 USD

Stability AI

Prezzi su richiesta

Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock: una richiesta al modello SDXL per generare un'immagine di 512 x 512 con dimensione del passo di 70 (qualità eccellente).

Costo totale sostenuto = 1 immagine x 0,036 USD per immagine = 0,036 USD

Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock: una richiesta al modello SDXL1.0 per generare un'immagine di 1024 x 1024 con dimensione del passo di 70 (qualità eccellente).

Costo totale sostenuto = 1 immagine x 0,08 USD per immagine = 0,08 USD

Prezzi del throughput fornito

Uno sviluppatore di applicazioni acquista un'unità di modello di SDXL1.0 con un impegno di 1 mese.

Costo totale sostenuto = 1 x 49,86 USD x 24 ore x 31 giorni = 37.095,84 USD

Meta modelli	Prezzo per 1.000 token di input	Prezzo per 1.000 token di output
Chat Llama 2 (13B)	0,00075 USD	0,001 USD
Chat Llama 2 (70B)	0,00195 USD	0,00256 USD

Meta modelli	Prezzo orario per unità modello con impegno di 1 mese	Prezzo orario per unità modello con impegno di 6 mesi
Llama 2 Preaddestrato e Chat (13B)	21,18 USD	13,08 USD
Llama 2 Preaddestrato (70B)	21,18 USD	13,08 USD

Prezzi di Amazon Bedrock

Panoramica dei prezzi

Modelli di prezzo

On demand e in batch

Latenza ottimizzata (anteprima pubblica)

Throughput assegnato

Importazione di modelli personalizzati

Modelli di Marketplace

Personalizzazione e ottimizzazione

Personalizzazione del modello

Distillazione di modelli

Memorizzazione nella cache di prompt

Strumenti

Guardrail

Knowledge Base e automazione dei dati

Agenti

Flows

Valutazioni

Dettagli sui prezzi del modello

AI21 Labs

Amazon Nova

Prezzi dei modelli di comprensione

Prezzi per i modelli di generazione di contenuti creativi

Prezzi per i modelli di comprensione e generazione vocale

Prezzi on demand per i modelli di fondazione di sintesi vocale

Amazon Titan

Anthropic

Cohere

DeepSeek

Prezzi on demand

Meta

Mistral AI

Stability AI

Importazione di modelli personalizzati

Dettagli sui prezzi per strumenti e ottimizzazione

Amazon Bedrock Flows

Guardrail di Amazon Bedrock

Valutazione del modello

Automazione dei dati

Esempi di prezzo

AI21 Labs

Amazon

Prezzi on demand

Prezzi di personalizzazione (ottimizzazione e pre-addestramento continuo)

Prezzi del throughput fornito

Guardrail di Amazon Bedrock

Basi di conoscenza di Amazon Bedrock

Anthropic

Prezzi on demand

Prezzi del throughput fornito

Cohere

Prezzi su richiesta

Prezzi per la personalizzazione (ottimizzazione)

Importazione di modelli personalizzati

Automazione dei dati

DeepSeek

Flows

Meta

Prezzi on demand

Prezzi per la personalizzazione (ottimizzazione)

Prezzi del throughput fornito

Mistral AI

Prezzi on demand

Valutazione del modello

Esempio di valutazione del modello 1:

Esempio di valutazione del modello 2:

Stability AI

Prezzi su richiesta

Prezzi del throughput fornito

Fine del supporto per Internet Explorer