Funzionalità di Amazon Textract

Perché scegliere Amazon Textract?

Amazon Textract è un servizio di machine learning (ML) che estrae automaticamente testo, scrittura a mano, elementi di layout e dati da documenti scansionati. Si spinge oltre il semplice riconoscimento ottico dei caratteri (OCR) per identificare, capire ed estrarre dati da moduli e tabelle. Tutti i dati estratti vengono restituiti con coordinate di riquadri di delimitazione, cioè cornici poligonali che racchiudono ciascun dato identificato, ad esempio una parola, una riga, una tabella o singole celle all'interno di una tabella. Amazon Textract restituisce anche un punteggio di affidabilità per tutti gli oggetti che è in grado di identificare, consentendo di prendere decisioni informate su come utilizzare i risultati.

Ulteriori informazioni

Page topics

Caratteristiche generali

Caratteristiche generali

Open all

Query personalizzate

Amazon Textract ti offre la possibilità di personalizzare la funzionalità Query preaddestrata e migliorare la precisione di estrazione su tipi di documenti specifici della tua azienda, mantenendo al contempo il controllo e la proprietà dei tuoi dati. Tramite la console AWS puoi caricare solo dieci documenti di esempio, annotare i dati e personalizzare la funzionalità Query preaddestrata in poche ore.

Ulteriori informazioni

Layout

Amazon Textract ti offre la possibilità di estrarre elementi di layout come paragrafi, titoli, elenchi, intestazioni, piè di pagina e altro dai documenti. Layout è un tipo di funzionalità nell'API Analyze Document. I clienti possono utilizzare Layout come funzionalità autonoma o in combinazione con altri tipi di funzionalità di analisi del documento.

Ulteriori informazioni

Riconoscimento ottico dei caratteri

L’OCR di Amazon Textract rileva automaticamente il testo stampato e scritto a mano da documenti e immagini. L'OCR basato su ML di Textract è in grado di riconoscere il testo in vari caratteri e stili e può anche gestire testo rumoroso o distorto.

Ulteriori informazioni

Estrazione da moduli

È possibile individuare automaticamente coppie chiave-valore nelle immagini dei documenti e mantenere il contesto senza alcun intervento manuale. Una coppia chiave-valore è un set di elementi di dati collegati. Ad esempio, in un documento, il campo "First Name" (Nome) è la chiave e "Jane" il valore. Ciò permette di importare facilmente i dati estratti in un database o di utilizzarli come variabile in un'applicazione. Con le soluzioni OCR tradizionali, chiavi e valori vengono estratti come testo semplice e la loro relazione si perde a meno di non scrivere e mantenere regole a codifica fissa per ogni modulo.

Ulteriori informazioni

Rilevamento di firme

Amazon Textract consente di rilevare le firme su qualsiasi documento o immagine. In questo modo è facile rilevare automaticamente le firme su documenti come assegni, moduli di richiesta di prestito e moduli di richiesta di risarcimento. La posizione delle firme e i punteggi di affidabilità associati sono inclusi nella risposta API.

Ulteriori informazioni

Estrazione dalle tabelle

Amazon Textract preserva la composizione dei dati archiviati nelle tabelle durante l'estrazione. Ciò è utile per i documenti costituiti per la maggior parte da dati strutturati, come report finanziari o referti medici con tabelle in colonne e righe. È possibile caricare automaticamente i dati estratti su un database attraverso uno schema predefinito. Ad esempio, le righe di elementi numerici e quantità di un inventario manterranno la loro associazione, in modo che un'applicazione per la gestione degli inventari possa incrementare gli elementi totali in modo semplice.

Ulteriori informazioni

Analyze Lending

L'API Analyze Lending è un'API di elaborazione intelligente dei documenti gestita e preconfigurata che automatizza completamente l'estrazione di informazioni dai pacchetti di prestito. I clienti possono semplicemente caricare i documenti del proprio mutuo nell'API Analyze Lending e i modelli di machine learning integrati classificheranno e suddivideranno il pacchetto di documenti in base al tipo di documento.

Ulteriori informazioni

Estrazione basata su query

Amazon Textract ti fornisce la flessibilità di specificare i dati che devi estrarre dai documenti utilizzando query. È possibile specificare le informazioni necessarie sotto forma di domande in linguaggio naturale (ad esempio, "Come si chiama il cliente?") e ricevere l'informazione esatta (ad esempio, "John Doe") come parte della risposta dell'API. Non è necessario conoscere la struttura dei dati nel documento (tabella, modulo, campo implicato, dati annidati) o preoccuparsi delle variazioni tra versioni e formati dei documenti. Le query di Textract sono pre-addestrate su un'ampia varietà di documenti, tra cui buste paga, estratti conto, moduli W-2, moduli di richiesta di prestito, note ipotecarie, richieste di risarcimento e tessere sanitarie. La flessibilità fornita dalle query di Textract riduce la necessità di post-elaborazione, affidamento alle revisioni manuali dei dati estratti o addestramento di modelli di ML.

Ulteriori informazioni

Fatture e ricevute

Fatture e ricevute possono avere un'ampia gamma di layout, pertanto l'estrazione di dati manuale su larga scala è un processo lungo e difficile. Amazon Textract sfrutta il machine learning (ML) per capire il contesto di fatture e ricevute ed estrae automaticamente dati rilevanti, ad esempio nome del fornitore, numero della fattura, prezzi delle voci, importo totale e termini di pagamento.

Ulteriori informazioni

Documenti d'identità

Amazon Textract sfrutta il machine learning (ML) per capire il contesto di documenti d'identità come passaporti e patenti di guida statunitensi senza la necessità di modelli o configurazione. È possibile estrarre automaticamente informazioni specifiche come data di scadenza e data di nascita oppure identificare ed estrarre in modo intelligente le informazioni implicite come il nome e l'indirizzo. Utilizzando Analyze ID, le aziende che forniscono servizi di verifica dei documenti d'identità e quelle che operano nei settori finanziario, sanitario e assicurativo possono facilmente automatizzare la creazione di account, la pianificazione di appuntamenti, le domande di lavoro e altro, permettendo ai clienti di inviare un'immagine o una scansione del proprio documento d'identità.

Ulteriori informazioni

Prezzi di Amazon Textract

Amazon Textract è un servizio di machine learning (ML) che estrae automaticamente testo, scrittura a mano e dati da documenti scansionati. Si spinge oltre il semplice riconoscimento ottico dei caratteri (OCR) per identificare, capire ed estrarre dati da moduli e tabelle. Con Amazon Textract paghi solo in base all'uso effettivo. Non sono previste tariffe minime né impegni anticipati. Amazon Textract addebita solo le pagine elaborate, a prescindere che tu estragga testo, testo con tabelle, dati di moduli, query o che elabori fatture e documenti di identità. Consulta le domande frequenti per ulteriori dettagli sulle pagine e sull'uso accettabile di Textract.

Fasi successive

Free Tier

Registrati per creare un account gratuito

Registrati

Console

Inizia subito nella console

Registrati

Funzionalità di Amazon Textract

Perché scegliere Amazon Textract?

Page topics

Caratteristiche generali

Query personalizzate

Layout

Riconoscimento ottico dei caratteri

Estrazione da moduli

Rilevamento di firme

Estrazione dalle tabelle

Analyze Lending

Estrazione basata su query

Fatture e ricevute

Documenti d'identità

Prezzi di Amazon Textract

Fasi successive

Registrati per creare un account gratuito

Inizia subito nella console

Fine del supporto per Internet Explorer