Funzionalità di Amazon Textract

Perché scegliere Amazon Textract?

Amazon Textract è un servizio di machine learning (ML) che estrae automaticamente testo, scrittura a mano, elementi di layout e dati da documenti scansionati. Si spinge oltre il semplice riconoscimento ottico dei caratteri (OCR) per identificare, capire ed estrarre dati da moduli e tabelle. Tutti i dati estratti vengono restituiti con coordinate di riquadri di delimitazione, cioè cornici poligonali che racchiudono ciascun dato identificato, ad esempio una parola, una riga, una tabella o singole celle all'interno di una tabella. Amazon Textract restituisce anche un punteggio di affidabilità per tutti gli oggetti che è in grado di identificare, consentendo di prendere decisioni informate su come utilizzare i risultati.

Ulteriori informazioni

Caratteristiche generali

Amazon Textract ti offre la possibilità di personalizzare la funzionalità Query preaddestrata e migliorare la precisione di estrazione su tipi di documenti specifici della tua azienda, mantenendo al contempo il controllo e la proprietà dei tuoi dati. Tramite la console AWS puoi caricare solo dieci documenti di esempio, annotare i dati e personalizzare la funzionalità Query preaddestrata in poche ore.

Ulteriori informazioni

Amazon Textract ti offre la possibilità di estrarre elementi di layout come paragrafi, titoli, elenchi, intestazioni, piè di pagina e altro dai documenti. Layout è un tipo di funzionalità nell'API Analyze Document. I clienti possono utilizzare Layout come funzionalità autonoma o in combinazione con altri tipi di funzionalità di analisi del documento.

Ulteriori informazioni

L’OCR di Amazon Textract rileva automaticamente il testo stampato e scritto a mano da documenti e immagini. L'OCR basato su ML di Textract è in grado di riconoscere il testo in vari caratteri e stili e può anche gestire testo rumoroso o distorto.

Ulteriori informazioni

È possibile individuare automaticamente coppie chiave-valore nelle immagini dei documenti e mantenere il contesto senza alcun intervento manuale. Una coppia chiave-valore è un set di elementi di dati collegati. Ad esempio, in un documento, il campo "First Name" (Nome) è la chiave e "Jane" il valore. Ciò permette di importare facilmente i dati estratti in un database o di utilizzarli come variabile in un'applicazione. Con le soluzioni OCR tradizionali, chiavi e valori vengono estratti come testo semplice e la loro relazione si perde a meno di non scrivere e mantenere regole a codifica fissa per ogni modulo.

Ulteriori informazioni

Amazon Textract consente di rilevare le firme su qualsiasi documento o immagine. In questo modo è facile rilevare automaticamente le firme su documenti come assegni, moduli di richiesta di prestito e moduli di richiesta di risarcimento. La posizione delle firme e i punteggi di affidabilità associati sono inclusi nella risposta API.

Ulteriori informazioni

Amazon Textract preserva la composizione dei dati archiviati nelle tabelle durante l'estrazione. Ciò è utile per i documenti costituiti per la maggior parte da dati strutturati, come report finanziari o referti medici con tabelle in colonne e righe. È possibile caricare automaticamente i dati estratti su un database attraverso uno schema predefinito. Ad esempio, le righe di elementi numerici e quantità di un inventario manterranno la loro associazione, in modo che un'applicazione per la gestione degli inventari possa incrementare gli elementi totali in modo semplice.

Ulteriori informazioni

L'API Analyze Lending è un'API di elaborazione intelligente dei documenti gestita e preconfigurata che automatizza completamente l'estrazione di informazioni dai pacchetti di prestito. I clienti possono semplicemente caricare i documenti del proprio mutuo nell'API Analyze Lending e i modelli di machine learning integrati classificheranno e suddivideranno il pacchetto di documenti in base al tipo di documento.

Ulteriori informazioni

Amazon Textract ti fornisce la flessibilità di specificare i dati che devi estrarre dai documenti utilizzando query. È possibile specificare le informazioni necessarie sotto forma di domande in linguaggio naturale (ad esempio, "Come si chiama il cliente?") e ricevere l'informazione esatta (ad esempio, "John Doe") come parte della risposta dell'API. Non è necessario conoscere la struttura dei dati nel documento (tabella, modulo, campo implicato, dati annidati) o preoccuparsi delle variazioni tra versioni e formati dei documenti. Le query di Textract sono pre-addestrate su un'ampia varietà di documenti, tra cui buste paga, estratti conto, moduli W-2, moduli di richiesta di prestito, note ipotecarie, richieste di risarcimento e tessere sanitarie. La flessibilità fornita dalle query di Textract riduce la necessità di post-elaborazione, affidamento alle revisioni manuali dei dati estratti o addestramento di modelli di ML.

Ulteriori informazioni

Fatture e ricevute possono avere un'ampia gamma di layout, pertanto l'estrazione di dati manuale su larga scala è un processo lungo e difficile. Amazon Textract sfrutta il machine learning (ML) per capire il contesto di fatture e ricevute ed estrae automaticamente dati rilevanti, ad esempio nome del fornitore, numero della fattura, prezzi delle voci, importo totale e termini di pagamento.

Ulteriori informazioni

Amazon Textract sfrutta il machine learning (ML) per capire il contesto di documenti d'identità come passaporti e patenti di guida statunitensi senza la necessità di modelli o configurazione. È possibile estrarre automaticamente informazioni specifiche come data di scadenza e data di nascita oppure identificare ed estrarre in modo intelligente le informazioni implicite come il nome e l'indirizzo. Utilizzando Analyze ID, le aziende che forniscono servizi di verifica dei documenti d'identità e quelle che operano nei settori finanziario, sanitario e assicurativo possono facilmente automatizzare la creazione di account, la pianificazione di appuntamenti, le domande di lavoro e altro, permettendo ai clienti di inviare un'immagine o una scansione del proprio documento d'identità.

Ulteriori informazioni

Amazon Textract è un servizio di machine learning (ML) che estrae automaticamente testo, scrittura a mano e dati da documenti scansionati. Si spinge oltre il semplice riconoscimento ottico dei caratteri (OCR) per identificare, capire ed estrarre dati da moduli e tabelle. Con Amazon Textract paghi solo in base all'uso effettivo. Non sono previste tariffe minime né impegni anticipati. Amazon Textract addebita solo le pagine elaborate, a prescindere che tu estragga testo, testo con tabelle, dati di moduli, query o che elabori fatture e documenti di identità. Consulta le domande frequenti per ulteriori dettagli sulle pagine e sull'uso accettabile di Textract.