Amazon-Textract-Features

Warum Amazon Textract?

Amazon Textract ist ein Machine-Learning-Service (ML), der automatisch Text, Handschrift, Layoutelemente und Daten aus gescannten Dokumenten extrahiert. Dies geht über die einfache optische Zeichenerkennung (OCR) hinaus, um Daten aus Formularen und Tabellen zu identifizieren, zu verstehen und zu extrahieren. Alle extrahierten Daten werden mit Begrenzungsrahmen-Koordinaten zurückgegeben. Hierbei handelt es sich um Polygonrahmen, welche die einzelnen identifizierten Daten umfassen, wie z. B. ein Wort, eine Zeile, eine Tabelle oder einzelne Zellen innerhalb einer Tabelle. Amazon Textract gibt auch für alle erkannten Objekte einen Konfidenzwert aus, auf dessen Grundlage Sie fundierte Entscheidungen zur Verwendung der Ergebnisse treffen können.

Weitere Informationen

Page topics

Allgemeine Funktionen

Allgemeine Funktionen

Open all

Benutzerdefinierte Abfragen

Amazon Textract bietet Ihnen die Möglichkeit, die Funktion für vortrainierte Abfragen anzupassen und die Extraktionsgenauigkeit für Ihre unternehmensspezifischen Dokumenttypen zu verbessern, während Sie die Kontrolle und das Eigentum an Ihren Daten behalten. Über die AWS-Konsole können Sie innerhalb weniger Stunden bis zu zehn Beispieldokumente hochladen, die Daten mit Anmerkungen versehen und die Funktion für vortrainierte Abfragen anpassen.

Weitere Informationen

Layout

Amazon Textract bietet Ihnen die Möglichkeit, Layoutelemente wie Absätze, Titel, Listen, Kopf- und Fußzeilen und mehr aus Dokumenten zu extrahieren. Layout ist ein neuer Feature-Typ in der Analyze-Document-API. Kunden können Layout als eigenständiges Feature oder in Kombination mit anderen Feature-Typen zum Analysieren von Dokumenten verwenden.

Weitere Informationen

Optische Zeichenerkennung

Amazon Textract OCR erkennt automatisch gedruckten und handgeschriebenen Text aus Dokumenten und Bildern. Die ML-gestützte OCR von Textract kann Text in verschiedenen Schriftarten und Stilen erkennen und auch verrauschten oder verzerrten Text verarbeiten.

Weitere Informationen

Formularextraktion

Sie können Schlüssel-Wert-Paare in Dokumentenbildern automatisch erkennen und den Kontext ohne manuellen Eingriff beibehalten. Ein Schlüssel-Wert-Paar ist ein Satz von verknüpften Datenelementen. In einem Dokument ist zum Beispiel das Feld „Vorname“ der Schlüssel und „Jane“ ist der Wert. So lassen sich die extrahierten Daten leicht in eine Datenbank importieren oder als Variable in einer Anwendung bereitstellen. Bei herkömmlichen OCR-Lösungen werden Schlüssel und Werte als einfacher Text extrahiert und ihre Beziehung zueinander geht verloren, sofern nicht für jedes Formular hartkodierte Regeln erstellt und verwaltet werden.

Weitere Informationen

Unterschriftenerkennung

Amazon Textract erkennt Unterschriften auf jedem Dokument oder Bild. Dadurch werden Unterschriften auf Dokumenten wie Schecks, Kreditanträgen und Antragsformularen ganz einfach automatisch erkannt. Die API-Antwort umfasst die Position der Unterschriften und die zugehörigen Zuverlässigkeitswerte.

Weitere Informationen

Tabellenextraktion

Amazon Textract behält die Zusammensetzung der in den Tabellen gespeicherten Daten während der Extraktion bei. Dies ist hilfreich für Dokumente, die größtenteils aus strukturierten Daten bestehen, z. B. Finanzberichte oder medizinische Unterlagen mit Tabellen in Spalten und Zeilen. Sie können die extrahierten Daten automatisch in eine Datenbank mit einem vordefinierten Schema laden. Beispielsweise wird bei Zeilen mit Artikelnummern und Mengen in einem Bestandsbericht die Zuordnung beibehalten, so dass eine Anwendung für die Bestandsverwaltung die Artikelsummen leicht erhöhen kann.

Weitere Informationen

Analyze Lending (Kreditvergabe analysieren)

Analyze Lending API ist eine verwaltete, vorkonfigurierte API für die intelligente Dokumentenverarbeitung, mit der die Extraktion von Informationen aus Kreditpaketen vollständig automatisiert wird. Kunden laden einfach ihre Darlehensunterlagen in die API von Analyze Lending hoch und die vorgefertigten Machine-Learning-Modelle klassifizieren und teilen das Dokumentenpaket nach Dokumententyp auf.

Weitere Informationen

Abfragebasierte Extraktion

Amazon Textract bietet Ihnen die Flexibilität, die aus Dokumenten zu extrahierenden Daten mithilfe von Abfragen anzugeben. Sie können die benötigten Informationen in Form von Fragen in natürlicher Sprache angeben (z. B. „Wie lautet der Name des Kunden“) und erhalten die genauen Informationen (z. B. „John Doe“) als Teil der API-Antwort. Sie brauchen die Datenstruktur im Dokument (Tabelle, Formular, implizites Feld, verschachtelte Daten) nicht zu kennen und müssen sich keine Gedanken über Abweichungen zwischen verschiedenen Dokumentversionen und -formaten machen. Textract Queries sind auf eine Vielzahl von Dokumenten trainiert, darunter Gehaltsabrechnungen, Kontoauszüge, W-2-Steuerformulare, Kreditanträge, Hypothekenbriefe, Schadensunterlagen und Versicherungskarten. Dank der Flexibilität von Textract Queries reduziert sich der Bedarf nach Implementierung einer Nachbearbeitung, die Abhängigkeit von manuellen Überprüfungen der extrahierten Daten oder die Notwendigkeit, ML-Modelle zu trainieren.

Weitere Informationen

Rechnungen und Belege

Rechnungen und Belege können eine große Vielfalt an Layouts aufweisen, was die manuelle Extraktion von Daten in großem Umfang schwierig und zeitaufwändig macht. Amazon Textract nutzt Machine Learning (ML), um den Kontext von Rechnungen und Belegen zu verstehen und extrahiert automatisch relevante Daten wie den Namen des Lieferanten, die Rechnungsnummer, die Artikelpreise, den Gesamtbetrag und die Zahlungsbedingungen.

Weitere Informationen

Ausweisdokumente

Amazon Textract nutzt Machine Learning (ML), um den Kontext von Identitätsdokumenten wie US-Pässen und Führerscheinen zu verstehen, ohne dass Vorlagen oder Konfigurationen erforderlich sind. Sie können automatisch spezifische Informationen wie das Ablaufdatum, das Geburtsdatum extrahieren und darin enthaltene Informationen wie Name und Adresse identifizieren lassen. Mit Analyze ID können Unternehmen, die Dienstleistungen zur Identitätsüberprüfung anbieten, sowie Unternehmen aus dem Finanz-, Gesundheits- und Versicherungswesen auf einfache Weise die Erstellung von Konten, Terminvereinbarungen, Bewerbungen und vieles mehr automatisieren, indem sie ihren Kunden die Möglichkeit geben, ein Bild oder einen Scan ihres Ausweises einzureichen.

Weitere Informationen

Preise zu Amazon Textract

Amazon Textract ist ein Machine Learning (ML)-Service, der automatisch Text, Handschrift und Daten aus gescannten Dokumenten extrahiert. Es geht über eine einfache optische Zeichenerkennung (OCR) hinaus, um Daten aus Formularen und Tabellen zu identifizieren, zu verstehen und zu extrahieren. Mit Amazon Textract zahlen Sie nur für das, was Sie tatsächlich nutzen. Es fallen weder Mindestgebühren noch Vorausleistungen an. Amazon Textract berechnet nur die verarbeiteten Seiten, unabhängig davon, ob Sie Text, Text mit Tabellen, Formulardaten, Abfragen oder Rechnungen und Ausweisdokumente verarbeiten. Lesen Sie die Häufig gestellten Fragen für weitere Informationen über die Seiten und die akzeptable Nutzung von Textract.

Nächste Schritte

Free Tier

Für ein kostenloses Konto registrieren

Registrieren

Console

Beginnen Sie mit der Entwicklung in der Konsole

Registrieren

Amazon-Textract-Features

Warum Amazon Textract?

Page topics

Allgemeine Funktionen

Benutzerdefinierte Abfragen

Layout

Optische Zeichenerkennung

Formularextraktion

Unterschriftenerkennung

Tabellenextraktion

Analyze Lending (Kreditvergabe analysieren)

Abfragebasierte Extraktion

Rechnungen und Belege

Ausweisdokumente

Preise zu Amazon Textract

Nächste Schritte

Für ein kostenloses Konto registrieren

Beginnen Sie mit der Entwicklung in der Konsole

Ende des Supports für Internet Explorer