Cos'è SageMaker Lakehouse?

Amazon SageMaker Lakehouse unifica tutti i dati nei data lake di Amazon Simple Storage Service (Amazon S3), incluse le tabelle S3, e nei data warehouse di Amazon Redshift, aiutandoti a creare potenti applicazioni di analisi e di IA/ML su una singola copia dei dati. SageMaker Lakehouse ti offre la flessibilità di accedere ai dati e sottoporli a query sul posto con tutti gli strumenti e i motori compatibili con Apache Iceberg. Proteggi i tuoi dati nel lakehouse definendo autorizzazioni granulari che vengono applicate a tutti gli strumenti e i motori di analisi e machine learning (ML). Porta i dati dai database e dalle applicazioni operative nel lakehouse in tempo quasi reale tramite integrazioni Zero-ETL. Inoltre, accedi ai dati ed esegui query sul posto con funzionalità di query federate su origini dati di terze parti.

Guardalo in azione

Scopri come puoi accedere ai dati unificati dai data lake S3, dalle Tabelle S3 e dai data warehouse Redshift in SageMaker Lakehouse.

miniatura di sagemaker lakehouse

Vantaggi

Unifica tutti i tuoi dati sui data lake di Amazon S3, incluse le Tabelle S3, e sui data warehouse di Amazon Redshift con SageMaker Lakehouse. Porta i tuoi dati dai database e dalle applicazioni operative al lakehouse in tempo quasi reale tramite integrazioni Zero-ETL. Puoi utilizzare centinaia di connettori per integrare i dati provenienti da varie origini. Inoltre, puoi accedere ai dati ed eseguire query sul posto con funzionalità di query federate su origini dati di terze parti.
Usa i tuoi strumenti e motori preferiti compatibili con lo standard aperto Apache Iceberg. Ottieni la flessibilità di accedere ai dati e sottoporli a query sul posto con tutti gli strumenti compatibili con Apache Iceberg su una singola copia di dati. Compatibile con le specifiche del catalogo REST di Iceberg, SageMaker Lakehouse ti consente di utilizzare gli strumenti e i motori di analisi che preferisci, come SQL, Apache Spark, strumenti di business intelligence (BI) e IA/ML, e di collaborare con i dati archiviati su data lake Amazon S3 e data warehouse Amazon Redshift. SageMaker Lakehouse funziona con l'architettura dei dati esistente, che consente di usare i formati di archiviazione e i motori di query preferiti, compatibili con Apache Iceberg.
Proteggi i tuoi dati con controlli di accesso integrati e granulari applicati a tutti i tuoi dati in tutti gli strumenti e i motori di analisi. Definisci le autorizzazioni una sola volta e condividi con sicurezza i dati in tutta l'organizzazione.

Casi d'uso

Unifica tutti i tuoi dati nei data lake di Amazon S3 e nei data warehouse di Amazon Redshift per le tue iniziative di analisi e intelligenza artificiale con un'unica copia di dati. Con i controlli di accesso integrati, SageMaker Lakehouse consente di definire autorizzazioni granulari e condividere in modo sicuro una singola copia dei dati in tutta l'organizzazione.
Accedi ai dati quasi in tempo reale su database e applicazioni operative in SageMaker Lakehouse tramite integrazioni Zero-ETL. Accedi ed esegui query sui tuoi dati sul posto, da un'ampia gamma di servizi AWS e strumenti e motori open source e di terze parti, che supportano Apache Iceberg.
Porta i dati esistenti da più data warehouse di Amazon Redshift in SageMaker Lakehouse per sottoporre a query e unire i dati archiviati nei cluster e nei gruppi di lavoro di Amazon Redshift. Scala i tuoi carichi di lavoro per i processi di estrazione, trasformazione e caricamento (ETL), i report di BI e l'analisi in base alle necessità senza gestire più condivisioni di dati.

Clienti

Lennar

“Negli ultimi 18 mesi abbiamo lavorato con AWS per trasformare la nostra base di dati e poter utilizzare le soluzioni migliori e anche più convenienti. Grazie a innovazioni come Amazon SageMaker Unified Studio e Amazon SageMaker Lakehouse, prevediamo di accelerare la velocità di distribuzione attraverso un accesso senza interruzioni a dati e servizi, che consentirà ai nostri ingegneri, analisti e scienziati di ricavare informazioni che forniscono valore materiale al nostro business.”

Lee Slezak, SVP of Data and Analytic presso Lennar

Roche

Roche è un pioniere a livello mondiale in campo diagnostico e farmaceutico impegnato a far progredire la scienza per migliorare la vita delle persone.

“Abbiamo utilizzato Amazon Redshift per ottenere informazioni dettagliate da dati strutturati e semi-strutturati in tutti i nostri repository di dati. Il nuovo Amazon SageMaker Lakehouse è uno strumento che mi entusiasma, perché potrebbe migliorare e unificare l'accesso al data lake e ad altre origini dati con servizi come Amazon Redshift, Catalogo dati AWS Glue e AWS Lake Formation. Questa innovazione consentirà ai nostri team di progettazione e gestione dei dati di semplificare l'accesso ai dati, promuovendo l'interoperabilità tra carichi di lavoro di dati, analisi e applicazioni. Prevedo una notevole riduzione degli errori nei dati grazie a una minore copia dei dati, una riduzione del 40% dei tempi di elaborazione, una più rapida riscrittura dei dati di analisi nei sistemi transazionali per migliorare il processo decisionale e maggiore possibilità per i nostri team di concentrarsi sulla creazione di valore aziendale”.

Yannick Misteli, Responsabile dell'ingegneria, dipartimento della strategia globale di prodotto presso Roche

Roche

Idealista

Idealista supporta agenti immobiliari e privati in tutta l'Europa meridionale fornendo una piattaforma di annunci immobiliari online.

“Il nostro obiettivo è semplificare l'accesso ai dati di Salesforce per un'analisi avanzata nel nostro data lake. Sfruttando la nuova funzionalità di supporto di Amazon SageMaker Lakehouse per le integrazioni Zero-ETL dalle applicazioni, riusciamo a semplificare i nostri processi di estrazione e importazione dei dati, eliminando la necessità di più ETL per accedere direttamente a Salesforce. Questo approccio centralizzato riduce la complessità e migliora significativamente la nostra efficienza nella gestione dei dati. Prevediamo un notevole risparmio di tempo nello sviluppo dell'estrazione e dell'importazione dei dati, che consentirà al nostro team di concentrarsi sull'estrazione di informazioni utili dai nostri dati piuttosto che sulla gestione della loro raccolta.”

Javier Monterrubio, Data Platform Engineer Manager presso Idealista

Idealista

Carrier

“In Carrier, la nuova generazione di Amazon SageMaker sta rivoluzionando la nostra strategia di gestione dei dati aziendali, ottimizzando il modo in cui creiamo e scaliamo i prodotti relativi ai dati. L'approccio di SageMaker Unified Studio alla scoperta, all'elaborazione e allo sviluppo di modelli dei dati ha notevolmente accelerato la nostra implementazione su lakehouse. La caratteristica più notevole è che l'integrazione ottimizzata con il nostro catalogo di dati esistente e i controlli di governance integrati ci permettono di democratizzare l'accesso ai dati pur mantenendo elevati standard di sicurezza. Questo supporta i nostri team nell'offrire rapidamente analisi avanzate e soluzioni di IA in tutta l'organizzazione.”

Carrier

Partner

Tableau

Tableau aiuta le persone e le organizzazioni a basarsi maggiormente sui dati.

“La partnership tra Amazon e Salesforce Tableau rappresenta un impegno condiviso per l'innovazione e il successo dei clienti. Attraverso la nuova integrazione Zero-ETL di Amazon, stiamo combinando dati e analisi basati sull'intelligenza artificiale di Tableau con la potente infrastruttura di dati di Amazon per trasformare il modo in cui le organizzazioni ottengono informazioni dai propri dati. Questa perfetta integrazione consente ai nostri clienti di ottenere informazioni dettagliate da tutti i loro dati strutturati e non strutturati utilizzando la potenza di Amazon SageMaker Lakehouse e Amazon Redshift, riducendo drasticamente la complessità ingegneristica e i tempi di implementazione. Insieme, Tableau e Amazon stanno aiutando i clienti ad accelerare la trasformazione digitale e a generare valore aziendale su larga scala.”

Ali Tore, Senior VP, Advanced Analytics, Tableau

Tableau

dbt Labs

La missione di dbt Labs è aiutare gli analisti a creare e diffondere conoscenze organizzative.

“Siamo da tempo lo standard di trasformazione in cima ad Amazon Redshift, offrendo flessibilità, collaborazione e fiducia. Con il nuovo Amazon SageMaker Lakehouse, siamo entusiasti di estendere questo valore a più clienti e ancora più dati nell'ambiente AWS. Ora, i clienti possono accedere a tutti i loro dati attraverso il sistema AWS, inclusi data warehouse e data lake. Siamo felici di unire le nostre funzionalità con il nuovo Amazon SageMaker per fornire governance, catalogazione e ottimizzazioni dei dati per i nostri clienti comuni.”

Shawn Toldo, VP Partnerships, dbt Labs

dbt Labs

Informatica

Informatica, leader nella gestione dei dati in cloud basata sull'IA per le aziende, dà vita ai dati e all'intelligenza artificiale consentendo alle aziende di sfruttare il potere di trasformazione delle loro risorse più importanti.

“La nostra piattaforma Intelligent Data Management Cloud (IDMC) e Amazon SageMaker aiutano le organizzazioni a sfruttare il potenziale dei dati e a promuovere l'innovazione e l'efficienza. In qualità di partner di lancio di Amazon SageMaker Lakehouse, siamo orgogliosi di offrire una soluzione di livello aziendale che soddisfa gli elevati standard delle moderne organizzazioni basate sui dati. Insieme all'infrastruttura di AWS, consentiamo decisioni più rapide e informate per risultati di impatto in tutti i settori.”

Pratik Parekh, SVP Product Management, Informatica

Informatica