Apa itu SageMaker Lakehouse?

Amazon SageMaker Lakehouse menyatukan semua data Anda di seluruh danau data Amazon Simple Storage Service (Amazon S3), termasuk Tabel S3, dan gudang data Amazon Redshift, yang membantu Anda membangun analitik dan aplikasi AI/ML yang canggih pada satu salinan data. SageMaker Lakehouse memberi Anda fleksibilitas untuk mengakses serta mengkueri data Anda di tempat dengan semua alat dan mesin yang kompatibel dengan Apache Iceberg. Amankan data Anda di lakehouse dengan menentukan izin mendetail yang diberlakukan di semua alat dan mesin analitik dan machine learning (ML). Bawa data dari basis data operasional dan aplikasi ke lakehouse hampir secara waktu nyata melalui integrasi nol-ETL. Selain itu, akses dan kueri data di tempat dengan kemampuan kueri gabungan di seluruh sumber data pihak ketiga.

Lihat fungsinya

Lihat bagaimana Anda dapat mengakses data terpadu dari danau data S3, Tabel S3, dan gudang data Redshift di SageMaker Lakehouse.

thumbnail sagemaker lakehouse

Manfaat

Satukan semua data Anda di danau data Amazon S3, termasuk Tabel S3, dan gudang data Amazon Redshift dengan SageMaker Lakehouse. Pindahkan data Anda dari aplikasi dan basis data operasional ke lakehouse hampir secara waktu nyata melalui integrasi nol-ETL. Anda dapat menggunakan ratusan konektor untuk mengintegrasikan data dari berbagai sumber. Selain itu, Anda dapat mengakses dan melakukan kueri data di tempat dengan kemampuan kueri gabungan di seluruh sumber data pihak ketiga.
Gunakan alat dan mesin pilihan Anda, yang kompatibel dengan standar terbuka Apache Iceberg. Dapatkan fleksibilitas untuk mengakses dan mengkueri data di tempat dengan semua alat yang kompatibel dengan Apache Iceberg pada satu salinan data. Kompatibel dengan spesifikasi katalog REST Iceberg, SageMaker Lakehouse memungkinkan Anda menggunakan alat dan mesin analitik pilihan Anda, seperti SQL, Apache Spark, inteligensi bisnis (BI), dan alat AI/ML, serta berkolaborasi dengan data yang disimpan di danau data Amazon S3 dan gudang data Amazon Redshift. SageMaker Lakehouse berfungsi dengan arsitektur data Anda yang ada, dengan memungkinkan Anda menggunakan format penyimpanan dan mesin kueri pilihan Anda yang kompatibel dengan Apache Iceberg.
Lindungi data Anda dengan kontrol akses terintegrasi dan mendetail yang diberlakukan di semua data di semua alat dan mesin analitik. Tentukan izin sekali dan bagikan data dengan percaya diri di seluruh organisasi.

Kasus penggunaan

Satukan semua data Anda di danau data Amazon S3 dan gudang data Amazon Redshift untuk analitik dan inisiatif AI dengan satu salinan data. Dengan kontrol akses terintegrasi, SageMaker Lakehouse memungkinkan Anda untuk menentukan izin yang mendetail dan membagikan satu salinan data secara aman ke seluruh organisasi.
Akses data secara hampir waktu nyata di seluruh basis data operasional dan aplikasi di SageMaker Lakehouse melalui integrasi nol-ETL. Akses dan kueri data Anda secara langsung, dari berbagai layanan AWS serta alat dan mesin sumber terbuka dan pihak ketiga yang mendukung Apache Iceberg.
Pindahkan data yang ada dari beberapa gudang data Amazon Redshift ke SageMaker Lakehouse untuk mengkueri serta menggabungkan data yang disimpan di klaster dan kelompok kerja Amazon Redshift. Skalakan beban kerja Anda untuk proses extract, transform, and load (ETL), pelaporan BI, dan analisis sesuai kebutuhan tanpa mengelola beberapa pembagian data.

Pelanggan

Lennar

"Kami telah menghabiskan 18 bulan terakhir bekerja sama dengan AWS untuk mengubah fondasi data kami guna menggunakan solusi terbaik di kelasnya yang juga hemat biaya. Dengan kemajuan seperti Studio Terpadu Amazon SageMaker dan Amazon SageMaker Lakehouse, kami mempercepat laju pengiriman kami melalui akses tanpa hambatan ke data dan layanan, sehingga memungkinkan para teknisi, analis, dan ilmuwan kami untuk memunculkan wawasan yang memberikan nilai penting bagi bisnis kami.”

Lee Slezak, SVP of Data and Analytic, Lennar

Roche

Roche adalah pelopor global di bidang farmasi dan diagnostik yang berfokus pada kemajuan ilmu pengetahuan untuk meningkatkan kehidupan manusia.

“Kami telah menggunakan Amazon Redshift untuk mendapatkan wawasan dari data terstruktur dan semiterstruktur di seluruh repositori data kami. Amazon SageMaker Lakehouse baru membuat saya bersemangat dengan potensinya untuk meningkatkan dan menyatukan akses ke danau data atau sumber data lainnya dengan layanan seperti Amazon Redshift, Katalog Data AWS Glue, dan AWS Lake Formation. Inovasi ini akan memungkinkan tim data dan teknis kami untuk menyederhanakan akses data, yang mempromosikan interoperabilitas di seluruh data, analitik, dan beban kerja aplikasi. Saya memperkirakan pengurangan kesalahan data yang signifikan melalui penyalinan data yang lebih sedikit, pengurangan waktu pemrosesan sebanyak 40%, penulisan kembali data analitik yang lebih cepat ke sistem transaksional untuk pengambilan keputusan yang lebih baik, dan pemberdayaan tim kami untuk fokus menciptakan nilai bisnis."

Yannick Misteli, Head of Engineering, Global Product Strategy, Roche

Roche

Idealista

Idealista mendukung agen real estate dan perorangan di seluruh Eropa Selatan dengan menyediakan platform iklan baris real estate daring.

“Tujuan kami adalah menyederhanakan akses ke data Salesforce untuk peningkatan analitik di danau data kami. Dengan memanfaatkan dukungan Amazon SageMaker Lakehouse baru untuk integrasi nol-ETL dari fitur aplikasi, kami dapat menyederhanakan proses ekstraksi dan penyerapan data, sehingga menghilangkan kebutuhan akan banyak ETL untuk mengakses Salesforce secara langsung. Pendekatan terpusat ini mengurangi kompleksitas dan secara signifikan meningkatkan efisiensi manajemen data kami. Hasilnya, kami memperkirakan tercapainya penghematan waktu yang signifikan dalam ekstraksi data dan pengembangan penyerapan, yang memungkinkan tim kami untuk fokus pada perolehan wawasan yang dapat ditindaklanjuti dari data, bukan sekadar pengelolaan pengumpulan data saja."

Javier Monterrubio, Data Platform Engineer Manager, Idealista

Idealista

Carrier

"Di Carrier, Amazon SageMaker generasi terbaru mengubah strategi data perusahaan kami dengan menyederhanakan cara kami membangun dan menskalakan produk data. Pendekatan Studio Terpadu SageMaker untuk penemuan, pemrosesan, dan pengembangan model data telah secara signifikan mempercepat implementasi lakehouse kami. Yang paling mengesankan, integrasinya yang mulus dengan katalog data kami yang sudah ada serta kontrol tata kelola bawaannya memungkinkan kami untuk mendemokratisasi akses data sambil mempertahankan standar keamanan, sehingga tim kami bisa dengan cepat memberikan analisis canggih dan solusi AI untuk seluruh bagian di perusahaan."

Carrier

Partner

Tableau

Tableau membantu orang dan organisasi menjadi lebih berbasis data.

“Kemitraan antara Amazon dan Salesforce Tableau merupakan komitmen bersama terhadap inovasi dan kesuksesan pelanggan. Melalui integrasi nol-ETL baru Amazon, kami menggabungkan data dan analitik bertenaga AI Tableau dengan infrastruktur data Amazon yang canggih untuk mengubah cara organisasi memperoleh wawasan dari data mereka. Integrasi yang mulus ini memungkinkan pelanggan kami memperoleh wawasan dari semua data terstruktur maupun tak terstruktur mereka menggunakan kekuatan Amazon SageMaker Lakehouse dan Amazon Redshift, yang secara drastis mengurangi kerumitan rekayasa dan waktu deployment. Bersama-sama, Tableau dan Amazon membantu pelanggan mempercepat transformasi digital dan meningkatkan nilai bisnis dalam skala besar.”

Ali Tore, Senior VP, Advanced Analytics, Tableau

Tableau

dbt Labs

dbt Labs memiliki misi untuk membantu analis menciptakan dan menyebarluaskan pengetahuan organisasi.

"Kami telah lama menjadi standar transformasi setelah Amazon Redshift, dengan menawarkan fleksibilitas, kolaborasi, dan kepercayaan. Dengan Amazon SageMaker Lakehouse yang baru, kami gembira dapat memperluas nilai ini ke lebih banyak pelanggan dan lebih banyak data di lingkungan AWS. Sekarang, pelanggan dapat mengakses semua data mereka di seluruh sistem AWS, termasuk gudang data dan danau data. Kami senang dapat menggabungkan kemampuan kami dengan Amazon SageMaker baru untuk menyediakan tata kelola, pembuatan katalog, dan pengoptimalan data bagi pelanggan bersama kami.”

Shawn Toldo, VP Partnerships, dbt Labs

dbt Labs

Informatica

Informatica, pemimpin dalam manajemen data cloud bertenaga AI korporasi, menghidupkan data dan AI dengan memberdayakan bisnis untuk mewujudkan kekuatan transformatif dari aset mereka yang paling penting.

“Platform Intelligent Data Management Cloud (IDMC) dan Amazon SageMaker kami membantu berbagai organisasi menggali potensi data sekaligus mendorong inovasi dan efisiensi. Sebagai partner peluncuran Amazon SageMaker Lakehouse, kami bangga dapat menghadirkan solusi tingkat perusahaan yang memenuhi standar tinggi organisasi modern berbasis data. Bersama infrastruktur AWS, kami bisa membuat keputusan yang lebih cepat dan tepat untuk hasil yang berdampak di seluruh industri.”

Pratik Parekh, SVP Product Management, Informatica

Informatica