Apa itu pemodelan data?
Pemodelan data adalah proses menciptakan representasi visual atau cetak biru yang menentukan pengumpulan informasi dan sistem manajemen berbagai organisasi. Cetak biru atau model data ini membantu berbagai pemangku kepentingan, seperti analis, ilmuwan, dan perekayasa data untuk menciptakan pandangan terpadu mengenai data organisasi. Model tersebut menguraikan data yang dikumpulkan oleh bisnis, hubungan antara berbagai set data, dan metode yang akan digunakan untuk menyimpan serta menganalisis data.
Mengapa pemodelan data penting?
Saat ini, organisasi mengumpulkan data dalam jumlah besar dari banyak sumber daya yang berbeda. Namun, data mentah saja tidak cukup. Anda perlu menganalisis data untuk mendapatkan wawasan yang dapat ditindaklanjuti, yang dapat memandu Anda untuk membuat keputusan bisnis yang menguntungkan. Analis data yang akurat membutuhkan pengumpulan, penyimpanan, dan pemrosesan data yang efisien. Ada beberapa teknologi basis data dan alat pemrosesan data, serta berbagai set data yang memerlukan berbagai alat untuk mendapatkan analisis yang efisien.
Pemodelan data memberi Anda kesempatan untuk memahami data serta memilih teknologi yang tepat untuk menyimpan dan mengelola data ini. Dengan cara yang sama seperti saat arsitek mendesain cetak biru sebelum membangun sebuah rumah, pemangku kepentingan bisnis mendesain model data sebelum mereka merekayasa solusi basis data untuk organisasi mereka.
Pemodelan data memberikan manfaat berikut:
- Mengurangi kesalahan dalam pengembangan perangkat lunak basis data
- Memfasilitasi kecepatan dan efisiensi desain serta pembuatan basis data
- Menciptakan konsistensi dalam dokumentasi data dan desain sistem di seluruh organisasi
- Memfasilitasi komunikasi antara perekayasa data dan tim kecerdasan bisnis
Apa saja jenis model data?
Pemodelan data biasanya dimulai dengan merepresentasikan data secara konseptual lalu merepresentasikannya kembali dalam konteks teknologi yang dipilih. Analis dan pemangku kepentingan membuat beberapa jenis model data yang berbeda selama tahap desain data. Berikut ini adalah tiga jenis model data utama:
Model data konseptual
Model data konseptual memberikan gambaran besar tentang data. Model data tersebut menjelaskan hal-hal berikut:
- Data dalam sistem
- Atribut data dan kondisi atau batasan pada data
- Aturan bisnis yang terkait dengan data
- Cara terbaik mengatur data
- Persyaratan keamanan dan integritas data
Pemangku kepentingan dan analis bisnis biasanya membuat model konseptual. Model konseptual merupakan representasi diagram sederhana yang tidak mengikuti aturan pemodelan data formal. Hal yang penting adalah model ini membantu pemangku kepentingan teknis dan nonteknis untuk mempunyai visi yang sama dan menyepakati tujuan, cakupan, serta desain proyek data mereka.
Contoh model data konseptual
Misalnya, model data konseptual untuk dealer mobil mungkin menunjukkan entitas data seperti ini:
- Entitas Showroom yang merepresentasikan informasi tentang berbagai toko yang dimiliki oleh dealer
- Entitas Mobil yang merepresentasikan beberapa mobil yang saat ini tersedia di dealer
- Entitas Pelanggan yang merepresentasikan semua pelanggan yang telah melakukan pembelian di dealer
- Entitas Penjual yang merepresentasikan informasi tentang penjualan sebenarnya
- Entitas Tenaga Penjualan yang merepresentasikan informasi tentang semua tenaga penjualan yang bekerja di dealer
Model konseptual ini juga akan mencakup persyaratan bisnis, seperti berikut:
- Setiap mobil harus dimiliki oleh showroom tertentu.
- Setiap penjualan harus memiliki setidaknya satu tenaga penjualan dan satu pelanggan yang terkait dengannya.
- Setiap mobil harus memiliki nama merek dan nomor produk.
- Setiap pelanggan harus memberikan nomor ponsel dan alamat email mereka.
Dengan demikian, model konseptual berperan sebagai jembatan antara aturan bisnis dan sistem manajemen basis data fisik yang mendasarinya (DBMS). Model data konseptual juga disebut sebagai model domain.
Model data logis
Model data logis memetakan kelas data konseptual ke dalam struktur data teknis. Model data logis memberikan lebih banyak detail tentang konsep data dan hubungan data kompleks yang diidentifikasi dalam model data konseptual, seperti berikut:
- Jenis data dari berbagai atribut (misalnya, string atau nomor)
- Hubungan antara entitas data
- Atribut utama atau bidang kunci dalam data
Arsitek data dan analis bekerja sama untuk membuat model logis. Mereka mengikuti salah satu sistem pemodelan data formal untuk membuat representasi. Tim yang tangkas kadang mungkin memilih untuk melewati langkah ini dan berpindah dari model konseptual ke model fisik secara langsung. Namun, model ini sangat berguna untuk mendesain basis data yang besar, yang disebut gudang data, dan untuk mendesain sistem pelaporan otomatis.
Contoh model data logis
Pada contoh dealer mobil, model data logis akan memperluas model konseptual dan lebih memperhatikan kelas data seperti berikut:
- Entitas Showroom memiliki bidang seperti nama dan lokasi sebagai data teks dan nomor ponsel sebagai data numerik.
- Entitas Pelanggan memiliki bidang alamat email dengan format xxx@example.com atau xxx@example.com.yy. Panjang nama bidang tidak boleh lebih dari 100 karakter.
- Entitas Penjualan memiliki nama pelanggan dan nama tenaga penjualan sebagai bidang, beserta tanggal penjualan sebagai jenis data dan jumlah sebagai jenis data desimal.
Dengan demikian, model logis berperan sebagai jembatan antara model data konseptual dan teknologi yang mendasarinya serta bahasa basis data yang digunakan oleh developer untuk membuat basis data. Namun, model logis bersifat agnostik teknologi, dan Anda dapat mengimplementasikannya di bahasa basis data apa pun. Perekayasa data dan pemangku kepentingan biasanya membuat keputusan teknologi setelah mereka membuat model data logis.
Model daya fisik
Model data fisik memetakan model data logis ke dalam teknologi DBMS tertentu dan menggunakan terminologi perangkat lunak. Misalnya, model data fisik memberikan detail tentang hal-hal berikut:
- Jenis bidang data seperti yang ditunjukkan dalam DBMS
- Hubungan data seperti yang ditunjukkan dalam DBMS
- Detail tambahan, seperti penyetelan performa
Perekayasa data membuat model fisik sebelum implementasi desain final. Perekayasa data juga mengikuti teknik pemodelan data formal untuk memastikan bahwa mereka telah mencakup seluruh aspek desain.
Contoh model data fisik
Misalkan, dealer mobil memutuskan untuk membuat arsip data di Amazon S3 Glacier Flexible Retrieval. Model data fisik mereka menjelaskan spesifikasi berikut:
- Di Penjualan, jumlah penjualan merupakan jenis data float dan tanggal penjualan merupakan jenis data timestamp.
- Di Pelanggan, nama pelanggan adalah jenis data string.
- Di terminologi S3 Glacier Flexible Retrieval, vault merupakan lokasi geografis data Anda.
Model data fisik Anda juga mencakup detail tambahan seperti Wilayah AWS tempat Anda akan membuat vault. Dengan demikian, model data fisik berperan sebagai jembatan antara model data logis dan implementasi teknologi final.
Apa saja jenis teknik pemodelan data?
Teknik pemodelan data merupakan metode berbeda yang dapat Anda gunakan untuk membuat model data yang berbeda. Pendekatan tersebut telah berkembang dari waktu ke waktu sebagai hasil dari inovasi dalam konsep basis data dan tata kelola data. Berikut ini adalah tiga jenis pemodelan data utama:
Pemodelan data hierarkis
Di pemodelan data hierarki, Anda dapat merepresentasikan hubungan antara berbagai elemen data dalam format seperti pohon. Model data hierarkis merepresentasikan hubungan satu-ke-banyak, dengan pemetaan kelas data induk atau akar ke beberapa turunan.
Dalam contoh dealer mobil misalnya, kelas induk Showroom akan memiliki entitas Mobil dan Tenaga Penjualan sebagai turunan karena satu showroom memiliki beberapa mobil dan tenaga penjualan yang bekerja di showroom tersebut.
Pemodelan data grafik
Pemodelan data hierarkis dari waktu ke waktu telah berevolusi menjadi pemodelan data grafik. Model data grafik merepresentasikan hubungan data yang memperlakukan entitas secara sama. Entitas dapat terhubung satu sama lain dalam hubungan satu-ke-banyak atau banyak-ke-banyak tanpa konsep induk atau turunan.
Misalnya, satu showroom dapat memiliki beberapa tenaga penjualan, dan satu tenaga penjualan juga dapat bekerja di beberapa showroom jika lokasi sif mereka berbeda-beda.
Pemodelan data relasional
Pemodelan data relasional merupakan pendekatan pemodelan populer yang memvisualisasikan kelas data sebagai tabel. Tabel data yang berbeda digabungkan atau dihubungkan dengan menggunakan kunci yang merepresentasikan hubungan entitas dunia nyata. Anda juga dapat menggunakan teknologi basis data relasional untuk menyimpan data terstruktur, dan model data relasional merupakan metode yang sangat berguna untuk merepresentasikan struktur basis data relasional Anda.
Misalnya, dealer mobil akan membuat model data relasional yang merepresentasikan tabel Tenaga Penjualan dan tabel Mobil, seperti yang ditunjukkan di sini:
ID Tenaga Penjualan | Nama |
1 | Jane |
2 | John |
ID Mobil | Merek Mobil |
C1 | XYZ |
C2 | ABC |
ID Tenaga Penjualan dan ID Mobil merupakan kunci primer yang secara unik mengidentifikasi entitas individu dunia nyata. Dalam tabel showroom, kunci primer ini berperan sebagai kunci asing yang menghubungkan segmen data.
ID Showroom | Nama showroom | ID Tenaga Penjualan | ID Mobil |
S1 | Showroom NY | 1 | C1 |
Pada basis data relasional, kunci primer dan asing bekerja sama untuk menunjukkan hubungan data. Tabel sebelumnya menunjukkan bahwa showroom dapat memiliki tenaga penjualan dan mobil.
Pemodelan data hubungan entitas
Pemodelan data hubungan entitas (ER) menggunakan diagram formal untuk merepresentasikan hubungan antara entitas dalam basis data. Arsitek data menggunakan beberapa alat pemodelan ER untuk merepresentasikan data.
Pemodelan data berorientasi objek
Pemrograman berorientasi objek menggunakan struktur data yang disebut objek untuk menyimpan data. Objek data ini merupakan abstraksi perangkat lunak entitas dunia nyata. Misalnya, dalam model data berorientasi objek, dealer mobil akan memiliki data objek seperti Pelanggan dengan atribut seperti nama, alamat, dan nomor telepon. Anda akan menyimpan data pelanggan sehingga setiap pelanggan dunia nyata direpresentasikan sebagai objek data pelanggan.
Model data berorientasi objek mengatasi banyak batasan model data relasional dan populer dalam basis data multimedia.
Pemodelan data dimensional
Komputasi korporasi modern menggunakan teknologi gudang data untuk menyimpan data untuk analitik dalam jumlah besar. Anda dapat menggunakan proyek pemodelan data dimensional untuk penyimpanan dan pengambilan data dari gudang data dengan kecepatan tinggi. Model dimensional menggunakan data duplikasi atau redundan serta memprioritaskan performa daripada penggunaan sedikit ruang untuk penyimpanan data.
Misalnya, pada model data dimensional, dealer mobil memiliki dimensi seperti Mobil, Showroom, dan Waktu. Dimensi Mobil memiliki atribut seperti nama dan merek, tetapi dimensi Showroom memiliki hierarki seperti negara, kota, nama jalan, dan nama showroom.
Apa itu proses pemodelan data?
Proses pemodelan data mengikuti urutan langkah yang harus Anda jalankan secara berulang-ulang hingga Anda dapat membuat model data komprehensif. Di semua organisasi, berbagai pemangku kepentingan bergabung untuk membuat tampilan data yang lengkap. Meskipun langkahnya bervariasi menurut jenis pemodelan data, berikut ini adalah gambaran umumnya.
Langkah 1: Identifikasi entitas dan properti mereka
Identifikasi semua entitas dalam model data Anda. Setiap entitas harus dibedakan dari semua entitas lain secara logis dan dapat merepresentasikan orang, tempat, benda, konsep, atau peristiwa. Setiap entitas berbeda karena memiliki satu atau lebih properti unik. Anda dapat menganggap entitas sebagai kata benda dan atribut sebagai kata sifat dalam model data Anda.
Langkah 2: Identifikasi hubungan antara entitas
Hubungan antara entitas yang berbeda merupakan inti dari pemodelan data. Aturan bisnis awalnya menentukan hubungan ini pada tingkat konseptual. Anda dapat menganggap hubungan itu sebagai kata kerja dalam model data Anda. Misalnya, tenaga penjualan menjual banyak mobil, atau showroom mempekerjakan banyak tenaga penjualan.
Langkah 3: Identifikasi teknik pemodelan data
Setelah Anda memahami entitas dan hubungan mereka secara konseptual, Anda dapat menentukan teknik pemodelan data yang paling cocok untuk kasus penggunaan Anda. Misalnya, Anda mungkin menggunakan pemodelan data relasional untuk data terstruktur, tetapi menggunakan pemodelan data dimensional untuk data yang tidak terstruktur.
Langkah 4: Optimalkan dan ulangi
Anda dapat mengoptimalkan model data Anda lebih lanjut agar sesuai dengan teknologi dan persyaratan performa Anda. Misalnya, jika Anda berencana untuk menggunakan Amazon Aurora dan bahasa kueri terstruktur (SQL), Anda akan memasukkan entitas Anda secara langsung ke dalam tabel dan menentukan hubungan tertentu dengan menggunakan kunci asing. Sebaliknya, jika Anda memilih menggunakan Amazon DynamoDB, Anda harus memikirkan pola akses sebelum Anda memodelkan tabel Anda. Karena DynamoDB memprioritaskan kecepatan, pertama-tama Anda harus menentukan cara Anda mengakses data lalu memodelkan data dalam bentuk yang ingin diakses.
Biasanya Anda akan mempertahankan langkah-langkah tersebut berulang kali karena perubahan teknologi dan kebutuhan dari waktu ke waktu.
Bagaimana AWS bisa membantu pemodelan data?
Anda juga dapat menggunakan AWS Amplify DataStore untuk pemodelan data yang lebih cepat dan mudah guna membangun aplikasi seluler dan web. Layanan ini memiliki tampilan antarmuka visual dan berbasis kode untuk menentukan model data Anda dengan hubungan, yang akan mempercepat pengembangan aplikasi Anda.
Mulai pemodelan data di AWS dengan membuat akun gratis sekarang juga.