Glue Data Quality를 선택해야 하는 이유
데이터 레이크는 적절한 감독 없이는 데이터의 늪지대가 될 수 있습니다. 데이터 품질 검사를 설정하는 것은 시간이 많이 걸리고 지루하며 오류가 발생하기 쉽습니다. 수동으로 데이터 품질 규칙을 만들고 코드를 작성하여 데이터 파이프라인을 모니터링하고 데이터 품질이 저하되면 데이터 소비자에게 알려야 합니다. AWS Glue Data Quality는 이러한 수동 품질 작업에 소요되는 시간을 며칠에서 몇 시간으로 단축합니다. 자동으로 통계를 계산하고, 품질 규칙을 추천하고, 모니터링하며, 문제가 감지되면 알려줍니다. Glue Data Quality은 숨겨져 있거나 찾기 어려운 문제의 경우 ML 알고리즘을 사용합니다. 확장 가능한 서버리스 개방형 솔루션과 함께 규칙 기반 접근 방식과 ML 접근 방식이 결합되어 신뢰할 수 있는 비즈니스 의사 결정을 내리는 데 필요한 고품질 데이터를 제공할 수 있습니다.