Data Lake คือแนวคิดในการจัดการข้อมูลระดับองค์กร ที่เน้นการรวบรวมข้อมูลในทุกรูปแบบที่เป็นไปได้ จากทุกๆ แหล่งข้อมูลเข้ามาเก็บไว้ยังสถานที่จัดเก็บข้อมูลกลางขององค์กร โดยไม่มีการจัดระเบียบหรือปรับแต่งข้อมูลไว้ก่อนการจัดเก็บ การจัดรูปแบบข้อมูลเพื่อการใช้งานจะเกิดขึ้นเมื่อผู้ใช้ข้อมูลต้องการนำข้อมูลไปวิเคราะห์ในขั้นต่อไปเท่านั้น เปรียบเสมือนบึงหรือทะเลสาบที่เป็นแหล่งน้ำตามธรรมชาติซึ่งสามารถรองรับน้ำจากทุกๆ แหล่งได้โดยอัตโนมัติโดยผู้ที่ต้องการใช้น้ำจากแหล่งน้ำจะเป็นผู้ตัดสินใจเองว่าจะต้องการนำน้ำไปใช้ในลักษณะใด และจะต้องปรับปรุงคุณภาพน้ำให้เหมาะสมกับการใช้งานของตนเองได้อย่างไร
ที่มารูปภาพ
[1] https://unsplash.com/photos/jXMGrVYHpK0
แหล่งข้อมูลอ้างอิง
[1] What is a data lake? (n.d.). Retrieved from https://aws.amazon.com/big-data/datalakes-and-analytics/what-is-a-data-lake/