วันเสาร์ที่ 31 ตุลาคม พ.ศ. 2558


DATA Warehouse


Data Warehouse คือ คลังของข้อมูลที่ผ่านกระบวนการสารสนเทศแล้ว และได้รับการออกแบบมาเพื่อจัดเก็บข้อมูลที่ปริมาณมาก เป็นฐานข้อมูลขนาดใหญ่ที่เก็บรวบรวมข้อมูลจากหลายแหล่งขององค์กรทั้งหมด ตั้งแต่อดีตจนถึงปัจจุบันโดยข้อมูลที่เก็บจะต้องเป็นข้อมูลสารสนเทศ (Data Information)

ทำไมต้องใช้ระบบ Data Warehouse

องค์กรต่างๆ ในปัจจุบันส่วนใหญ่จะมีการลงทุนลงแรงไปมากกับระบบที่เรียกว่า “ระบบฐานข้อมูลประจำวัน (Operational System)”  ระบบข้อมูลที่ว่านี้จะมีหน้าที่หลักในการรวบรวมและจัดเก็บข้อมูลเอาไว้ ไม่ว่าจะเป็นข้อมูลของบุคคลากร ข้อมูลลูกค้า ข้อมูลการขาย ข้อมูลฝ่ายบุคคล ข้อมูลเกี่ยวกับคงคลังก็ตาม โดยที่ระบบเหล่านี้มีการลงทุนไปมาก ดังนั้นปริมาณข้อมูลที่มหาศาลก็เลยถือได้ว่าเป็นทรัพย์สินและทรัพยากรอย่างหนึ่งขององค์กร  จึงจำเป็นต้องมีการจัดการที่เหมาะสมเพื่อนำเอาทรัพย์สินเหล่านี้มาใช้ให้เกิดประโยชน์สูงสุด ในองค์กรหลายแห่ง ได้นำข้อมูลเหล่านี้มาช่วยในการตัดสินใจโดยประยุกต์ใช้เป็นระบบการตัดสินใจ “Decision Support System (DSS)”  โดยนำเอาระบบ Data Warehouse  มาช่วยเพื่อให้ผู้บริหารสามารถเรียกใช้ข้อมูลที่ต้องการได้อย่างรวดเร็วและมีประสิทธิภาพมากขึ้น


ความแตกต่างจากฐานข้อมูล

โดยปกติแล้ว ฐานข้อมูลในองค์กรทั่วไปจะมีลักษณะที่ค่อนข้างทันต่อเหตุการณ์ เช่น ฐานข้อมูลพนักงานก็จะเก็บเฉพาะพนักงานในปัจจุบัน จะไม่สนใจข้อมูลพนักงานเก่า ๆ ในอดีต ซึ่งอาจจะมีข้อมูลอะไรบางอย่าง ที่มีประโยชน์สำหรับผู้บริหาร ในการวิเคราะห์ประสิทธิภาพและคุณลักษณะต่าง ๆ ขององค์กร. นอกจากนี้ ฐานข้อมูลแต่ละอันมักถูกออกแบบมาใช้เก็บข้อมูลเฉพาะด้าน จึงมีข้อมูลเฉพาะบางส่วนขององค์กรเท่านั้น ฉะนั้นคลังข้อมูลจึงถูกออกแบบมา เพื่อรวบรวมข้อมูลในทุกส่วนของทั้งบริษัท ทั้งเก่าและใหม่ไว้ด้วยกัน ไม่มีการลบทิ้งข้อมูลเก่า ๆ ที่ไม่จริงในปัจจุบัน

โดยสรุปคือ
  • คลังข้อมูล ใช้เพื่อการวิเคราะห์ (ข้อมูลทั้งอดีตและปัจจุบัน)

  • ฐานข้อมูล ใช้เพื่อทำการประมวลผล (เฉพาะข้อมูลปัจจุบัน)

ถ้าองค์กรมีคลังข้อมูลหลาย ๆ อันเพื่อใช้ในการวิเคราะห์ต่าง ๆ แตกต่างกันไป เช่น คลังข้อมูลด้านการเงิน และ คลังข้อมูลด้านทรัพยากรมนุษย์ เรามักเรียกคลังข้อมูลเฉพาะด้านเหล่านี้ว่า ตลาดข้อมูล (data marts)

องค์ประกอบของ Data Warehouse

Data_Warehouse_Components.jpg

  1. Operational Source Systems : เป็นระบบคำสั่งของ record ที่จับ transaction ของธุรกิจ

  2. Data Staging Area : โซนพักข้อมูล : เป็นส่วนที่ให้ข้อมูลมาพักไว้ก่อนการทำงานต่อไป โดยจะมีกระบวนการ ETL (extract:แตกข้อมูล การพยายามเข้าไปอ่าน และพยายามเข้าใจถึงแหล่งข้อมูล- transformation:จัดการcleanข้อมูลและรวมข้อมูลจากหลายแหล่งเข้าด้วยกัน- load:โหลดเข้าไปในคลังข้อมูล)

  3. Data Presentation Area (Data Warehouse) : เป็นที่ที่ข้อมูลถูกจัดการ, จัดเก็บ และทำให้สามารถเข้าถึงได้โดยตรงจากผู้ใช้, คนเขียนรายงาน และแอพพลิเครชั่นที่ใช้ในการวิเคราะห์

  4. Data Mart : เป็น data warehouse ขนาดย่อย ซึ่งการที่ต้องแบ่งย่อยออกมาเพื่อการใช้งานได้สะดวกและกำหนดสิืทธิ์ของการเข้าถึง หรืออาจจะแบ่งตาม business process ก็ได้

  5. Data Access Tools : เครื่องมือที่ทำการดึงข้อมูล โดยสามารถที่จะเป็น ad hoc query (การเป็น query ที่ไม่คาดคะเนมาก่อน)หรือ data mining

  6. Metadata : เป็นสิ่งที่อยู่รอบๆข้อมูลจริงๆที่ทำให้คนเข้าใจว่าข้อมูลนั้นถูกสร้างมาได้อย่างไร และจะนำไปใช้ได้อย่างไร มีไว้ช่วย  DW’s technical, administrative, business user group ในกา่รทำงาน

วัตถุประสงค์ของการสร้างคลังข้อมูล

เป้าหมายของการสร้างคลังข้อมูล คือ การแยกกลุ่มข้อมูลสารสนเทศที่ใช้ในการวิเคราะห์ทางธุรกิจออกจากฐานข้อมูลที่ใช้งานประจำวัน (Operational Database) มาเก็บอยู่ใน Relational Database Management Systems (RDBMS) ประสิทธิภาพสูง และทำให้การเรียกใช้ข้อมูลชุดนี้ทำได้อย่างยืดหยุ่น จากเครื่องมือที่อยู่บนเครื่องเดสก์ทอปทั่วไป โดยลด off-loading เพิ่มกลไกการช่วยตัดสินใจ ปรับปรุงเวลาที่ตอบสนอง (response time) รวดเร็วยิ่งขึ้นอย่างมากและผู้บริหารสามารถเรียกข้อมูลรายละเอียดที่จำเป็น ที่ถูกเก็บมาก่อนหน้านี้ (historical data) มาใช้ช่วยในการตัดสินใจทางธุรกิจแม่นยำขึ้น

อ้างอิง
http://www.imd.co.th/knowledges.php?id=9
http://www.scimath.org/computerarticle/item/1093--data-warehouse

http://techinnoreview.exteen.com/20090611/data-warehouse

http://don-.com/%E0%B8%AA%E0%B8%A3%E0%B8%B8%E0%B8%9B%E0%B9%80%E0%B8%99%E0%B8%B7%E0%B9%89%E0%B8%AD%E0%B8%AB%E0%B8%B2-data-warehouse-midterm/
http://www.srisangworn.go.th/home/databaselearnx/ms1t1-11.htm