วันอาทิตย์ที่ 5 พฤษภาคม พ.ศ. 2556

บทที่6 ข้อมูลและการจัดการข้อมูล

                                     บทที่6 ข้อมูลและการจัดการข้อมูล

ความหมายของข้อมูล
 

    ข้อมูล คือ ข้อเท็จจริงที่มารวบรวมไว้และมีความหมาย อาจเกี่ยวข้องกับคน สิ่งของหรือเหตุการณ์อื่นๆในการประมวลผลของคอมพิวเตอร์ นิยมใช้เป็นส่วนนำเข้าพื้นฐานเพื่อให้ได้สารสนเทศสำหรับการช่วยตัดสินใจเพื่อนำเอาไปใช้ประโยชน์อื่นๆอีกได้ตามต้องการ โดยปกติข้อมูลที่จะนำมาใช้ประมวลผลจะมีอยู่กระจัดกระจายทั่วไป เมื่อต้องการใช้จำเป็น
   ต้องมีการจัดเรียงใหม่ให้อยู่ในรูปแบบที่สามารถนำเอามาใช้ได้อย่างเป็นระบบ เพื่อให้ข้อมูลนั้นสามารถนำเอาไปใช้ได้ตรงตามความต้องการและมีระเบียบมากยิ่งขึ้น
  แหล่งข้อมูล
  ข้อมูลถือได้ว่าเป็นองค์ประกอบหนึ่งที่สำคัญสำหรับการประมวลผลด้วยคอมพิวเตอร์ ในยุคโลกาภิวัตน์ ที่การติดตั้งสื่อสารไม่ได้จำกัดและระยะทางหรือพรมแดนอีกต่อไป ยิ่งทำให้ข้อมูลถูกเผยแพร่และกระจายการใช้การใช้งานมากยิ่งขึ้น ข้อมูลสำหรับการนำมาประมวลผลด้วยคอมพิวเตอร์นั้นจะได้มาจากแหล่ง มีมา 2 ประเภทด้วยกันคือ
1. แหล่งข้อมูลภายใน
 เป็นแหล่งกำเนิดของข้อมูลที่อยู่ในองค์กรทั่วไป ข้อมูลที่ได้มานั้นอาจมาจากพนักงานหรือมีอยู่แล้วในองค์กร เช่น ยอดขายประจำปี ข้อมูลผู้ถือหุ้น รายงานกำไรขาดทุน รายชื่อพนักงาน ข้อมูลเหล่านี้จะให้ข้อมูลที่เกี่ยวข้องกับข้อเท็จจริงต่างๆภายในองค์กรแต่เพียงอย่างเดียว อาจเป็นข้อมูลที่เปิดเผยให้กับบุคคลภายนอกทราบหรือไม่ก็ได้
2.แหล่งข้อมูลภายนอก
 เป็นแหล่งกำเนิดข้อมูลที่อยู่ภายนอกองค์กร โดยทั่วไปแล้วสามารถนำข้อมูลต่าง ๆเหล่านั้นมาใช้ประโยชน์ในองค์กรหรือนำมาใช้กับการประมวลผลด้วยคอมพิวเตอร์ เพื่อให้ได้ระบบงานที่สมบูรณ์ขึ้น ข้อมูลเหล่านี้เช่น ข้อมูลลูกค้า เจ้าหนี้ อัตราดอกเบี้ยสถาบันการเงิน
คุณสมบัติของข้อมูลที่ดี
 ข้อมูลที่นำมาใช้ประมวลผลเพื่อให้ได้สารสนเทศที่ต้องการนั้น อาจได้มาจากทั้งแหล่งข้อมูลภายในหรือภายนอกองค์กร ซึ่งหากได้ข้อมูลที่ดีย่อมหมายถึงความได้เปรียบในการดำเนินการตามไปด้วย ซึ่งจำเป็นต้องมีคุณสมบัติขั้นพื้นฐาน ดังนี้
ความถูกต้อง Accuracy ข้อมูลที่ดีต้องมีความถูกต้องเพื่อให้สามารถนำเอาไปใช้ประโยชน์ได้ ข้อมูลที่ไม่เป็นจริงและมีความคลาดเคลื่อนอยู่มาก อาจก่อให้เกิดความเสียหายต่อการเอาข้อมูลนั้นเอาไปใช้ต่ออีกได้
   มีความเป็นปัจจุบันUpdate
 ข้อมูลที่ดีจำมูลเป็นต้องมีการปรับปรุงแก้ไขให้มีความเป็นปัจจุบันอยู่เสมอเนื่องจากปกติข้อมูลจะมีลักษณะคงที่ เว้นแต่ว่าจะมีผู้ที่มาแก้ไขเปลี่ยนแปลงข้อมูลนั้นเสียใหม่ อีกทั้งเหตุการณ์ต่างๆมักเกิดใหม่อยู่ตลอดเวลา
    ตรงตามความต้องการ Relevance
ควรมีการสำรวจเกี่ยวกับขอบเขตของข้อมูลที่จะมาใช้ให้สอดคล้องและตรงกับความต้องการของหน่วยงานให้มากที่สุด ข้อมูลนั้นถึงแม้จะถูกต้องมากแค่ไหนแต่หากไม่สอดคล้องกับความต้องการก็ไม่สามารถนำไปใช้ประโยชน์หรือช่วยในการตัดสินใจใดๆ ได้
   ความสมบูรณ์ Complete
 การนำเอาข้อมูลมาใช้ประโยชน์นั้นจะต้องมีความสมบูรณ์ของข้อมูลมากพอ จึงจะทำให้การนำเอาไปใช้นั้นเกิดประโยชน์อย่างเต็มที่ การเก็บรวบรวมข้อมูลสามารถทำได้มากกว่าหนึ่งครั้งเพื่อให้ได้ข้อมูลที่สมบูรณ์จริงๆ เช่น การเก็บข้อมูลเชิงสถิติหรือวัดค่าเฉลี่ยอาจต้องเก็บรวบรวมข้อมูลโดยการออกแบบสอบถามรอบแรกเสียก่อนหรือที่เรียกว่า ข้อมูลปฐมภูมิ ความสมบูรณ์ของข้อมูลนี้อาจรวมถึงข้อมูลนั้นต้องมีความครบถ้วนด้วย
   สามารถตรวจสอบได้ Verifiable
 ข้อมูลที่อยู่ในปัจจุบันอาจหามาได้จากแหล่งข้อมูลหลายๆที่ซึ่งอาจมีทั้งข้อมูลที่เชื่อถือได้หรือข้อมูลซึ่งเป็นกลลวงของคู่แข่ง ดังนั้นห่างต้องการนำมาประมวลผลจึงควรเลือกข้อมูลที่สามารถตรวจสอบแหล่งที่มา หรือแหล่งที่มีหลักฐานอ้างอิงต่างๆเสียก่อน เพื่อป้องกันข้อมูลที่ไม่เกิดประโยชน์และอาจนำผลเสียหายมาให้ได้
การแบ่งลำดับชั้นของการจัดการข้อมูล Hierarchy of Data
 ในการจักการข้อมูลนั้นจะมีการจัดแบ่งข้อมูลออกเป็นลำดับเพื่อง่ายต่อการเรียกใช้และประมวลผล ซึ่งจะขออธิบายเกี่ยวกับลำดับชั้นข้อมูลพื้นฐานในการจักการข้อมูลนั้นจะมีการจัดแบ่งข้อมูลออกเป็นลำดับเพื่อง่ายต่อ
ลำดับชั้นของการจัดการข้อมูล
                                               
บิต (Bit = Binary Digit)
เป็นลำดับชั้นของหน่วยข้อมูลที่เล็กที่สุด ดังที่ทราบกันดีแล้วว่าข้อมูลที่จะทำงานร่วมกับคอมพิวเตอร์ได้นั้น จะต้องเอามาแปลงให้อยู่ในรูปของเลขฐานสองเสียก่อนคอมพิวเตอร์จึงจะเข้าใจและทำงานตามที่ต้องการได้ เมื่อแปลงแล้วจะได้ตัวเลขแทนสถานะเปิดและปิด ของสัญญาณไฟฟ้าที่เรียกว่า บิต เพียง 2 ค่าเท่านั้นคือ บิต 0 และบิต 1
ไบต์ (Byte)
เมื่อนำบิตมารวมกันหลายๆบิต จะได้หน่วยข้อมูลกลุ่มใหม่ที่เรียกว่า ไบต์ (Byte) ซึ่งจำนวนของบิตที่ได้นั้นแต่ละกลุ่มอาจมีมากหรือน้อยบ้าง ทั้งนี้ขึ้นอยู่กับชนิดของรหัสที่ใช้เก็บ แต่โดยปกติกับการใช้งานในรหัสแอสกีทั่วไปจะได้กลุ่มของบิต 8 บิตด้วยกัน ซึ่งนิยมมาแทนเป็นรหัสของตัวอักษร บางครั้งจึงนิยมเรียกข้อมูล 1 ไบต์ว่าเป็น 1 ตัวอักษร
ฟีลด์ หรือเขตของข้อมูล (Field)
ประกอบด้วยกลุ่มของตัวอักษรหรือไบต์ตั้งแต่ 1 ตัวขึ้นไปมาประกอบกันเป็นหน่วยข้อมูลที่ใหญ่ขึ้นแล้วแสดงลักษณะหรือความหมายอย่างใดอย่างหนึ่ง ยกตัวอย่างเขตข้อมูลเกี่ยวกับพนักงาน เช่น รหัสพนักงาน ชื่อ นามสกุล เงินเดือน ตำแหน่ง
เรคคอร์ด (Record)
 เป็นกลุ่มของเขตข้อมูลหรือฟีลด์ที่มีความสัมพันธ์กัน และนำมาจัดเก็บรวมกันเป็นหน่วยใหม่ที่ใหญ่ขึ้นเพียงหน่วยเดียว ปกติในการจัดการข้อมูลใดมักประกอบด้วยเรคคอร์ด ทั้งนี้ขึ้นอยู่กับขนาดของข้อมูลเป็นหลัก
ไฟล์ หรือแฟ้มตารางข้อมูล (File)ไฟล์ หรือแฟ้มข้อมูล เป็นการนำเอาข้อมูลทั้งหมดหลายๆเรคคอร์ดที่ต้องการจัดเก็บมาเรียงอยู่ในรูแปบของแฟ้มตารางข้อมูลเดียวกัน เช่น แฟ้มตารางข้อมูลเกี่ยวกับคะแนนนักศึกษาวิชาเทคโนโลยีสารสนเทศ อาจประกอบด้วยเรคคอร์ดของนักศึกษาหลายๆคนที่เก็บข้อมูลเกี่ยวกับ รหัสนักศึกษา ชื่อ นามสกุล และคะแนนที่ได้
ฐานข้อมูล (Database) เกิดจากการรวบรวมเอาแฟ้มตารางข้อมูลหลายๆแฟ้มที่มีความสัมพันธ์กันมาเก็บรวมกันไว้ที่เดียว โดยจะมีการเก็บคำอธิบายเกี่ยวกับโครงสร้างฐานข้อมูลหรือที่เรียกว่า พจนานุกรมข้อมูล (data dictionary) ซึ่งจะใช้อธิบายลักษณะของข้อมูลที่เก็บไว้ เป็นต้นว่า โครงสร้างของแต่ละตารางเป็นอย่างไร ประกอบด้วยฟีลด์อะไรบ้าง คุณลักษณะของแต่ละฟีลด์และความสัมพันธ์ของแต่ละแฟ้มเป็นอย่างไร ซึ่งข้อมูลเหล่านี้ถือว่ามีความจำเป็นมากและจะถูกเรียกใช้ในระหว่างที่มีการประมวลผลฐานข้อมูลนั่นเอง

ฐานข้อมูลมักเกี่ยวข้องกับการดำรงชีวิตประจำวันของเรา
 

พอจะยกตัวอย่างได้ดังนี้
1.ฐานข้อมูลทะเบียนราษฎร์ จัดเก็บข้อมูลเกี่ยวกับประชากรในประเทศไทยทั้งหมด เช่น ข้อมูลการเกิด การตายการย้ายหรือเปลี่ยนแปลงที่อยู่
2.ฐานข้อมูลทะเบียนนักศึกษา ซึ่งจัดเก็บข้อมูลเกี่ยวกับประวัตินักศึกษา เช่น ผลการเรียน ความประพฤติ
3.ฐานข้อมูลบุคลากร ซึ่งจัดเก็บข้อมูลเกี่ยวข้องกับพนักงานทั้งหมดในองค์กร เช่น ประวัติการทำงาน ประวัติการศึกษา คู่สมรส บุตร สุขภาพการเจ็บป่วยเป็นต้น
การจัดโครงสร้างของแฟ้มข้อมูล (File Organization)
¢โดยปกติแฟ้มข้อมูลจะถูกเก็บไว้ในหน่วยความจำสำรอง (secondary storage) เช่น ฮาร์ดดิสก์ เนื่องจากมีความจุข้อมูลสูงและสามารถเก็บได้ถาวรแม้จะปิดเครื่องไป ซึ่งการจัดเก็บนี้จะต้องมีวิธีกำหนดโครงสร้าง โดยมีวัตถุประสงค์เพื่อให้การจัดเก็บและเข้าถึงข้อมูลมีความรวดเร็ว ถูกต้อง และเหมาะสมกับความต้องการ การเข้าถึงและค้นคืนข้อมูลจะอาศัยคีย์ฟีลด์ในการเรียกค้นด้วยเสมอ การจัดโครงสร้างของแฟ้มข้อมูลอาจจะแบ่งได้เป็น 3 ลักษณะดังนี้
. โครงสร้างของแฟ้มข้อมูลแบบเรียงลำดับ (Sequential File Structure) เป็นโครงสร้างของแฟ้มข้อมูลชนิดพื้นฐานที่สามารถใช้งานได้ง่ายที่สุด เนื่องจากมีลักษณะการจัดเก็บข้อมูลแบบเรียงลำดับเรคคอร์ดต่อเนื่องกันไปเรื่อยๆ การอ่านหรือค้นคืนข้อมูลจะข้ามลำดับไปอ่านตรงตำแหน่งใดๆที่ต้องการโดยตรงไม่ได้ เมื่อต้องการอ่านข้อมูลที่เรคคอร์ดใดๆโปรแกรมจะเริ่มอ่านตั้งแต่เรคคอร์ดแรกไปเรื่อยๆจนกว่าจะพบเรคคอร์ดที่ต้องการ ก็จะเรียกค้นคืนเรคคอร์ดนั้นขึ้นมา
     การใช้ข้อมูลเรียงลำดับนี่จึงเหมาะสมกับงานประมวลผลที่มีการอ่านข้อมูลต่อเนื่องกันไปเรื่อยๆตามลำดับและปริมาณครั้งละมากๆตัวอย่างเช่น ใบแจ้งหนี้ค่าบริการไฟฟ้า น้ำประปา ค่าโทรศัพท์หรือค่าบริการสาธารณูปโภคอื่นๆที่
มีเรคคอร์ด
ของลูกค้าจำนวนมาก เป็นต้น
     แฟ้มข้อมูลแบบนี้ถ้าเป็นเครื่องคอมพิวเตอร์ระดับเมนเฟรมขนาดใหญ่ก็จะจัดเก็บอยู่ในอุปกรณ์ประเภทเทปแม่เหล็ก (
magnetic tape) ซึ่งมีการเข้าถึงแบบลำดับ (Sequential access) เวลาอ่านข้อมูลก็ต้องเป็นไปตามลำดับด้วย คล้ายกับการเก็บข้อมูลเพลงลงบนเทปคาสเซ็ต ซึ่งสมมติว่าในม้วนเทปหนึ่งมีการเก็บเพลงได้ 10 เพลง ความยาวเพลงละ 3 นาที ซึ่งหากต้องการค้นหาเพลงใดก็ต้องเริ่มต้นจากเพลงแรกไปเป็นลำดับจนกว่าจะพบ2. โครงสร้างของแฟ้มข้อมูลแบบสุ่ม (Direct/Random File Structure) 
¢เป็นลักษณะของโครงสร้างแฟ้มข้อมูลที่เข้าถึงได้โดยตรง เมื่อต้องการอ่านค่าเรคคอร์ดใดๆสามารถทำการเลือกหรืออ่านค่านั้นได้ทันที ไม่จำเป็นต้องผ่านเรคคอร์ดแรกๆเหมือนกับแฟ้มข้อมูลแบบเรียงลำดับ ซึ่งทำให้การเข้าถึงข้อมูลได้รวดเร็วกว่า ปกติจะมีการจัดเก็บในสื่อที่มีลักษณะการเข้าถึงได้โดยตรงประเภทจานแม่เหล็ก เช่น ดิสเก็ตต์, ฮาร์ดดิสก์หรือ CD-ROM เป็นต้น
3. โครงสร้างของแฟ้มข้อมูลแบบลำดับเชิงดรรชนี (Index Sequential File Structure)
เป็นลักษณะของโครงสร้างแฟ้มข้อมูลที่อาศัยกระบวนการที่เรียกว่า ISAM (Index Sequential Access Method ) ซึ่งรวมเอาความสามารถในการเข้าถึงข้อมูลแบบสุ่มและแบบเรียงตามลำดับเข้าไว้ด้วยกัน การจัดโครงสร้างแฟ้มข้อมูลวิธีนี้ ข้อมูลจะถูกจัดเก็บเรียงกันตามลำดับไว้บนสื่อแบบสุ่ม เช่น ฮาร์ดดิสก์ และการเข้าถึงข้อมูลจะทำผ่านแฟ้มข้อมูลลำดับเชิงดรรชนี (Index Sequential File) ซึ่งทำหน้าที่ช่วยชี้และค้นหาข้อมูลที่ต้องการได้ สามารถทำงานได้ยืดหยุ่นกว่าวิธีอื่นๆโดยเฉพาะกับกรณีที่ข้อมูลในการประมวลผลมีจำนวนมากๆ
     โครงสร้างแฟ้มข้อมูลแบบนี้จะมีหลักการทำงานคล้ายกับรูปแบบดรรชนีท้ายเล่มหนังสือที่มีการจัดเรียงหัวเรื่องแยกไว้เป็นลำดับตามหมวดหมู่อักษรตั้งแต่
A-Z หรือ ก-ฮ เมื่อสนใจหัวเรื่องใดโดยเฉพาะ ผู้อ่านสามารถไล่ค้นได้จากชื่อหัวเรื่องที่พิมพ์เรียงกันไว้เป็นลำดับนั้นเพื่อดูหมายเลขหน้าได้ ซึ่งทำให้ง่ายและสะดวกมากยิ่งขึ้น
เปรียบเทียบโครงสร้างแฟ้มข้อมูลแต่ละประเภท การจัดการเกี่ยวกับโครงสร้างของแฟ้มข้อมูล ควรคำนึงถึงความสามารถด้านเวลาในการเข้าถึงข้อมูล ของอุปกรณ์ที่ใช้จัดเก็บด้วย  การจัดการเกี่ยวกับโครงสร้างของแฟ้มข้อมูลอาจเปรียบเทียบได้กับการเลือกค้นหรืออ่านเนื้อหาข้อมูลในหนังสือที่ย่อมขึ้นอยู่กับความต้องการและความสะดวกของผู้ใช้เป็นหลักความแตกต่างของการจัดการเกี่ยวกับโครงสร้างของแฟ้มข้อมูลทั้ง 3 ประเภท จะเปรียบเทียบคุณสมบัติต่างๆ ดังต่อไปนี้
การเปรียบเทียบโครงสร้างของแฟ้มข้อมูล 
1 . โครงสร้างแฟ้ม แบบเรียงลำดับ
ข้อดี - เสียค่าใช้จ่ายน้อยและใช้งานได้ง่ายกว่าวิธีอื่นๆ
- เหมาะกับงานประมวลผลที่มีการอ่านข้อมูลแบบเรียงลำดับและในปริมาณมาก
- สื่อที่ใช้เก็บเป็นเทปซึ่งมีราคาถู
ข้อเสีย - การทำงานเพื่อค้นหาข้อมูลจะต้องเริ่มทำตั้งแต่ต้นไฟล์เรียงลำดับไปเรื่อย  จนกว่าจะหาข้อมูลนั้นเจอ  ทำให้เสียเวลาค่อนข้างมาก
- ข้อมูลที่ใช้ต้องมีการจัดเรียงลำดับก่อนเสมอ
สื่อที่ใช้
เก็บ เทปแม่เหล็ก เช่น เทปคาสเซ็ต
2.โครงสร้างแฟ้ม แบบสุ่ม
 ข้อดี สามารถทำงานได้เร็ว  เพราะมีการเข้าถึงข้อมูลเรคคอร์ดแบบเร็วมาก  เพราะไม่ต้องเรียงลำดับข้อมูลก่อนเก็บลงไฟล์
- เหมาะสมกับการใช้งานธุรกรรมออนไลน์ หรืองานที่ต้องการแก้ไข  เพิ่ม  ลบรากการเป็นประจำ

ข้อเสีย ไม่เหมาะกับงานประมวลผลที่อ่านข้อมูลในปริมาณมาก
- การเขียนโปรแกรมเพื่อค้นหาข้อมูลจะซับซ้อน
- ไม่สามารถเข้าถึงข้อมูลแบบเรียงลำดับได้
สื่อที่ใช้เก็บ จานแม่เหล็กเช่น ดิสเก็ตต์,  ฮาร์ดดิสก์หรือ  CD-ROM 
3.โครงสร้างแฟ้มแบบ ลำดับเชิงดรรชนี
 ข้อดี - สามารถรองรับการประมวลผลได้ทั้ง 2 แบบคือ  แบบลำดับและแบบสุ่ม
- เหมาะกับงานธุรกรรมออนไลน์  ด้วยเช่นเดียวกัน
ข้อเสีย - สิ้นเปลืองเนื้อที่ในการจัดเก็บดรรชนีที่ใช้อ้างอิงถึงตำแหน่งของข้อมูล
- การเขียนโปรแกรมเพื่อค้นหาข้อมูลจะซับซ้อน
- การทำงานช้ากว่าแบบสุ่ม  และมีค่าใช้จ่ายสูง
สื่อที่ใช้เก็บจานแม่เหล็ก  เช่น ดิสเก็ตต์,  ฮาร์ดดิสก์หรือ  CD-ROM 
ประเภทของแฟ้มข้อมูล File type
 นอกจากจะแบ่งแฟ้มข้อมูลที่มีตามรูปแบบหรือโครงสร้างการจัดเก็บดังในหัวข้อนี้แล้ว เรายังอาจแบ่งประเภท ของแฟ้มข้อมูลตามลักษณะเนื้อหาของข้อมูลที่เก็บเป็น 2 ประเภท คือ
1. แฟ้มหลัก Master file แฟ้มหลัก เป็นแฟ้มข้อมูลที่มีความถี่ของการเปลี่ยนแปลงข้อมูลไม่บ่อยมากนัก แฟ้มหลักลูกค้าธนาคารซึ่งจะเก็บข้อมูลของลูกค้า เช่น ชื่อ ที่อยู่ หมายเลขบัญชี
2. แฟ้มรายการเปลี่ยนแปลง Transaction file แฟ้มรายการเปลี่ยนแปลง เป็นแฟ้มข้อมูลที่มีการเปลี่ยนหรือแก้ไขของรายการข้อมูลภายในค่อนข้างบ่อย และทำบัตรประจำตัวต่อเนื่องหรือเกิดขึ้นทุกวัน
ระบบฐานข้อมูล
จากปัญหาของการประมวลผลแฟ้มข้อมูลข้างต้น แนวคิดของการแก้ปัยหาดังกล่าวจะใช้วิธีการจัดเก็บรวบรวมแฟ้มข้อมูลที่มีความสัมพันธ์กันนำมาจัดเรียงรวมกันเสียใหม่อย่างเป็นระบบเพื่อให้สะดวกต่อการค้นหาและเรียกใช้ข้อมูลร่วมกัน โดยจัดทำเป็น ระบบฐานข้อมูล นั่นเอง
ระบบฐานข้อมูลสามารถใช้งานได้ทั้งกับเครื่องคอมพิวเตอร์เครื่องเดียว (Standalone)
เช่น ระบบฐานข้อมูลสินค้าคงคลังสำหรับองค์กรขนาดเล็กที่ต้องการจัดเก็บฐานข้อมูลสินค้าไว้เฉพาะในคอมพิวเตอร์เครื่องที่พนักงานบัญชีใช้เพียงเครื่องเดียว หรือจะประยุกต์ใช้กับเครื่องคอมพิวเตอร์แบบแม่ข่าย (Server) ผ่านระบบ LAN หรืออินเตอร์เน็ตก็ได้ ทั้งนี้ขึ้นอยู่กับลักษณะของงานที่ต้องการเป็นหลัก ตัวอย่างของการใช้งานระบบฐานข้อมูลกับเครื่องคอมพิวเตอร์แม่ข่าย เช่น การประยุกต์ใช้ฐานข้อมูลบนเว็บ (web database) สำหรับการเก็บข้อมูลสินค้า ข้อมูลการสั่งซื้อ ข้อมูลยอดขาย ข้อมูลเกี่ยวกับการเรียน หรือข้อมูลอื่นๆที่ยินยอมให้ผู้ใช้เรียกดูข้อมูลเหล่านี้ได้ โดยผ่านเครือข่ายอินเทอร์เน็ตซึ่งใช้กันอย่างแพร่หลายในปัจจุบัน
     การนำเอาระบบฐานข้อมูลมาใช้งานนั้นจะช่วยให้การทำงานมีความสะดวกมากยิ่งขึ้น หากต่างคนต่างเก็บข้อมูลเอง ไม่ได้นำมาเก็บรวมกันเป็นฐานข้อมูลกลาง อาจส่งผลให้เกิดปัญหาต่างๆตามมาอีกได้ เช่น ความซ้ำซ้อนของการจัดเก็บข้อมูล หรือปัญหาของข้อมูลที่ไม่ตรงกัน
การนำระบบฐานข้อมูลมาใช้จัดการกับข้อมูลนั้นมีแนวคิดที่ตั้งอยู่บนพื้นฐานดังนี้
 - ลดความซ้ำซ้อนกันของข้อมูล (Reduced data redundancy)
         -
ลดความขัดแย้งของข้อมูล (
Reduced data inconsistency)
         -
การรักษาความคงสภาพของข้อมูล (
Improved data integrity)
         -
ใช้ข้อมูลร่วมกันได้ (
Shared data)
         -
ง่ายต่อการเข้าถึงข้อมูล (
Easier access)
         -
ลดระยะเวลาการพัฒนาระบบงาน (
Reduced development time)
     
นอกจากนี้ฐานข้อมูลยังช่วยในเรื่องการรักษาความปลอดภัยของข้อมูล โดยผู้ดูแลระบบจะสามารถกำหนดสิทธิ์ได้ว่าให้ใครหรือผู้ใช้คนใดทำอะไรได้หรือไม่ได้บ้าง เมื่อนำไปใช้ร่วมกับการพัฒนาระบบงานโปรแกรมฐานข้อมูล (Database application) ก็จะทำให้ระบบงานมีประสิทธิภาพมากขึ้นตามไปด้วย โดยผู้ใช้โปรแกรมในแต่ละระดับก็สามารถใช้งานได้แตกต่างกัน
เครื่องมือสำหรับจัดการฐานข้อมูล  (DBMS)
 โดยปกติในการจัดการฐานข้อมูลด้วยคอมพิวเตอร์นั้นจะมีโปรแกรมที่เรียกว่า ระบบการจัดการฐานข้อมูลหรือ DBMS (Database Management Systems) ซึ่งเปรียบเสมือนเป็นผู้จัดการฐานข้อมูลนั่นเอง โปรแกรมประเภทนี้มีการผลิตออกมาหลายระบบด้วยกัน แต่ที่ได้รับความนิยมและเป็นที่รู้จักกันดีคือ ระบบการจัดการฐานข้อมูลเชิงสัมพันธ์หรือ RDBMS (Relational Database
ลักษณะของ DBMS 
ระบบการจัดการฐานข้อมูลหรือ DBMS จะอำนวยความสะดวกกับผู้ใช้ คือสามารถใช้งานได้โดยที่ไม่จำเป็นต้องทราบถึงโครงสร้างทางกายภาพของข้อมูลในระดับที่ลึกมากเหมือนกับการเขียนโปรแกรมของโปรแกรมเมอร์ ระบบดังกล่าวจะยอมให้ผู้ใช้กำหนดโครงสร้างและดูแลรักษาฐานข้อมูลได้เป็นอย่างดี และยังสามารถควบคุมการเข้าถึงข้อมูลในส่วนต่างๆตามระดับการใช้งานของผู้ใช้แต่ละคนด้วย เราอาจพบเห็นการใช้งาน DBMS สำหรับการจัดการฐานข้อมูลได้ในองค์กรธุรกิจโดยทั่วไป เช่น ระบบข้อมูลลูกค้า ระบบสินค้าคงคลัง ระบบงานลงทะเบียน ระบบงานธุรกรรมออนไลน์
     
DBMS เป็นเหมือนตัวกลางที่ยอมให้ผู้ใช้เข้าค้นคืนข้อมูลได้โดยมีเครื่องมือสำคัยคือ ภาษาที่ใช้จัดการกับข้อมูลโดยเฉพาะเรียกว่า ภาษาเรียกค้นข้อมูล หรือ ภาษาคิวรี่ (query language) ซึ่งประกอบด้วยคำสั่งสำหรับเรียกใช้ข้อมูล แก้ไขเปลี่ยนแปลงหรือลบข้อมูล และยังสามารถนำไปใช้ร่วมกับการพัฒนาโปรแกรมประยุกต์ทางด้านฐานข้อมูล (Database application) ได้เป็นอย่างดี

ภาษาคิวรี่ (Query language) เป็นภาษาที่ใช้สำหรับสอบถามหรือจัดการฐานข้อมูลใน DBMS โดยภาษาประเภทนี้ที่ได้รับความนิยมสูงสุดคือ ภาษา SQL (Structure Query language ) คิดค้นโดยนักวิทยาศาสตร์ของไอบีเอ็มในทศวรรษที่ 1970 มีรูปแบบคำสั่งที่คล้ายกับประโยคในภาษาอังกฤษมาก ซึ่งปัจจุบันองค์กร ANSI (American National Standard Institute) ได้ประกาศให้ SQL เป็นภาษามาตรฐานสำหรับสำหรับระบบการจัดการฐานข้อมูลเชิงสัมพันธ์ (Relational Database Management System หรือ RDBMS) ซึ่งเป็นระบบ DBMS แบบที่ใช้กันแพร่หลายที่สุดในปัจจุบัน
     ระบบการจัดการฐานข้อมูลเชิงสัมพันธ์ ทุกระบบจะใช้คำสั่งพื้นฐานของภาษา
SQL ได้เหมือนกันแต่อาจมีคำสั่งพิเศษที่แตกต่างกันบ้าง เนื่องจากบริษัทผู้ผลิตแต่ละรายก็พยายามทีจะพัฒนา RDBMS ของตนเองให้มีลักษณะที่เด่นกว่าระบบอื่นโดยเพิ่มคุณสมบัติที่เกินข้อจำกัดของ ANSI ซึ่งคิดว่าเป็นประโยชน์ต่อผู้ใช้เข้าไป ตัวอย่างของคำสั่ง SQL มีดังนี้
 
DELETE ใช้สำหรับลบข้อมูลหรือลบเรคคอร์ดใดๆในฐานข้อมูล
INSERT ใช้สำหรับเพิ่มข้อมูลหรือเพิ่มเรคคอร์ดใดๆในฐานข้อมูล
 SELECT ใช้สำหรับเลือกข้อมูลหรือเลือกเรคคอร์ดใดๆที่ต้องการจากฐานข้อมูล
UPDATE ใช้สำหรับแก้ไขข้อมูลหรือแก้ไขเรคคอร์ดใดๆในฐานข้อมูล
แผนผังความสามารถโดยทั่วไปของระบบการจัดการฐานข้อมูล

 

แบบฝึกหัดบทที่ 6 ข้อมูลและการจัดการข้อมูล

1. คุณสมบัติของข้อมูลที่ดีประกอบด้วยอะไรบ้าง จงอธิบาย
ตอบ คุณสมบัติพื้นฐานของข้อมูลที่ดี มีดังต่อไปนี้
- ความถูกต้อง (accuracy)
ข้อมูลที่จะนำมาใช้ในการประมวลผล จำเป็นต้องเป็นข้อมูลที่ถูกต้อง ตรงกับความเป็นจริงหรือถูกต้องตรงกันกับแหล่งข้อมูลนั้น เพราะหากนำข้อมูลที่ผิดมาประมวลผล จะทำให้ได้สิ่งที่ต้องการผิดพลาดตามไปด้วย
- มีความเป็นปัจจุบัน (update)
ข้อมูลซึ่งอยู่ช่วงเวลาหนึ่งในอดีต อาจไม่สามารถนำมาใช้ได้กับอีกช่วงเวลาในปัจจุบันได้ การพิจารณาเลือกเอาข้อมูลที่ทันสมัยมาใช้ในการประมวลผลจะทำให้ได้ข้อมูลที่มีประโยชน์อย่างแท้จริง
-ตรงตามความต้องการ (relevance)
ข้อมูลที่ถูกต้องตรงกับความต้องการของหน่วยงานมากที่สุด ถือเป็นเรื่องที่สำคัญยิ่ง ข้อมูลที่ถึงแม้จะถูกต้องมากแค่ไหนก็ตาม แต่ไม่สอดคล้องกับความต้องการก็ไม่สามารถนำไปใช้ประโยชน์หรือช่วยในการตัดสินใจใดๆได้
- ความสมบูรณ์ (complete)
ข้อมูลที่จะนำมาประมวลผล บางครั้งอาจมีการเก็บรวบรวมข้อมูลหลายๆครั้งเพื่อให้ได้ข้อมูลที่สมบูรณ์จริงๆ ความสมบูรณ์นี้อาจหมายถึงข้อมูลนั้นต้องมีความครบถ้วนด้วย เช่น ในระบบงานบุคลากรหากเราสนใจเพียงแค่ข้อมูลของพนักงานเฉพาะวุฒิการศึกษาและความสามารถเพียงอย่างเดียว แต่ไม่ได้สนใจเนื้อหาส่วนที่เกี่ยวข้องกับวันเกิดหรือเพศของพนักงาน กรณีที่นำเอาข้อมูลไปใช้ในการวิจัยและพัฒนาบุคลากร อาจเอาไปใช้ได้อย่างไม่เต็มที่ เพราะบอกไม่ได้ว่าพนักงานแต่ละเพศหรือมีช่วงวัยที่ต่างกัน มีความสามารถที่แตกต่างกันจริงหรือไม่ (เพราะข้อมูลไม่มีความสมบูรณ์นั่นเอง)
- สามารถตรวจสอบได้ (verifiable)
ข้อมูลที่ดี ควรตรวจสอบแหล่งที่มาหรือหลักฐานอ้างอิงต่างๆได้ เพื่อให้เกิดความน่าเชื่อถือต่อการนำมาประมวลผล ข้อมูลที่ขาดการตรวจสอบหรือไม่มีความน่าเชื่อถืออาจเป็นกลลวงของคู่แข่งขัน หรือทำให้การประมวลผลได้ข้อมูลผลลัพธ์ที่ผิดตามไปด้วย ซึ่งอาจส่งผลเสียหายในภายหลังได้
2. ข้อมูลภายในสถาบันการศึกษาที่ท่านสังกัดอยู่ มีอะไรบ้าง จงยกตัวอย่างประกอบ
ตอบ สถาบันการศึกษา อาจพอยกตัวอย่างข้อมูลภายในได้ดังนี้
- จำนวนนักศึกษาทั้งหมดในสถาบัน
ซึ่งสามารถแยกหรือหาข้อมูลย่อยๆได้อีกเช่น จำนวนนักศึกษาชาย จำนวนนักศึกษาหญิง จำนวนนักศึกษาระดับปริญญาตรีหรือปริญญาโท เป็นต้น ข้อมูลภายในเหล่านี้อาจดูได้จากหน่วยงานด้านสถิติและทะเบียนนักศึกษาของสถาบันที่สังกัด
- หลักสูตรที่เปิดสอนในระดับต่างๆ
ข้อมูลเกี่ยวกับหลักสูตรที่เปิดสอนในสถาบันการศึกษา ถือเป็นข้อมูลภายในเช่นเดียวกัน ซึ่งในหลายสถาบันอาจมีข้อมูลของหลักสูตรที่ไม่เหมือนกันได้ เช่น ชื่อหลักสูตร ชื่อปริญญา หรือรายละเอียดของหลักสูตรที่ใช้สอน เป็นต้น ข้อมูลภายในเหล่านี้อาจดูได้จากหน่วยงานฝ่ายวิชาการที่กำกับดูแลด้านหลักสูตรโดยตรง
- คณะหรือสาขาวิชาที่มีอยู่
จำนวนคณะหรือสาขาวิชาในแต่ละสถาบันการศึกษา อาจมีจำนวนไม่เท่ากัน เหมือนกับข้อมูลเกี่ยวกับหลักสูตร บางสถาบันอาจมีคณะเพียง 2-3 คณะ บางสถาบันอาจมีมากกว่านั้นได้ บางคณะอาจมีสาขาวิชาสังกัดอยู่เพียงไม่กี่สาขา แต่บางคณะอาจมีอยู่หลายสาขา สามารถทราบข้อมูลเหล่านี้ได้จากหน่วยงานฝ่ายวิชาการเช่นเดียวกัน
3.ไฟล์หรือแฟ้มตารางข้อมูลคืออะไร
ตอบ คือ การนำเอาข้อมูลหลายๆเรคอร์ดที่ต้องการจัดเก็บมาเรียงอยู่ในรูปแบบของแฟ้มตารางข้อมูลเดียวกัน เช่น แฟ้มตารางข้อมูลเกี่ยวกับสินค้าที่ขาย อาจประกอบด้วยเรคอร์ดของสินค้าหลายๆชนิดที่เก็บข้อมูลเกี่ยวกับ รหัสสินค้า ชื่อสินค้า ราคาสินค้า และจำนวนที่ขายได้ เป็นต้น
4. ข้อมูลปฐมภูมิและข้อมูลทุติยภูมิ แตกต่างกันอย่างไร
ตอบ ข้อมูลปฐมภูมิ (primary data) เป็นข้อมูลที่มีการเก็บหรือรวบรวมก่อนครั้งแรก เพื่อนำไปประมวลผลให้เกิดเป็นข้อมูลทุติยภูมิ (secondary data) ในภายหลัง ซึ่งสามารถนำไปใช้ประโยชน์ต่ออีกได้ เช่นค่าเฉลี่ยคะแนนของนักศึกษารายวิชาคอมพิวเตอร์เบื้องต้น สามารถบ่งชี้หรือนำไปวิเคราะห์ค่าทางสถิติอีกได้ถือเป็นข้อมูลทุติยภูมิ ซึ่งอาจได้มาจากการเก็บรวบรวมคะแนนของนักศึกษาในแต่ละกลุ่มการเรียน(section) ที่ได้ลงทะเบียนเรียนในรายวิชานั้น ซึ่งเป็นข้อมูลปฐมภูมิ เป็นต้น
5.ในแง่ของการจัดการข้อมูลนั้น ข้อมูลมีโอกาสซ้ำกันได้หรือไม่ จะมีวิธีแก้ไขได้อย่างไร
ตอบ ข้อมูลอาจมีการซ้ำกันเกิดขึ้นได้อยู่เสมอในบางฟีลด์ เช่น ชื่อสินค้า ชื่อตัว หรือนามสกุล อาจมีการใช้ที่ซ้ำกันได้ การแก้ไขในเรื่องการจัดการข้อมูลคือ สร้างคีย์ฟีลด์ (key field) เพื่อใช้อ้างอิงหรือระบุข้อมูลโดยเฉพาะ เพื่อไม่ให้เกิดปัญหาในการอ้างอิงข้อมูลที่ผิด ซึ่งทำให้สะดวกและมีประสิทธิภาพมากกว่า คีย์ฟีลด์ในตารางแฟ้มข้อมูลจะเป็นตัวอ้างอิงหรือระบุเรคอร์ดที่ต้องการได้ ปกติจะเลือกฟีลด์ที่ไม่มีข้อมูลซ้ำกันเลย เช่น ฟีลด์รหัสนักศึกษา ฟีลด์รหัสสินค้า เป็นต้น
6. การจัดโครงสร้างแฟ้มข้อมูลที่ง่ายและเป็นพื้นฐานมากที่สุด คือแบบใด มีหลักการทำงานอย่างไรบ้าง
ตอบ โครงสร้างแฟ้มข้อมูลแบบเรียงลำดับ (sequential file structure) ถือเป็นการจัดโครงสร้างแฟ้มข้อมูลชนิดพื้นฐานและสามารถใช้งานได้ง่ายที่สุด โดยจะเรียงลำดับเรคอร์ดต่อเนื่องกันไปเรื่อยๆ การอ่านหรือค้นคืนข้อมูลจะข้ามลำดับไปอ่านโดยตรงไม่ได้ เมื่อต้องการอ่านข้อมูลที่เรคอร์ดใดๆ โปรแกรมจะเริ่มอ่านข้อมูลตั้งแต่เรคอร์ดแรกไปเรื่อยๆจนกว่าจะพบเรคอร์ดที่ต้องการอ่าน จึงจะเรียกค้นคืนเรคอร์ดนั้นขึ้นมา
7. โครงสร้างแฟ้มข้อมูลแบบสุ่มสามารถทำงานได้เร็ว เป็นเพราะเหตุใด จงอธิบาย
ตอบ การอ่านข้อมูลในเรคอร์ดใดๆสามารถเข้าถึงได้โดยตรง ไม่ต้องรอหรือผ่านเรคอร์ดแรกๆเหมือนกับแฟ้มข้อมูลแบบเรียงลำดับ ก็สามารถเลือกหรืออ่านค่าได้โดยทันที ซึ่งเป็นโครงสร้างที่มีในสื่อประเภทจานแม่เหล็ก เช่น ดิสก์เก็ตต์หรือฮาร์ดดิสก์
8. เหตุใดจึงต้องนำเอาระบบฐานข้อมูลมาใช้ในการทำงาน จงอธิบายและยกตัวอย่างประกอบ
ตอบ เพื่อลดปัญหาเกี่ยวกับการทำงานที่ต่างคนต่างจัดเก็บข้อมูลแยกกัน ให้สามารถทำงานร่วมกันได้ง่ายและสะดวกมากยิ่งขึ้น โดยจัดเก็บเป็นฐานข้อมูลกลาง เพื่อให้ทุกฝ่ายหรือทุกหน่วยงานสามารถเลือกใช้ได้และยังทำให้ข้อมูลที่ใช้นั้นมีความตรงกัน และลดความซ้ำซ้อนกันของข้อมูลลงไปได้ เช่น แต่เดิมข้อมูลที่อยู่ลูกค้าของฝ่ายขายและฝ่ายการเงินต่างก็แยกเก็บกันเอง เมื่อมีการเปลี่ยนแปลงข้อมูลที่อยู่ของลูกค้าเกิดขึ้น จึงไม่รู้ว่าจะใช้ที่อยู่ใดในการติดต่อดี เพราะฝ่ายหนึ่งอาจมีการแก้ไขให้เป็นค่าที่อยู่ในปัจจุบันแล้ว แต่อีกฝ่ายหนึ่งอาจไม่ทราบและไม่มีการแก้ไขใดๆ หากจะติดต่อกับลูกค้าจริงๆอาจมีปัญหาขึ้น แต่เมื่อนำเอาระบบฐานข้อมูลมาใช้ ซึ่งเป็นการเก็บข้อมูลไว้ที่เดียวกัน จึงช่วยลดปัญหาเหล่านี้ลงไปได้
9.ความซ้ำซ้อนกันของข้อมูล (data redundancy) คืออะไร จงอธิบาย
ตอบ คือการจัดเก็บข้อมูลไว้แยกกันหลายที่ ข้อมูลที่ต้องการจึงอาจมีบางส่วนที่ซ้ำซ้อนกันได้ กล่าวคือมีข้อมูลชุดเดียวกันถูกจัดเก็บใน 2 แฟ้มข้อมูลหรืออาจมากกว่านั้น ทำให้เปลืองพื้นที่ในการจัดเก็บข้อมูลโดยเปล่าประโยชน์ และเมื่อใดที่มีการเปลี่ยนแปลงข้อมูลในแฟ้มข้อมูลนั้น อาจจำเป็นต้องตามไปแก้ไขทุกๆแฟ้มที่จัดเก็บแยกกันอีกเพื่อให้ตรงกัน จึงทำให้เสียเวลาเป็นอย่างมาก
10.DBMS มีประโยชน์อย่างไรต่อการใช้งานฐานข้อมูล
ตอบ ระบบการจัดการฐานข้อมูลหรือ DataBase Management Systems เป็นเสมือนตัวกลางที่อำนวยความสะดวกให้กับผู้ใช้งานฐานข้อมูลได้เป็นอย่างดี โดยที่ไม่จำเป็นต้องทราบถึงโครงสร้างทางกายภาพของข้อมูลในระดับที่ลึกมากก็สามารถดูแลรักษาฐานข้อมูลได้ รมถึงควบคุมการเข้าถึงข้อมูลต่างๆได้ด้วยอีกทั้งยังทำให้การค้นคืนข้อมูลต่างๆสามารถทำได้อย่างง่ายดาย ซึ่งมักจะมีภาษาการจัดการกับข้อมูลโดยเฉพาะเป็นของตนเอง
11. ภาษาที่ใช้สอบถามหรือเข้าถึงข้อมูลโดยผ่านรูปแบบการใช้คำสั่งเฉพาะ เรียกว่าภาษาอะไร จงยกตัวอย่างของคำสั่งประกอบ
ตอบ ภาษาคิวรี่เป็นภาษาที่ใช้สำหรับสอบถามหรือเข้าถึงข้อมูลฐานข้อมูลได้ ตัวอย่างของภาษาที่ได้รับความนิยมมากที่สุดคือ ภาษา SQL ซึ่งเป็นคำสั่งภาษาที่นิยมใช้กันในระบบการจัดการฐานข้อมูลเชิงสัมพันธ์ในปัจจุบันมากที่สุด ตัวอย่างของคำสั่งต่าง ๆ เช่น
- DELETE
ใช้สำหรับลบข้อมูลหรือเรคอร์ดใดๆในฐานข้อมูล
-INSERT
ใช้สำหรับเพิ่มข้อมูลหรือเรคอร์ดใดๆเข้าไปในฐานข้อมูล
- SELECT
ใช้สำหรับเลือกข้อมูลหรือเรคอร์ดใดๆที่ต้องการจากฐานข้อมูล
-UPDATE
ใช้สำหรับแก้ไขข้อมูลหรือเรคอร์ดใดๆในฐานข้อมูล
12. ความสามารถโดยทั่วไปของ DBMS มีอะไรบ้าง จงอธิบาย
ตอบ คุณสมบัติหรือความสามารถโดยทั่วไปของ DBMS พอสรุปได้ดังนี้
-สร้างฐานข้อมูล
โดยปกตินั้น การออกแบบฐานข้อมูลอาจต้องมีการเก็บข้อมูลหรือขั้นตอนการทำงานของระบบที่จะพัฒนาเสียก่อนเพื่อให้ทราบได้ว่าต้องการฐานข้อมูลอะไรบ้าง ตารางที่จัดเก็บมีกี่ตาราง จากนั้นจึงนำเอามาสร้างเป็นฐานข้อมูลจริงใน DBMS ทั่วโป โดยผ่านเครื่องมือที่มีอยู่ในโปรแกรมซึ่งอาศัยภาษา SQLในการสั่งงาน
- เพิ่ม เปลี่ยนแปลงแก้ไขและลบข้อมูล
ฐานข้อมูลที่สร้างขึ้นด้วย DBMS นั้น สามารถเพิ่มค่า เปลี่ยนแปลงหรือลบข้อมูลต่างๆได้ทุกเมื่อโดยเข้าไปจัดการได้ที่ DBMS โดยตรง เช่น เพิ่มค่าเรคอร์ดบางเรคอร์ดที่ตกหล่น ลบหรือแก้ไขข้อมูลบางเรคอร์ดที่ต้องการ เป็นต้น
- จัดเรียงและค้นหาข้อมูล
DBMS สามารถจัดเรียงข้อมูลได้โดยง่าย ซึ่งสามารถเลือกได้ว่าจะให้จัดเรียงแบบใด เรียงข้อมูลจากค่าน้อยไปหาค่ามากหรือเรียงตามลำดับวันเวลา เป็นต้น นอกจากนั้นยังสามารถระบุค่าเพียงบางค่าเพื่อค้นหาข้อมูลได้โดยง่าย เช่น ป้อนอักษร A เพื่อค้นหาข้อมูลสินค้าที่ขึ้นต้นด้วยตัวอักษร A ได้ เป็นต้น
- สร้างรูปแบบและรายงาน
การแสดงผลบนหน้าจอ (form) และพิมพ์ผลลัพธ์รายการต่างๆออกมาเป็นรายงาน (report) เป็นอีกคุณสมบัติหนึ่งที่ DBMS สามารถทำได้ ช่วยให้ผู้ใช้งานที่เกี่ยวข้องกับฐานข้อมูลดังกล่าว สามารถตรวจสอบหรือแก้ไขรายการที่มีอยู่นั้นได้โดยง่าย


ไม่มีความคิดเห็น:

แสดงความคิดเห็น