สถิติและข้อมูล เบื้องต้นสำหรับชั้นมัธยมศึกษาปีที่ 5
สถิติ คืออะไร
คำว่า สถิติ (Statistics) มีความหมาย 2 แบบด้วยกัน ความหมายแรก คือ ‘สถิติศาสตร์’ ซึ่งเป็นวิชาที่ว่าด้วยการจัดเก็บ รวบรวม วิเคราะห์ สรุปผล และนำเสนอข้อมูล เพื่อนำข้อมูลไปใช้สำหรับการตัดสินใจ หรือการคาดคะเนข้อมูลบางอย่าง และเป็นความหมายที่เราจะมาพูดถึงกันในบทความนี้ ส่วนสถิติ ในอีกความหมายหนึ่ง คือ ตัวเลขที่ได้จากการเก็บรวบรวมข้อมูล ใช้บ่งบอกข้อเท็จจริงบางอย่างที่เราสนใจ แต่ก็มีบางครั้งที่ผู้พูดอาจจะนำข้อมูลสถิติไปใช้เป็นกลยุทธ์ลวงตาเรา จนทำให้ผู้ที่ไม่เข้าใจเรื่องสถิติ ตกเป็นเหยื่อของโฆษณาชวนเชื่อได้ เช่น “80% ของผู้ใช้ผลิตภัณฑ์นี้บอกว่าผิวกระจ่างใสขึ้นทันตาเห็น !” แต่คำว่า 80% ในที่นี้อาจจะมาจากผู้ทดลองใช้ผลิตภัณฑ์แค่ 5-10 คน ซึ่งไม่สามารถเป็นตัวแทนของผู้ใช้จริงทั้งหมด
ดังนั้น สถิติเลยไม่ใช่เรื่องของตัวเลขบนกราฟหรือแผนภูมิเพียงอย่างเดียว แต่เป็นเรื่องที่ช่วยให้เรารู้เท่าทันตัวเลขและข้อมูลต่าง ๆ ในชีวิตจริงว่าน่าเชื่อถือมากน้อยแค่ไหน และนำไปใช้วิเคราะห์อะไรได้บ้าง โดยเฉพาะในยุคที่โลกโซเชียลมีข่าวสารเยอะแยะไปหมดในปัจจุบัน
ประชากรและตัวอย่าง
ประชากร (population) คือ กลุ่มของหน่วยทั้งหมดในเรื่องที่สนใจศึกษา หน่วยในที่นี้อาจเป็นคน สัตว์ หรือสิ่งของก็ได้ เช่น ถ้าสนใจศึกษานักเรียนชั้นมัธยมศึกษาปีที่ 6 ประชากรก็จะหมายถึงนักเรียนทุกคนที่กำลังเรียนอยู่ชั้นมัธยมศึกษาปีที่ 6 แต่ถ้าประชากรมีจำนวนมาก อย่างการสอบถามความคิดเห็นของคนไทยทั้งประเทศ คงเป็นเรื่องที่เก็บข้อมูลได้ยากและใช้เวลานาน ดังนั้น เราเลยต้องสุ่มเลือกประชากรบางส่วน (เหมือนเป็นตัวแทนหมู่บ้าน) ออกมาเพื่อสอบถามแล้วสรุปผลความคิดเห็นของประชากรทั้งหมด ซึ่งตัวแทนของประชากรที่เราสุ่มออกมานั้นเรียกว่า กลุ่มตัวอย่าง (sample)
แต่ข้อควรระวังของการสุ่มตัวอย่าง คือ หากเกิดความลำเอียงอาจทำให้สรุปผลผิดพลาดได้ เช่น การสอบถามความคิดเห็นของวัยรุ่น มากกว่าช่วงวัยอื่น ๆ อาจจะทำให้ผลออกมา ไม่ตรงกับคำตอบของคนทั้งประเทศได้ ดังนั้น การสุ่มตัวอย่างที่ดี ควรกระจายให้ทั่วทุกกลุ่มประชากร อาจใช้วิธีแบ่งกลุ่มตัวอย่างออกเป็นหลาย ๆ ช่วงอายุ แล้วค่อยสุ่มมาจากแต่ละกลุ่มอายุตามอัตราส่วน และหลังจากสุ่มตัวอย่างแล้ว ลักษณะต่าง ๆ ที่เราสนใจศึกษาจากประชากรหรือกลุ่มตัวอย่างเหล่านี้ว่า ตัวแปร (variable) และเรียกค่าที่ได้ของตัวแปรนี้ว่า ข้อมูล
ตัวอย่าง สำรวจคณะที่นักเรียนชั้นมัธยมศึกษาปีที่ 6 ต้องการศึกษาต่อ โดยการสุ่มถามนักเรียนจำนวน 40 คน พบว่ามีผู้สนใจศึกษาต่อคณะสถาปัตยกรรมศาสตร์ จำนวน 10 คน คณะแพทยศาสตร์ จำนวน 10 คน คณะนิติศาสตร์จำนวน 5 คน คณะอื่น ๆ อีกจำนวน 15 คน
- ประชากร คือ นักเรียนชั้นมัธยมศึกษาปีที่ 6 ทั้งหมด
- กลุ่มตัวอย่าง คือ นักเรียนชั้นมัธยมศึกษาปีที่ 6 จำนวน 40 คนที่ถูกสุ่มถาม
- ตัวแปร คือ คณะที่นักเรียนสนใจศึกษาต่อ
- ข้อมูล คือ คณะที่นักเรียนตอบว่าสนใจศึกษาต่อ เช่น คณะแพทยศาสตร์ คณะสถาปัตยกรรมศาสตร์
ประเภทของข้อมูล
1.การแบ่งประเภทตามแหล่งที่มา
- ข้อมูลปฐมภูมิ คือ ข้อมูลที่เรารวบรวมมาเอง หรือนำมาจากต้นกำเนิดของข้อมูลโดยตรง มีความน่าเชื่อถือสูง แต่อาจมีค่าใช้จ่ายในการเก็บรวบรวมข้อมูลเอง เช่น พี่สาวคนโตตกลงกับน้อง ๆ ว่าวันหยุดยาวนี้ไปเที่ยวที่ไหนดี ข้อมูลนี้จะเป็นข้อมูลปฐมภูมิสำหรับพี่สาว
- ข้อมูลทุติยภูมิ คือ ข้อมูลที่รวบรวมมาจากแหล่งอื่นอีกที เช่น พี่สาวคนโต รวบรวมความคิดเห็นของน้อง ๆ มาบอกคุณพ่อคุณแม่ว่าแต่ละคนอยากไปเที่ยวที่ไหนกันบ้าง ข้อมูลนี้จะกลายเป็นข้อมูลทุติยภูมิสำหรับคุณพ่อคุณแม่
2.การแบ่งประเภทตามระยะเวลาที่เก็บข้อมูล
- ข้อมูลอนุกรมเวลา คือ ข้อมูลที่เก็บค่าต่อเนื่องในแต่ละเวลา เช่น รายจ่ายของแต่ละวันในหนึ่งเดือน
- ข้อมูลแบบตัดขวาง คือ ข้อมูลที่เจาะจงเวลาลงไปว่าสนใจค่าของเวลาไหน เช่น ข้อมูลปริมาณน้ำฝนของวันนี้ในแต่ละจังหวัด
3.การแบ่งประเภทตามลักษณะของข้อมูล
- ข้อมูลเชิงปริมาณ คือ ข้อมูลที่เก็บเป็นค่าตัวเลข นำไปบวกลบคูณหารกันได้ เช่น ส่วนสูง อายุ คะแนนสอบ แต่ไม่ใช่ตัวเลขทั้งหมดจะเป็นข้อมูลเชิงปริมาณ อย่างการวัดระดับความพึงพอใจ แม้จะมีเรต 1-5 แต่ตัวเลขเหล่านี้ เป็นตัวแทนของความพอใจน้อยไปหามาก ไม่ได้หมายถึงตัวเลขที่นำมาคำนวณได้จริง ๆ ดังนั้น ข้อมูลระดับความพึงพอใจที่ว่านี้จึงเป็นข้อมูลเชิงคุณภาพ
- ข้อมูลเชิงคุณภาพ คือ ข้อมูลที่บ่งบอกลักษณะ ไม่สามารถระบุเป็นตัวเลขได้ เช่น เพศ อาชีพ อาหารที่ชอบ และระดับความพึงพอใจอย่างที่ได้กล่าวไปข้างต้น
สถิติเชิงพรรณาและสถิติเชิงอนุมาน
การนำสถิติไปใช้งานนั้น สามารถแบ่งได้เป็น 2 ประเภท คือ
- สถิติเชิงพรรณา
คำว่าพรรณนา แปลว่าบรรยายหรืออธิบาย ดังนั้นสถิติเชิงพรรณนาจึงหมายถึง การบรรยายหรือวิเคราะห์ข้อมูล โดยอาจเป็นข้อมูลเชิงปริมาณหรือคุณภาพก็ได้ โดยมักจะใช้เพื่อสรุปผลข้อมูลที่มีอยู่จำนวนมาก เช่น การหาอายุเฉลี่ยของลูกค้าประจำร้าน A เป็นต้น
- สถิติเชิงอนุมาน
คำว่า อนุมาน หมายถึง ทำนายหรือคาดการณ์ ดังนั้น สถิติเชิงอนุมานจึงหมายถึง การใช้ข้อมูลจากกลุ่มตัวอย่างเพื่อทำนายลักษณะของข้อมูลประชากรทั้งหมด อย่างการสอบถามกิจกรรมยามว่างของนักเรียนทั้งโรงเรียน การที่เราเลือกกลุ่มตัวอย่างจากนักเรียนบางห้อง มาสอบถามแล้วสรุปผล โดยคาดว่าน่าจะเป็นกิจกรรมที่นักเรียนส่วนใหญ่ชอบทำในเวลาว่าง เรียกว่าเป็นการใช้สถิติเชิงอนุมานนั่นเอง
-ขอบคุณข้อมูล https://blog.startdee.com/