ในการวิเคราะห์ข้อมูลเบื้องต้น จะต้องทราบความหมายของคาว่า ตัวแปร ดังนี้
ตัวแปร คือ ลักษณะของประชากรที่สนใจจะศึกษาวิเคราะห์ ซึ่งลักษณะนั้นๆ สามารถเปลี่ยนค่าได้ ไม่ว่าจะเป็นตัวแปรเชิงคุณภาพหรือตัวแปรเชิงปริมาณ
ตัวอย่างของตัวแปรเชิงคุณภาพ เข่น ศาสนา เพศ ประเทศ โรคประจาตัว สีผิว เป็นต้น
ตัวอย่างของตัวแปรเชิงปริมาณ เช่น อายุ น้าหนัก ส่วนสูง คะแนนสอบ รายได้ รายจ่าย จานวนนักเรียน จานวนวัน ราคาสินค้า เป็นต้น
ถ้าในการสอบวิชาคณิตศาสตร์ มีคะแนนเต็ม 5 คะแนน ปรากฏว่ามีเด็ก 3 คนสอบวิชานี้ได้ 1, 3 และ 4 คะแนนตามลาดับ คะแนน 1, 3 และ 4 คะแนนนี้ เรียกว่า ค่าจากการสังเกต และเรียกคะแนนที่เป็นไปได้ทั้งหมด ซึ่งมี 6 ค่า นั่นคือ 0, 1, 2, 3, 4, 5 ว่า ค่าที่เป็นไปได้
กรณีที่ 1 เมื่อโจทย์กำหนดข้อมูลมาให้ มีขั้นตอนในการสร้างดังนี้
1. พิจารณาจำนวนอันตรภาคชั้นตามที่ต้องการ ซึ่งโดยทั่วๆไปจะนิยมสร้างตั้งแต่ 7 ถึง 15 อันตรภาค
ชั้น หรือไม่ควรต่ำกว่า 5 อันตรภาคชั้น และไม่นิยมให้บางอันตรภาคชั้นมีความถี่เป็น 0
|
ความกว้างของอันตรภาคชั้น = พิสัย / จำนวนชั้น
เมื่อ พิสัย คือ ผลต่างระหว่างข้อมูลที่มีค่าสูงสุดกับข้อมูลที่มีค่าต่ำสุด (เศษปัดเป็นจำนวนเต็ม)
|
2. หาช่วงคะแนนของแต่ละอันตรภาคชั้น โดยให้ข้อมูลค่าต่ำสุดเป็นค่าต่าสุดของอันตรภาคชั้นชั้นแรก
แล้วหาความถี่
3. หาจำนวนคะแนนแล้วบันทึกเป็นรอยขีด (ควรทาในกระดาษบันทึกคะแนน) แล้วนับรอยขีดในแต่ละ
อันตรภาคชั้น เป็นความถี่ในอันตรภาคชั้นนั้นๆ
กรณีที่ 2 เมื่อโจทย์กาหนดข้อมูลและจุดกึ่งกลางมาให้ มีขั้นตอนการสร้างดังนี้
1. หาความกว้างของอันตรภาคชั้น (ได้จากผลต่างของจุดกึ่งกลางชั้นติดกัน)
2. หาขอบบน ขอบล่าง ของแต่ละอันตรภาคชั้น
จาก ขอบบน = จุดกึ่งกลาง + 1/2 ของความกว้างของอันตรภาคชั้น
ขอบล่าง = จุดกึ่งกลาง+ 1/2 ของความกว้างของอันตรภาคชั้น
3. หาค่าสูงสุดและค่าต่าสุดในแต่ละอันตรภาคชั้น
จาก ค่าสูงสุด = ขอบบน – 0.5 (เมื่อข้อมูลเป็นจานวนเต็ม)
ค่าต่าสุด = ขอบล่าง + 0.5 (เมื่อข้อมูลเป็นจานวนเต็ม)
4. หารอยขีด และนับรอยขีดในแต่ละอันตรภาคชั้น เป็นความถี่ของอันตรภาคชั้นนั้นๆ
หมายเหตุ ถ้าตารางแจกแจงความถี่มีอันตรภาคชั้นเป็นทศนิยมการกาหนดอันตรภาคชั้นอาจกาหนดให้อยู่ใน
รูปช่วงได้
ตัวอย่าง ตารางแจกแจงความถี่ที่มีอันตรภาคชั้นเป็นทศนิยม
| อันตรภาคชั้น |
ความถี่ |
| 10.0 – 19.9 |
2 |
| 20.0 – 29.9 |
5 |
| 30.0 – 39.9 |
8 |
| 40.0 – 49.9 |
12 |
| 50.0 – 59.9 |
3 |
จากตารางแจกแจงความถี่ที่มีอันตรภาคชั้นเป็นทศนิยม อาจกาหนดอันตรภาคชั้นให้อยู่ในรูปช่วงได้ดังนี้
| อันตรภาคชั้น |
ความถี่ |
| 10 </= x < 20 |
2 |
| 20 </= x < 30 |
5 |
| 30 </= x < 40 |
8 |
| 40 </= x < 50 |
12 |
| 50 </= x < 60 |
3 |
ตัวอย่าง กำหนดข้อมูลต่อไปนี้ เป็นคะแนนสอบวิชาคณิตศาสตร์ซึ่งมีคะแนนเต็ม 50 คะแนนของนักเรียน
40 คน
39 37 19 35 45 33 30 49 28 37 40 39 34 42 18 22 32 28 39 24
26 34 15 40 46 41 32 26 44 31 32 38 39 33 33 34 42 29 33 31
จงสร้างตารางแจกแจงความถี่ของคะแนนทั้งหมด เมื่อกำหนดให้
ก. ให้มี 7 อันตรภาคชั้น
ข. ให้มีจุดกึ่งกลางของอันตรภาคชั้นเป็น 17.5, 23.5, 29.5, …
วิธีทำ ก. ความกว้างของแต่ละอันตรภาคชั้น = (49-15) / 7 = 5
ตารางแจกแจงความถี่
| คะแนนสอบวิชาคณิตศาสตร์ |
ความถี่ |
| 15 – 19 |
3 |
| 20 – 24 |
2 |
| 25 – 29 |
6 |
| 30 – 34 |
12 |
| 35 – 39 |
8 |
| 40 – 44 |
6 |
| 45 – 49 |
3 |
ข. จุดกึ่งกลางคือ 17.5, 23.5, 29.5, …
ความกว้างของแต่ละอันตรภาคชั้น = 23.5 – 17.5 = 6
ขอบบนของอันตรภาคชั้นแรก คือ 17.5 + 6/2 = 20.5
ค่าสูงสุด 20.5 – 0.5 = 20
ขอบล่างของอันตรภาคชั้นแรก คือ 17.5 – 6/2 = 14.5
ค่าต่ำสุด 14.5 + 0.5 = 15
สร้างตารางแจกแจงความถี่ ดังนี้
| คะแนนสอบวิชาคณิตศาสตร์ |
ความถี่ |
| 15 – 20 |
3 |
| 21 – 26 |
4 |
| 27 – 32 |
9 |
| 33 – 38 |
11 |
| 39 – 44 |
10 |
| 45 – 50 |
3 |
ช่วงของข้อมูลที่แบ่งออกเป็นช่วงๆ ในแต่ละช่วงคือค่าที่เป็นไปได้ของข้อมูล โดยอันตรภาคชั้นจะเกิดขึ้นได้ก็ต่อเมื่อตารางแจกแจงความถี่นั้นเป็นประเภทการแจกแจงความถี่แบบจัดกลุ่ม โดยถ้าเป็นแบบไม่ได้จัดกลุ่มก็จะเป็นข้อมูลเดี่ยว ๆ ไม่ได้เป็นช่วง
ขอบบนของอันตรภาคชั้นใด หมายถึง ค่ากึ่งกลางระหว่างค่าที่เป็นไปได้สูงสุดของอันตรภาคชั้นนั้น กับค่าที่เป็นไปได้ต่ำสุดของอันตรภาคชั้นติดกันถัดไปเช่น อันตรภาคชั้น 21 – 30 และ 31 – 40 จะสามารถคำนวณขอบบนของอัรตรภาคชั้นของ 21 – 30 ได้โดยนำเอาค่าสูงสุดของอันตรภาคชั้น 21 – 30 คือค่า 30 มารวมกับค่าต่ำสุดของอันตรภาคชั้น 31 – 40 นั่นคือ 31 พอรวมค่าแล้วนำมาหาร 2 จะได้เท่ากับ 30.5 ซึ่งเป็นขอบบนของอันตรภาคชั้น 21 – 30 และยังเป็นขอบล่างของอันตรภาคชั้น 31 – 40 ด้วย
ผลต่างของขอบบนและขอบล่างของอันตรภาคชั้นนั้น นิยมเขียนแทนด้วย I เช่น อันตรภาคชั้น 21 – 30 มีความกว้างเท่ากับ 20.5 – 30.5 = 10 อันตรภาคชั้น 31 – 40 มีความกว้างเท่ากับ 30.5 – 40.5 = 10 เป็นต้น
จุดกึ่งกลางของอันตรภาคชั้นใด คือ ค่าเฉลี่ยของช่วงคะแนนในอันตรภาคชั้นนั้นๆ จุดกึ่งกลางของอันตรภาคชั้นใด = (ขอบบน + ขอบล่าง) / 2 (ของอันตรภาคชั้นนั้นๆ)
ความถี่ของอันตรภาคชั้นใดหมายถึงจำนวนข้อมูล (ค่าจากการสังเกต) ที่ปรากฏอยู่ในช่วงคะแนนหรืออันตรภาคชั้นนี้
ตารางแจกแจงความถี่ข้อมูลนับเป็นอีกหนึ่งเครื่องมือที่มีความสำคัญและมีความง่ายต่อการเข้าใจในการสรุปข้อมูลที่มีความซับซ้อนให้กระชับ ผู้อ่านสามารถตีความได้ภายในระยะเวลาอันสั้นส่งผลให้เป็นอีกหนึ่งเครื่องมือที่หลายคนมักจะใช้ในการนำเสนอข้อมูล ดังนั้นการเรียนรู้ถึงการแจกแจงความถี่ข้อมูลจึงเป็นเรื่องสำคัญสำหรับมือใหม่ที่กำลังหัดเรียนรู้เรื่องของสถิติ