สรุปสูตร สถิติ ทั้งหมด
การหาค่าเฉลี่ยเลขคณิตข้อมูลที่แจกแจงความถี่
วิธีการ หาค่าเฉลี่ย มัธยฐาน และฐานนิยม
การวัดแนวโน้มเข้าสู่ส่วนกลาง
เปอร์เซนต์ไทล์ เดไซล์ ควอร์ไทล์
เปอร์เซนต์ไทล์ เดไซล์ ควอร์ไทล์ เป็นการวัดตำเเหน่งของข้อมูลชุดหนึ่งๆ เมื่อแบ่งคะแนนหรือข้อมูลทั้งหมดออกเป็น 100 ส่วน 10 ส่วน และ 4 ส่วน ตามลำลับ เพื่อใช้ในการเปรียบเทียบข้อมูล
คะแนน |
ความถี่ |
10-19 |
2 |
20-29 |
8 |
30-39 |
9 |
40-49 |
1.4 |
50-59 |
8 |
60-69 |
6 |
70-79 |
3 |
N = 50 |
คะแนน |
ความถี่ |
ความถี่สะสม |
10-19 |
2 |
2 |
20-29 |
8 |
10 |
30-39 |
9 |
19 |
40-49 |
1.4 |
33 |
50-59 |
8 |
41 |
60-69 |
6 |
47 |
70-79 |
3 |
50 |
N = 50 |
การวัดการกระจายของข้อมูล
การวัดการกระจายของข้อมูล
การวัดการกระจายของข้อมูล หมายถึงการคำนวณว่าข้อมูลชุดใดชุดหนึ่งกระจายออกจากกัน หรืออยู่ห่างกันมากน้อยเพียงใด ถ้าคะแนนของข้อมูลในชุดใดอยู่ห่างกันน้อยหรือมีขนาดใกล้เคียงกัน เรียกว่าข้อมูลชุดนั้นมีการกระจายน้อย แต่ถ้าคะแนนของข้อมูลในชุดใดอยู่ห่างกันมาก เรียกว่าข้อมูลชุดนั้นมีการกระจายมาก
การอธิบายลักษณะของข้อมูลโดยวิธีการวัดแนวโน้มเข้าสู่ส่วนกลางเป็นการอธิบาย ลักษณะของข้อมูลเพียงลักษณะเดียว ส่วนลักษณะอื่นๆไม่สามารถแสดงได้ด้วยการวัดแนวโน้มเข้าสู่ส่วนกลาง ตัวอย่าง เช่น
ข้อมูลชุดที่ 1 : 5 11 18 25 41
ข้อมูลชุดที่ 2 : 14 20 21 22 23
มัชฌิมเลขคณิตของข้อมูลชุดที่ 1 = (5 + 11 + 18 + 25 + 41) / 5
= 100 / 5
= 20
มัชฌิมเลขคณิตของข้อมูลชุดที่ 2 = (14 + 20 + 21 + 22 + 23) / 5
= 100 / 5
= 20
จะเห็นว่าค่ามัชฌิมเลขคณิตของข้อมูลทั้งสองชุดมีค่าเท่ากัน โดยที่ลักษณะของข้อมูลทั้งสองชุดต่างกัน ข้อมูลชุดที่ 1 ประกอบด้วยคะแนนที่มีค่าสูงสุดและต่ำสุดแตกต่างกันมาก ส่วนข้อมูลชุดที่ 2 ประกอบด้วยคะแนนที่มีค่าใกล้เคียงกัน ซึ่งการใช้มัชฌิมเลขคณิตเป็นตัวแทนของข้อมูลทั้งสองชุด ทำให้ผู้ที่ไม่ทราบข้อมูลทั้งสองชุดมีความเข้าใจผิดว่าข้อมูลทั้งสองชุดนั้น มีลักษณะเหมือนกัน ดังนั้นจึงจำเป็นต้องมีการวัดการกระจายของข้อมูลด้วย เพื่อทำให้ทราบลักษณะของข้อมูลชัดเจนยิ่งขึ้น
การวัดการกระจายของข้อมูล สามารถทำได้ ดังนี้ คือ
- พิสัย (Range)
- ส่วนเบี่ยงเบนควอร์ไทล์ (Quartile Deviation)
- ส่วนเบี่ยงเบนเฉลี่ย (Mean Deviation or Average Deviation)
- ส่วนเบี่ยงเบนมาตรฐาน (Standard Deviation)
5.2 พิสัย (Range)
พิสัย หมายถึงความแตกต่างระหว่างคะแนนสูงสุดกับคะแนนต่ำสุดในข้อมูลชุดหนึ่งๆ พิสัยใช้ในการวัดการกระจายของข้อมูลได้ไม่ละเอียดนัก นิยมใช้กรณีเมื่อต้องการความรวดเร็วเท่านั้น ข้อเสียของพิสัยของข้อมูลแต่ละชุด คือมีการใช้เฉพาะคะแนนสูงสุดและคะแนนต่ำสุดเท่านั้น บางครั้งทำให้เกิดการเข้าใจถึงลักษณะของข้อมูลผิดไปได้ ตัวอย่าง เช่น
ข้อมูลชุดที่ 1 : 5 30 32 39 42 50
ข้อมูลชุดที่ 2 : 42 44 46 48 49 51
พิสัยของข้อมูลชุดที่ 1 = 50 – 5 = 45
พิสัยของข้อมูลชุดที่ 2 = 51 – 42 = 9
จะเห็นว่าพิสัยของข้อมูลทั้งสองชุดต่างกันมาก ทั้งๆที่ข้อมูลทั้งสองชุดนั้นมีลักษณะคล้ายคลึงกันมาก
7.ค่ามาตรฐาน พื้นที่ใต้เส้นโค้งปกติ
เส้นโค้งปกติมาตรฐาน
- เส้นโค้งปกติมาตรฐาน คือ เส้นโค้งที่มีรูปร่างเป็นรูประฆังคว่ำและพื้นที่ใต้กราฟทั้งหมดเท่ากับ 1 โดยค่ามาตรฐาน (z) จะเป็นค่าที่แสดงในแนวแกน x
- โดยที่จะมีเส้นแบ่งตรงกลาง คือ เส้นที่ค่า z=0 ซึ่งจะทำให้พื้นที่ทั้งสองข้างเท่ากัน
- และรูปนี้เป็นสมาตรกัน นั่นคือ ถ้าห่างออกไปจากแกนตรงกลาง (z=0) เท่ากันจะได้ว่าพื้นที่สองฝั่งเท่ากัน