สรุปเนื้อหา สถิติ (Statistics) ม.3
แผนภาพกล่อง เป็นการนำเสนอข้อมลู โดยนำค่าต่ำสุด ค่าสูงสุด ควอร์ไทล์ที่หนึ่ง ควอร์ไทล์ที่สอง และ ควอร์ไทล์ที่สาม มาสร้างเป็นรูปส่ีเหล่ียมผืนผ้า 2 รูปติดกัน จากการแบ่งข้อมูลทีมีการจัดเรียงลำดับค่าจากน้อยไปมาก แล้วแบ่งข้อมลู ออกเป็น 4 ส่วนเท่า ๆ กัน ซึ่ง แต่ละส่วนคิดเป็น ร้อยละ 25 ของจำนวนข้อมูลทั้งหมด
การอ่านและการแปลความแผนภาพกล่อง เป็น ดังนี้
1. การกระจายแบบเบ้ขวา คือ ข้อมูล ท่ีอยู่ระหว่าง Q1 กับ Q2 มีการกระจายน้อยกว่า
ข้อมูลที่อยู่ระหว่าาง Q2 กับ Q3 (พ้ืนทีของรูปสี่เหลี่ยมผืนผ้าทางด้านซ้าย น้อยกว่าด้านขวา)
2. การกระจายแบบเบซ้ ย คือ ข้อมูล ที่อยู่ระหว่าง Q1 กับ Q2 มีการกระจายมากกว่าข้อมูลทที่อยู่ระหว่าง Q2 กับ Q3 (พื้นที่ของรูปสี่เหลี่ยมผืนผ้าทางด้านซ้ายมากกว่าด้านขวา)
3. การกระจายแบบปกติ คือ ข้อมูลที่อยู่ระหว่าง Q1 กับ Q2 มีการกระจายเท่ากับข้อมูลที่อยู่ระหว่าง Q2 กับ Q3 (พื้นท่ีของรูปสี่เหลียมผืนผ้าทางด้านซ้ายเท่ากับ ด้านขวา)
การวัดค่ากลางของข้อมูล เป็นการหาค่ากลางมาเป็นตัวแทนของข้อมูลแต่ละชุด ซึ่งมีวิธีการหาได้หลายวิธีที่นิยมกัน ได้แก่
- ค่าเฉลี่ยเลขคณิต
- มัธยฐาน
- ฐานนิยม
ค่าเฉลี่ยเลขคณิต (Arithmetic mean)
ค่าเฉลี่ยเลขคณิต คือ ค่าของผลรวมของค่าสังเกตของข้อมูลทั้งหมดหารด้วยจำนวนข้อมูลทั้งหมด เรียกสั้นๆ ว่า ค่าเฉลี่ย ซึ่งในการหาค่าเฉลี่ยเลขคณิตจะประกอบด้วยการหาค่าเฉลี่ยของข้อมูลที่ไม่ได้แจกแจงความถี่ และ การหาค่าเฉลี่ยของข้อมูลที่แจกแจงความถี่
การหาค่าเฉลี่ยเลขคณิตของข้อมูลที่ไม่แจกแจงความถี่
(ข้อมูลไม่ได้จัดอยู่ในรูปตารางแจกแจงความถี่) มีสูตร ดังนี้
ค่าเฉลี่ยเลขคณิต = ผลรวมของข้อมูลทั้งหมด ⁄จำนวนของข้อมูล
หรือ ผลรวมของข้อมูล = ค่าเฉลี่ยเลขคณิต x จำนวนของข้อมูล
หรือ จำนวนข้อมูลทั้งหมด = ผลรวมของข้อมูลทั้งหมด ⁄ ค่าเฉลี่ยเลขคณิต
ตัวอย่างที่ 1 จงหาค่าเฉลี่ยเลขคณิตของข้อมูล 20 22 25 27 24 28 26 28
วิธีทำ ค่าเฉลี่ยเลขคณิต = ผลรวมของข้อมูลทั้งหมด ⁄จำนวนของข้อมูล
ค่าเฉลี่ยเลขคณิต = (20 +22+ 25 + 27+ 24 + 28 + 26 + 28 ) / 8
= 200/8 = 25
ดังนั้น ค่าเฉลี่ยเลขคณิต คือ 25
การแจกแจงความถี่
คือการนำข้อมูลมาแจกแจงเป็นช่วง ( อันตรภาคชั้น ) โดยมีการเรียงจากข้อมูลที่น้อยไปหาข้อมูลที่มาก และนับจำนวนความถี่ ของข้อมูลแต่ละกลุ่มข้อมูล เหมาะกับข้อมูลดิบที่มีจำนวนไม่มากนัก
ส่วนประกอบของตารางแจกแจงความถี่ที่ควรทราบ
- อันตรภาคชั้น คือ ช่วงของข้อมูลที่แบ่งข้อมูล
- ความถี่ (f) คือ จำนวนของข้อมูลที่อยู่ในแต่ละอันตรภาคชั้น
- ความถี่สะสม (F) คือ ผลรวมของความถี่ในอันตรภาคชั้นรวมกับชั้นที่ตำกว่าทั้งหมด
-
- จำนวนข้อมูล ( N) คือ จำนวนข้อมูลทั้งหมด
- ขีดจำกัดบน คือ ข้อมูลที่มีค่าสูงสุดในแต่ละอันตรภาคชั้น
- ขีดจำกัดล่าง คือ ข้อมูลที่มีค่าต้ำสุดในแต่ละอันตรภาคชั้น
- ขอบบน เป็นตัวเลขที่บอกถึงค่ากึ่งกลางของขีดจำกัดบนกับขีดจำกัดล่างของชั้นที่อยู่สูงกว่า 1 ชั้น คำนวณได้จาก
ขอบบน = (ค่ามากที่สุด + ค่าที่น้อยที่สุดของอันตรภาคชั้นที่สูงกว่า 1 ชั้น) / 2
- ขอบล่าง เป็นตัวเลขที่บอกถึงค่ากึ่งกลางของขีดจำกัดล่างกับขีดจำกัดบนของชั้นที่อยู่ต่ำกว่า 1 ชั้น คำนวณได้จาก
ขอบล่าง = (ค่าน้อยที่สุด + ค่าที่มากที่สุดของอันตรภาคชั้นที่ต่ำกว่า 1 ชั้น) / 2
- ความกว้างของอันตรภาคชั้น คือ จำนวนข้อมูลที่อยู่ในอันตรภาคชั้นนั้น คำนวณได้จาก
ความกว้างอันตรภาคชั้น = ขอบบน – ขอบล่าง
- จุดกึ่งกลางชั้น คือ ข้อมูลที่เป็นเหมือนตัวแทนของอันตรภาคชั้นนั้น หาได้จาก 2 วิธี คือ
จุดกึ่งกลางชั้น = (ขอบบน + ขอบล่าง) /2
จุดกึ่งกลางชั้น = (ขีดจำกัดบน + ขีดจำกัดล่าง) /2
- พิสัย คือ ค่าความแตกต่างระหว่าง ค่าที่มากที่สุดและน้อยที่สุด คำนวณได้จาก
พิสัย = ค่าที่มากที่สุด – ค่าที่น้อยที่สุด