สถิติบรรยาย
สถิติบรรยาย ( Descriptive statistics ) คือ สถิติที่ใช้ในการศึกษาข้อเท็จจริงจากกลุ่มข้อมูลที่รวบรวมมาได้ เพื่อให้ทราบรายละเอียดเกี่ยวกับลักษณะของข้อมูลกลุ่มนั้นโดยไม่ได้สรุปอ้างอิงผลการศึกษาไปยังกลุ่มข้อมูลกลุ่มอื่นหรือสรุปอ้างอิงไปยังประชากรที่ศึกษา การบรรยายสรุปลักษณะของกลุ่มข้อมูลได้แก่ การแจกแจงความถี่ การวัดตำแหน่งการเปรียบเทียบ การวัดแนวโน้มเข้าสู่ส่วนกลางและการกระจายข้อมูล เป็นต้น ดังนั้นในบทนี้จึงได้นำเสนอของสถิติภาคบรรยาย ดังมีรายละเอียด ดังนี้
- การแจกแจงความถี่
การแจกแจงความถี่เป็นการนำข้อมูลที่เป็นค่าของตัวแปรที่เราสนใจมาจัดเรียงตามลำดับความมากน้อย และแบ่งเป็นช่วงเท่าๆกัน จำนวนข้อมูลในแต่ละช่วงคะแนน เรียกว่า ความถี่ ในกรณีที่ความแตกต่างระหว่างคะแนนสูงสุดกับคะแนนต่ำสุดไม่มาก ไม่จำเป็นต้องแบ่งช่วงคะแนนเป็นกลุ่ม ในแต่ละช่วงมี 1 คะแนนก็ได้ การแจกแจงความถี่มีจุดมุ่งหมายเพื่อให้ทราบภาพรวมของการแจกแจงข้อมูลทั้งหมดอย่างเป็นระบบ การจัดระบบและนำเสนอข้อมูลในเบื้องต้น สามารถนำเสนอข้อมูลในรูปของตารางและแผนภูมิ ในที่นี้จะขอแยกเป็น 2 ส่วนในการนำเสนอ คือ ตารางแจกแจงความถี่ และกราฟและแผนภูมิแบบต่างๆ
1.1 ตารางการแจกแจงความถี่
การสร้างตารางการแจกแจงความถี่ ทำได้ 2 แบบ คือ
1) การแจกแจงความถี่ของลักษณะที่สนใจที่เป็นไปได้ทั้งหมด
2) การแจกแจงความถี่สำหรับค่าในแต่ละช่วงของลักษณะที่สนใจ
1) การแจกแจงความถี่ของลักษณะที่สนใจที่เป็นไปได้ทั้งหมด
การแจกแจงความถี่แบบนี้ใช้กับข้อมูลที่มีจำนวนลักษณะที่เป็นไปได้ทั้งหมดไม่มากนัก เช่น จำแนกตามเพศ คือ ชาย หญิง จำแนกตามระดับการศึกษา จำแนกตามอาชีพหลัก เป็นต้น ดังตัวอย่างต่อไปนี้
ตัวอย่าง จากการสำรวจนิสิตที่สอบคัดเลือกเข้าคณะครุศาสตร์ ในปีการศึกษา 2544 โดยแจกแจงความถี่ ( นิสิต ) ตามเพศ ได้ดังนี้
เพศ | จำนวนนิสิต ( คน ) |
ชาย | 155 |
หญิง | 174 |
รวม | 329 |
2) การแจกแจงความถี่สำหรับค่าในแต่ละช่วงของลักษณะที่สนใจ
การแจกแจงความถี่แบบนี้ใช้กับข้อมูลที่มีจำนวนลักษณะที่เป็นไปได้ทั้งหมดจำนวนมาก เช่น ศึกษารายได้ของคนไทยทั้งหมด หรืออายุของคนไทยทั้งหมด เป็นต้น ดังนั้นในการแจกแจงความถี่จึงควรแบ่งข้อมูลทั้งหมดออกเป็นช่วงๆที่ต่อเนื่องกัน โดยแต่ละช่วงประกอบด้วยข้อมูลหลายๆค่า ทำให้ลดจำนวนค่าที่เป็นไปได้ทั้งหมดลง ดังตัวอย่างต่อไปนี้
ตัวอย่าง ถ้าเลือกตัวอย่างนิสิตหญิง มา 100 คน สอบถามความสูงแล้วจัดเป็นช่วง ๆ ได้ 5 ชั้น ดังนี้
ความสูงของนิสิตหญิง ( เซ็นติเมตร ) | จำนวนนิสิต |
135 – 144
145 – 154 155 – 164 165 – 174 175 – 184 |
5
18 42 27 8 |
รวม | 100 |
การสร้างตารางแจกแจงความถี่สำหรับค่าในแต่ละช่วงของลักษณะที่สนใจมีขั้นตอนในการสร้าง ดังนี้
ขั้นตอนการสร้างตารางแจกแจงความถี่
- หาค่าพิสัยของข้อมูล (R)
พิสัย ( Range ) = ค่าสูงสุด – ค่าต่ำสุด
- กำหนดจำนวนชั้น ( k )
k = 1+3.3 log N
- คำนวณหาความกว้างของชั้น ( Class interval )
I = ความกว้างของชั้น = พิสัย = R
จำนวนชั้น k
- คำนวณหาขีดจำกัด ( class limit )
ขีดจำกัดล่างของชั้นแรก = ค่าต่ำสุด – ( I x k – R ) / 2
หรือ ใช้ค่าต่ำสุดเป็นขีดจำกัดบน ของชั้นต่ำสุดของการแจกแจง
- คำนวณจุดกึ่งกลางของแต่ละชั้น ( Midpoint )
จุดกึ่งกลางชั้น = (ขีดจำกัดบน + ขีดจำกัดล่าง) / 2
- คำนวณหาขีดจำกัดชั้นที่แท้จริง ( class boundaries )
ขีดจำกัดชั้นที่แท้จริง = ( ขีดจำกัดบนของชั้น + ขีดจำกัดล่างของชั้นถัดไป ) / 2
- นับจำนวนค่าของข้อมูล( ความถี่ ) ในแต่ละชั้น
เมื่อได้จำนวนแล้วสามารถหาความถี่สะสม ความถี่สัมพัทธ์ และร้อยละโดย
การหาความถี่สะสม จะเริ่มหาผลบวกของความถี่ที่เริ่มจากชั้นแรกบวกไปเรื่อยๆเมื่อถึงชั้นนั้นๆ
การหาความถี่สัมพัทธ์ หรือสัดส่วน (proportion) ของชั้นใดก็นำความถี่ของชั้นนั้นหารด้วยความถี่ทั้งหมดและเมื่อคูณด้วยร้อยจะเรียกว่าเปอร์เซ็นต์หรือร้อยละ
ตัวอย่าง ถ้าคะแนนสอบของนิสิตที่เรียนวิชาสถิติ จำนวน 80 คน เป็นดังนี้
68 84 75 82 68 90 62 88 76 93 54 79
73 79 88 73 60 93 71 59 85 75 64 82
61 65 75 87 74 62 95 78 63 72 65 94
96 78 89 61 75 95 60 79 83 71 70 7 9
62 67 97 78 85 76 65 71 75 72 65 80
73 57 88 78 62 76 52 74 77 86 67 73
81 72 63 76 75 85 77 78
พิสัย = 97 –52 = 45
ต้องการสร้างตารางที่มีจำนวนชั้น = 8 ชั้น
ความกว้างของชั้น = พิสัย / จำนวนชั้น
= 45 / 8 = 5.62 ≈ 6
ขีดจำกัดชั้น | ขีดจำกัดที่แท้จริง | จุดกึ่งกลางชั้น | ความถี่ |
51 – 56
57 – 62 63 – 68 69 – 74 75 – 80 81 – 86 87 – 92 93 – 98 |
50.5 – 56.5
56.5 – 62.5 62.5 – 68.5 68.5 – 74.5 74.5 – 80.5 80.5 – 86.5 86.5 – 92.5 92.5 – 99.5 |
53.5
59.5 65.6 71.5 77.5 83.5 89.5 95.5 |
1
11 11 13 22 9 6 7 |
รวม | 80 |
ตารางแสดงการแจกแจงความถี่สัมพันธ์ของคะแนนสอบ
ชั้นที่ | ขีดจำกัด | ความถี่
fi |
ความถี่สัมพัทธ์
(fi / S fi ) |
ความถี่สะสม
S fi |
ร้อยละ |
1
2 3 4 5 6 7 8 |
51 – 56
57 – 62 63 – 68 69 – 74 75 – 80 81 – 86 87 – 92 93 – 99 |
1
11 11 13 22 9 6 7 |
1/80 = .0125
11/80 = .1375 11/80 = .1375 13/80 = .1625 22/80 = .275 9/80 = .1125 6/80 = .075 7/80 = .0875 |
1
12 23 36 58 67 73 80 |
1.25
13.75 13.75 16.25 27.50 11.25 7.50 8.75 |
รวม | 80 | 1 | 100.00 |
1.2 กราฟและแผนภูมิแบบต่างๆ
การบรรยายหรือนำเสนอข้อมูลด้วยกราฟและแผนภูมิแบบต่างๆ จะทำให้ง่ายต่อการเปรียบเทียบ โดยแบ่งเป็น 4 ประเภทใหญ่ โดยแต่ละประเภทมีลักษณะย่อย ดังนี้ คือ
1) แผนภูมิแท่ง ( Bar chart )
– แผนภูมิแท่งเชิงเดี่ยว (Simple Bar chart )
– แผนภูมิแท่งเชิงซ้อน (Multiple Bar chart )
2) แผนภูมิวงกลม( Pie chart )
3) ฮิสโตแกรม (Histogram)
4) กราฟเส้น
– กราฟเส้นเชิงเดี่ยว ( Simple Line chart )
– กราฟเส้นเชิงซ้อน ( Multiple Line chart )
– รูปหลายเหลี่ยมแห่งความถี่ (Frequency polygon)
– กราฟความถี่สะสม(Ogive curve)
– กราฟเส้นโค้ง (Smooth curve)
1) แผนภูมิแท่ง (Bar Chart) ประกอบด้วยแท่งรูปสี่เหลี่ยมผืนผ้าที่มีความกว้างเท่ากันทุกแห่ง ส่วนความสูงจะขึ้นอยู่กับขนาดของข้อมูล ถ้าเป็นการเปรียบเทียบข้อมูลเพียงลักษณะเดียว เรียกว่า แผนภูมิแท่งเชิงเดี่ยว (Simple Bar Chart) ถ้าเป็นการเปรียบเทียบข้อมูลตั้งแต่ 2 ลักษณะขึ้นไป เรียกว่า แผนภูมิแท่งเชิงซ้อน (Multiple Bar chart )