สรุปคณิตศาสตร์ม.2 เรื่องสถิติ เรียนอะไรบ้าง
สถิติคือตัวเลขที่ใช้บรรยายเหตุการณ์หรือข้อเท็จจริง มานำเสนอในรูปแบบต่างๆ
แผนภาพจุด เป็นการนำเสนอข้อมูลเชิงปริมาตร โดยการเขียนจุดแทนข้อมูลแต่ละตัวไว้เหนือเส้นในแนวนอน
แผนภาพต้นใบ เป็นการนำเสนอข้อมูลเชิงปริมาณ มีสองส่วน คือ ส่วนใบอยู่ขวา ส่วนลำต้นอยู่ทางซ้าย
ฮิสโทแกรม ใช้สำหรับการกระจายของข้อมูลจำนวนมากๆ ลักษณะคล้ายกับแผนภูมิแท่ง
พิสัย คือ ค่าสูงสุด – ค่าต่ำสุดของข้อมูล
ค่ากลางของข้อมูลมีสามอย่าง ได้แก่ ค่าเฉลี่ย มัธยฐาน และฐานนิยม
ค่าเฉลี่ยเลขคณิต คือ จำนวนที่ได้จากการหารผลบวกของข้อมูลทั้งหมดด้วยจำนวนข้อมูล
ค่ามัธยฐาน คือ หาค่าที่อยู่ตรงกลาง เมื่อนำข้อมูลมาเรียงจากน้อยไปหามาก หรือมากไปหาน้อยแล้ว
ฐานนิยม คือ ข้อมูลที่มีความถี่สูงสุดในชุดนั้นๆ (ซ้ำกันมากที่สุด)
ประเภทของข้อมูล
1.การแบ่งประเภทตามแหล่งที่มา
- ข้อมูลปฐมภูมิ คือ ข้อมูลที่เรารวบรวมมาเอง หรือนำมาจากต้นกำเนิดของข้อมูลโดยตรง มีความน่าเชื่อถือสูง แต่อาจมีค่าใช้จ่ายในการเก็บรวบรวมข้อมูลเอง เช่น พี่สาวคนโตตกลงกับน้อง ๆ ว่าวันหยุดยาวนี้ไปเที่ยวที่ไหนดี ข้อมูลนี้จะเป็นข้อมูลปฐมภูมิสำหรับพี่สาว
- ข้อมูลทุติยภูมิ คือ ข้อมูลที่รวบรวมมาจากแหล่งอื่นอีกที เช่น พี่สาวคนโต รวบรวมความคิดเห็นของน้อง ๆ มาบอกคุณพ่อคุณแม่ว่าแต่ละคนอยากไปเที่ยวที่ไหนกันบ้าง ข้อมูลนี้จะกลายเป็นข้อมูลทุติยภูมิสำหรับคุณพ่อคุณแม่
2.การแบ่งประเภทตามระยะเวลาที่เก็บข้อมูล
- ข้อมูลอนุกรมเวลา คือ ข้อมูลที่เก็บค่าต่อเนื่องในแต่ละเวลา เช่น รายจ่ายของแต่ละวันในหนึ่งเดือน
- ข้อมูลแบบตัดขวาง คือ ข้อมูลที่เจาะจงเวลาลงไปว่าสนใจค่าของเวลาไหน เช่น ข้อมูลปริมาณน้ำฝนของวันนี้ในแต่ละจังหวัด
3.การแบ่งประเภทตามลักษณะของข้อมูล
- ข้อมูลเชิงปริมาณ คือ ข้อมูลที่เก็บเป็นค่าตัวเลข นำไปบวกลบคูณหารกันได้ เช่น ส่วนสูง อายุ คะแนนสอบ แต่ไม่ใช่ตัวเลขทั้งหมดจะเป็นข้อมูลเชิงปริมาณ อย่างการวัดระดับความพึงพอใจ แม้จะมีเรต 1-5 แต่ตัวเลขเหล่านี้ เป็นตัวแทนของความพอใจน้อยไปหามาก ไม่ได้หมายถึงตัวเลขที่นำมาคำนวณได้จริง ๆ ดังนั้น ข้อมูลระดับความพึงพอใจที่ว่านี้จึงเป็นข้อมูลเชิงคุณภาพ
- ข้อมูลเชิงคุณภาพ คือ ข้อมูลที่บ่งบอกลักษณะ ไม่สามารถระบุเป็นตัวเลขได้ เช่น เพศ อาชีพ อาหารที่ชอบ และระดับความพึงพอใจอย่างที่ได้กล่าวไปข้างต้น
สถิติเชิงพรรณาและสถิติเชิงอนุมาน
การนำสถิติไปใช้งานนั้น สามารถแบ่งได้เป็น 2 ประเภท คือ
- สถิติเชิงพรรณา
คำว่าพรรณนา แปลว่าบรรยายหรืออธิบาย ดังนั้นสถิติเชิงพรรณนาจึงหมายถึง การบรรยายหรือวิเคราะห์ข้อมูล โดยอาจเป็นข้อมูลเชิงปริมาณหรือคุณภาพก็ได้ โดยมักจะใช้เพื่อสรุปผลข้อมูลที่มีอยู่จำนวนมาก เช่น การหาอายุเฉลี่ยของลูกค้าประจำร้าน A เป็นต้น
- สถิติเชิงอนุมาน
คำว่า อนุมาน หมายถึง ทำนายหรือคาดการณ์ ดังนั้น สถิติเชิงอนุมานจึงหมายถึง การใช้ข้อมูลจากกลุ่มตัวอย่างเพื่อทำนายลักษณะของข้อมูลประชากรทั้งหมด อย่างการสอบถามกิจกรรมยามว่างของนักเรียนทั้งโรงเรียน การที่เราเลือกกลุ่มตัวอย่างจากนักเรียนบางห้อง มาสอบถามแล้วสรุปผล โดยคาดว่าน่าจะเป็นกิจกรรมที่นักเรียนส่วนใหญ่ชอบทำในเวลาว่าง เรียกว่าเป็นการใช้สถิติเชิงอนุมานนั่นเอง
แผนภาพจุด (Dot Plot) เป็นรูปแบบหนึ่งของการนำเสนอข้อมูลเชิงปริมาณที่ทำได้ไม่ยาก โดยจะเขียนจุดแทนข้อมูลแต่ละตัวไว้เหนือเส้นในแนวนอนที่มีสเกลให้ตรงกับตำแหน่งที่แสดงค่าของข้อมูลนั้น แผนภาพจุดช่วยให้เห็นภาพรวมของข้อมูลได้รวดเร็วกว่าการพิจารณาจากข้อมูลโดยตรงโดยเฉพาะอย่างยิ่งเมื่อสนใจจะพิจารณาลักษณะของข้อมูลว่ามีการกระจายมากน้อยเพียงใด
แผนภาพจุด
แผนภาพจุด หรือ Dot Plot เป็นรูปแบบหนึ่งของการนำเสนอข้อมูลเชิงปริมาณที่
ทำได้ไม่ยาก โดยจะเขียนจุดแทนข้อมูลแต่ละตัวไว้เหนือเส้นในแนวนอนที่มีสเกลให้
ตรงกับตำแหน่งที่แสดงค่าของข้อมูลนั้น แผนภาพจุดช่วยให้เห็นภาพรวมของ
ข้อมูลได้รวดเร็วกว่าการพิจารณาจากข้อมูลโดยตรงโดยเฉพาะอย่างยิ่งเมื่อสนใจจะ
พิจารณาลักษณะของข้อมูลว่ามีการกระจายมากน้อยเพียงใด
ตัวอย่างการนำเสนอข้อมูล ด้วยแผนภาพจุด
คะแนนสอบรายวิชาคณิตศาสตร์คะแนนเต็ม 100 คะแนน ของนักเรียนชั้นมัธยมศึกษาปีที่ 3 จำนวน 19 คน
เรียงลำดับตามคะแนนดังนี้ 70, 61, 74, 61, 81, 64, 67, 71, 80, 71, 74, 71, 72, 73, 75, 77, 79, 81, 83
จงเขียนแผนภาพจุดแทนคะแนนสอบดังกล่าว
1.จากแผนภาพจุดคนที่ได้คะแนนต่ำสุดคือ 61 คะแนน
2.จากแผนภาพจุดคนที่ได้คะแนนมากสุดคือ 83 คะแนน
3.นักเรียนส่วนมากได้คะแนนตั้งแต่70-81คะแนน
การวัดค่ากลางของข้อมูล
1. ค่าเฉลี่ยเลขคณิต (Mean) คือ ผลรวมของค่าของข้อมูลทั้งหมด หารด้วยจำนวนของข้อมูล
การวัดค่ากลางของข้อมูล
การวัดค่ากลางของข้อมูล
การหาค่ากลางของข้อมูลที่เป็นตัวแทนของข้อมูลทั้งหมดเพื่อความสะดวกในการสรุปเรื่องราวเกี่ยวกับข้อมูลนั้นๆ จะช่วยทำให้เกิดการวิเคราะห์ข้อมูลถูกต้องดีขึ้น การหาค่ากลางของข้อมูลมีวิธีหาหลายวิธี แต่ละวิธีมีข้อดีและข้อเสีย และมีความเหมาะสมในการนำไปใช้ไม่เหมือนกัน ขึ้นอยู่กับลักษณะข้อมูลและวัตถุประสงค์ของผู้ใช้ข้อมูลนั้นๆ
ค่ากลางของข้อมูลที่สำคัญ มี 3 ชนิด คือ
1. ค่าเฉลี่ยเลขคณิต (Arithmetic mean)
2. มัธยฐาน (Median)
3. ฐานนิยม (Mode)
1. ค่าเฉลี่ยเลขคณิต (Arithmetic mean)
ใช้สัญลักษณ์ คือ
1.1 การหาค่าเฉลี่ยเลขคณิตของข้อมูลที่ไม่แจกแจงความถี่
ให้ x 1 , x 2 , x 3 , …, x N เป็นข้อมูล N ค่า x̄
1.ค่าเฉลี่ยเลขคณิต (arithmetic mean)
หมายถึง การหารผลรวมของข้อมูลทั้งหมดด้วยจำนวนข้อมูลทั้งหมด การหาค่าเฉลี่ยเลขคณิตสามารถหาได้ 2 วิธี
1. ค่าเฉลียเลขคณิตของข้อมูลที่ไม่ได้แจกแจงความถี่ สามารถคำนวณได้จากสูตร
ค่าเฉลี่ยเลขคณิต หรือที่เราเรียกกันย่อๆ ว่าค่าเฉลี่ย เขียนแทนด้วยสัญลักษณ์ (x¯) เป็นค่ากลางทางสถิติค่าหนึ่ง ที่เจอบ่อยและใช้กันเยอะมาก
วิธีการหาค่าเฉลี่ยเลขคณิตของข้อมูลแบบไม่แจกแจงความถี่สามารถทำได้ดังนี้
ตัวอย่าง 1 ) หาค่าเฉลี่ยจากข้อมูลชุดนี้ 1,2,2,5,7,11,15,9
วิธีทำ
ตอบ 6.5
คุณสมบัติบางประการของมัชฌิมเลขคณิต
มัชฌิมเลขคณิตมีคุณสมบัติบางประการดังนี้ประการแรก คุณสมบัติพื้นฐานก็คือ ผลบวกของความเบี่ยงเบนของคะแนนดิบกับคะแนนเฉลี่ยมีค่าเป็น 0ค่ามัชฌิมเลขคณิตของคะแนน 7, 13, 22, 9, 11 และ 4 คือ 11 ส่วนเบี่ยงเบนจากคะแนนเฉลี่ยคือ -4, 2, 11, -2, 0 และ -7 ผลบวกของคะแนนเบี่ยงเบนคือ 0 ผลทั้งหมดเขียนเป็นสัญลักษณ์ได้ดังนี้
ประการสอง ผลรวมของกำลังสองของคะแนนเบี่ยงเบนจะมีค่าน้อยที่สุดความเบี่ยงเบนของค่าที่ได้จากการวัด 7, 13, 22, 9, 11, 4 กับค่าเฉลี่ย 11 คือ -4, 2, 11, -2, 0, -7 ค่ากำลังสองของความเบี่ยงเบนจะได้ 16, 4, 121, 4, 0, 49 ผลบวกของกำลังสองเท่ากับ 197 ถ้าหากเราใช้ค่าเฉลี่ยตัวอื่น ๆ ผลบวกของกำลังสองของความเบี่ยงเบนของค่าการวัดกับค่ากึ่งกลางใด ๆ จะได้ค่าสูงกว่าผลรวมของกำลังสองความเบี่ยงเบนของค่าการวัดกับมัชฌิมเลขคณิต สมมติให้ค่ากึ่งกลางของข้อมูลชุดนี้เป็น 13 ความเบี่ยงเบนจะได้ -6, 0, 9, 4, 2, -9 ยกกำลังสองได้ 36, 0, 81, 16, 4, 81 รวมผลทั้งหมดเท่ากับ 218 ซึ่งมากกว่าค่าที่ได้จากการใช้ค่าเฉลี่ย
ข้อดีข้อเสียของมัชฌิมเลขคณิต
ข้อดี
1. คำนวณได้ง่าย
2. ข้อมูลทุกตัวถูกนำมาใช้ในการคำนวณ
3. สามารถนำค่าเฉลี่ยที่ได้มาใช้ในการคำนวณอื่น ๆ
ข้อเสีย
1. เพราะข้อมูลทุกค่าถูกนำมาใช้ในการคำนวณ ถ้ามีข้อมูลบางค่าผิดปกติค่าเฉลี่ยก็จะผิดปกติไปด้วย
2. ในกรณีที่อันตรภาคชั้นแต่ละชั้นเป็นชั้นเปิด ไม่สามารถหามัชฌิมเลขคณิตได้
2.มัธยฐาน (Median)
มัธยฐาน หมายถึงค่าที่อยู่ในตำแหน่งกึ่งกลางของข้อมูลชุดนั้น เมื่อได้จากเรียงค่าของข้อมูลจากน้อยที่ไปหามากที่สุดไปหาน้อยที่สุด ค่ากึ่งกลางจะเป็นตัวแทนที่แสดงว่ามีข้อมูลที่มากกว่าและน้อยกว่านี้อยู่ 50 เปอร์เซนต์
การหาค่ามัธยฐานของข้อมูลที่ไม่ได้จัดหมวดหมู่(Ungrouped Data)
ให้เรียงข้อมูลที่มีค่าน้อยที่สุดไปหาข้อมูลที่มีค่ามากที่สุดหรือจากมากสุดไปหาน้อยที่สุดแล้วหาคะแนนที่อยู่ในตำแหน่งกึ่งกลาง
จงหามัธยฐานของข้อมูลต่อไปนี้ 9,5,11,16,6,10,13,14,3
วิธีทำ เรียงข้อมูลที่มีค่าน้อยที่สุดไปหาข้อมูลที่มีค่ามากที่สุดคือ
3,5,6,9,10,11,13,14,16
Median จะอยู่ตำแหน่งที่ N+1 = 9+1
2 2 = 5
ดังนั้น ค่ามัธฐานเท่ากับ 10