Alevel EP5: เฉลยแนวข้อสอบ คณิตฯ A-level 66 เรื่องสถิติ (Statistics)ตอนที่ 6
ข้อนี้เกี่ยวกับสถิติ โจทย์ให้ #boxplot มา จะต้องหา #ค่าเฉลี่ยเลขคณิต และจะได้ดูเรื่อง #พิสัยระหว่างควอไทล์ ข้อนี้จะเป็นยังไงบ้าง ติดตามดูได้เลยครับ^^ ตอนที่หกของเฉลย #ข้อสอบ #คณิตศาสตร์ #alevel ปี66 ที่เพิ่งสอบกันไปเมื่อต้นปีที่ผ่านมานี้ เป็นปีแรกที่เปลี่ยนจาก #วิชาสามัญ เป็น A-Level และ #พี่อุ๋ย คัดข้อที่น่าสนใจมา #เฉลย ให้ดูแบบละเอียดกันเลย โดยเฉพาะน้องๆ #dek67 ที่กำลังเตรียมสอบ #TCAS67 #tcas68 พลาดไม่ได้ครับ
การเก็บรวบรวมข้อมูลสถิติ
1.1 ความหมายของสถิติ ข้อมูลและข่าวสาร
1.1.1 สถิติ (Statistics) อาจพิจารณาได้ 3 ความหมาย คือ
• สถิติ หมายถึง ตัวเลขที่ใช้บรรยายเหตุการณ์หรือข้อเท็จจริง (facts) ของเรื่องต่างๆ ที่เราต้องการศึกษา เช่น สถิติจำนวนผู้ป่วย สถิติจำนวนคนเกิด สถิติจำนวนคนตาย เป็นต้น
• สถิติ หมายถึง ศาสตร์หรือวิชาที่ว่าด้วยหลักการและระเบียบวิธีทางสถิติ สถิติใน ความหมาย นี้มักเรียกว่า สถิติศาสตร์ (Statistics)
• สถิติ หมายถึง ค่าที่คำนวณขึ้นมาจากตัวอย่าง เพื่อแสดงถึงคุณลักษณะบางอย่างของข้อมูลชุดนั้น โดยทั่วไปจะนำค่าสถิติไปใช้ในการประมาณค่าพารามิเตอร์ ตัวอย่างเช่น ถ้าเราสนใจรายได้เฉลี่ยของคนในหมู่บ้าน แล้วเราสามารถนำรายได้ของทุกคนมา รวมกันแล้วหาค่าเฉลี่ยของรายได้ ค่าเฉลี่ยที่คำนวณได้นี้ถือว่าเป็นค่าพารามิเตอร์ แต่ถ้าเราสุ่มตัวอย่างคนในหมู่บ้านมาจำนวนหนึ่งแล้วคำนวณรายได้เฉลี่ย ค่าเฉลี่ยที่ได้นี้จะเป็นค่าสถิติ
1.1.2 ข้อมูล (data) หมายถึง ข้อเท็จจริง (facts) ที่เกี่ยวกับเรื่องต่างๆ ซึ่งอาจเป็นข้อเท็จจริงที่เป็นตัวเลข เช่น จำนวนผู้ป่วยที่ติดเชื้อ HIV ในหมู่บ้าน ราคาของพืชผักและผลไม้ต่างๆ ในหมู่บ้าน เป็นต้น หรืออาจเป็นข้อเท็จจริงที่ไม่ใช่ตัวเลข เช่น การศึกษา หรือ อาชีพของคนในหมู่บ้าน เป็นต้น
1.1.3 สารสนเทศหรือข่าวสาร (Information) หมายถึง ผลลัพธ์จากการนำเอาข้อมูลที่สังเกต และบันทึกไว้มาทำการจัดการข้อมูล ประมวลผล เชื่อมโยงความสัมพันธ์ และแปลความหมาย แล้วเลือกนำเสนอขึ้นเป็นสารสนเทศหรือข้อความรู้เพื่อใช้เป็นพื้นฐานสำหรับตัดสินใจปฏิบัติการต่างๆ
2 ขอบข่ายของสถิติ
1.2.1 ในกรณีที่สถิติ หมายถึง ข้อมูลสถิติ
ข้อมูลสถิติได้ครอบคลุมไปในแทบทุกแขนงของวิชาการในกิจกรรมต่างๆ ของการดำรงชีวิตประจำวัน การวางแผน การบริหารงาน การติดตามผล เป็นต้น
ในวงการสถิติของรัฐบาล ไม่ว่าข้อมูลสถิตินั้นๆ จะอยู่ในลักษณะของผลพลอยได้จากการบริหารงาน หรือจัดทำขึ้นมาเพื่อการสถิติโดยตรง สามารถจำแนกข้อมูลสถิติ ดังกล่าว ออกเป็น 23 สาขาด้วยกัน คือ
• สถิติประชากรและเคหะ
• สถิติแรงงาน
• สถิติการศึกษา การฝึกอบรม ศาสนาและวัฒนธรรม รวมถึงสถิติสื่อสารมวลชน
• สถิติด้านสุขภาพ
• สถิติสวัสดิการสังคม
• สถิติเกี่ยวกับหญิงและชาย
• สถิติรายได้และรายจ่ายของครัวเรือน
• สถิติด้านสังคม ประชากรศาสตร์ และสถิติอื่น ๆ ที่เกี่ยวข้อง
• สถิติบัญชีประชาชาติ
• สถิติการเกษตร การป่าไม้และการประมง
• สถิติอุตสาหกรรมและเหมืองแร่
• สถิติพลังงาน
• สถิติการค้าส่ง ค้าปลีกและการค้าระหว่างประเทศ
• สถิติการขนส่ง
• สถิติการคมนาคม
• สถิติการท่องเที่ยว
• สถิติการเงิน การธนาคาร การประกันภัย และดุลการชำระเงิน
• สถิติการคลัง
• สถิติราคา
• สถิติด้านวิทยาศาสตร์ เทคโนโลยีและสิทธิบัตร
• สถิติด้านเศรษฐกิจอื่น ๆ
• สถิติด้านทรัพยากรธรรมชาติและสิ่งแวดล้อม
• สถิติอุตุนิยมวิทยา
1.2.2 ในกรณีที่สถิติ หมายถึง สถิติศาสตร์ (Statistics)
วิชาสถิติมีขอบข่ายกว้างขวาง และเกี่ยวข้องกับศาสตร์อื่นๆ หลายแขนง เช่น คณิตศาสตร์ วิทยาศาสตร์ ตรรกวิทยา เศรษฐศาสตร์ การบริหาร เป็นต้น จึงมีผู้ให้คำจำกัดความของวิชาการสถิติขึ้นใหม่ว่า
“ วิชาสถิติเป็นวิทยาศาสตร์ของการตัดสินใจในท่ามกลางความไม่แน่นอน ” ในการศึกษาวิชาสถิติ มักแบ่งสาขาและเนื้อหาออกเป็น 2 แขนงใหญ่ ๆ คือ
1. วิธีการทางสถิติ (Statistical Methods) ที่ใช้ในการวิเคราะห์ข้อมูลสามารถแบ่งออกเป็น 2 ส่วน คือ
• สถิติพรรณนา (Descriptive Statistic) เป็นวิธีการทางสถิติเกี่ยวกับระเบียบวิธีที่ใช้ในการเก็บรวบรวมข้อมูล การจัดระเบียบข้อมูล การนำเสนอข้อมูล การวิเคราะห์ข้อมูลอย่างง่าย และการสรุปผลข้อมูล
• สถิติอนุมาน (Inferential Statistic) เป็นการวิเคราะห์ข้อมูลจากตัวอย่างที่เก็บรวบรวมมาแล้วอนุมานหรือสรุปผลไปสู่ประชากร ด้วยวิธีการทางสถิติ เช่น การประมาณค่า (Estimation) การทดสอบสมมติฐาน (Hypothesis Testing) เป็นต้น
2. ทฤษฎีสถิติ (Statistical Theory) เป็นการศึกษาหลักวิชา และวิธีการทางคณิตศาสตร์ ซึ่งใช้ในการพัฒนาและสนับสนุนความถูกต้องสมบูรณ์ของระเบียบวิธีสถิติ
1.3 ประเภทของข้อมูลสถิติ
แบ่งได้ 2 ลักษณะดังนี้
ข้อมูลเชิงคุณภาพ (Qualitative data) หมายถึงข้อมูลที่แสดงถึงสถานภาพ คุณลักษณะ หรือคุณสมบัติ เช่น เพศ เชื้อชาติ สถานภาพสมรส ศาสนา กลุ่มเลือด เป็นต้น
ข้อมูลเชิงปริมาณ (Quantitative data) หมายถึงข้อมูลที่อยู่ในรูปตัวเลข (numerical data) ที่แสดงถึงปริมาณ อาจเป็นค่าที่ไม่ต่อเนื่อง (discrete) คือค่าที่เป็นจำนวนเต็มหรือจำนวนนับ เช่น จำนวน รถยนต์ในกรุงเทพมหานคร จำนวนบุตรในครอบครัว เป็นต้น หรือเป็นค่าที่ต่อเนื่อง (continuous) คือค่าที่มีจุดทศนิยมได้ เช่น ความสูง น้ำหนัก อายุ อัตราเงินเฟ้อ สถิติน้ำฝนในปีต่างๆ เป็นต้น
1.4 แหล่งที่มาของข้อมูล (Source of Data)
ข้อมูลสถิติอาจจำแนกตามแหล่งที่มาได้ 2 ทาง คือ
• ข้อมูลปฐมภูมิ (Primary Data) เป็นข้อมูลที่ผู้ใช้หรือหน่วยงานที่ใช้เป็นผู้ทำการเก็บข้อมูลด้วยตนเอง ซึ่งวิธีการเก็บรวบรวมข้อมูลอาจใช้วิธีการสัมภาษณ์ การทดลอง หรือการสังเกตการณ์ ข้อมูลปฐมภูมิเป็นข้อมูลที่มีรายละเอียดตรงตามที่ผู้ใช้ต้องการ แต่มักจะเสียเวลาในการจัดหาและมีค่าใช้จ่ายสูง
• ข้อมูลทุติยภูมิ (Secondary Data) เป็นข้อมูลที่ผู้ใช้ไม่ได้เก็บรวบรวมเอง แต่มีผู้อื่นหรือ หน่วยงานอื่นๆ ทำการเก็บรวบรวมไว้แล้ว เช่น จากรายงาน ที่พิมพ์แล้ว หรือยังไม่ได้พิมพ์ของ หน่วยงานของรัฐบาล สมาคม บริษัท สำนักงานวิจัย นักวิจัย วารสาร หนังสือพิมพ์ เป็นต้น การนำเอาข้อมูลเหล่านี้มาใช้เป็นการประหยัดเวลาและค่าใช้จ่าย แต่ในบางครั้งข้อมูลอาจจะไม่ตรงกับความต้องการของผู้ใช้ หรือมีรายละเอียดไม่เพียงพอที่จะนำไปวิเคราะห์ นอกจากนี้ในบางครั้ง ข้อมูลนั้นอาจมีความผิดพลาดและผู้ใช้มักจะไม่ทราบข้อผิดพลาดดังกล่าว ซึ่งอาจมีผลกระทบต่อการสรุปผล ดังนั้น ผู้ที่จะนำข้อมูลทุติยภูมิมาใช้ควรระมัดระวังและตรวจสอบคุณภาพข้อมูลก่อนที่จะนำไปวิเคราะห์
1.5 คุณสมบัติของข้อมูลที่ดี
ข้อมูลที่ดีจะต้องประกอบด้วยคุณสมบัติที่สำคัญๆ ดังนี้คือ
1. ความถูกต้องแม่นยำ (accuracy) ข้อมูลที่ดีควรจะมีความถูกต้องแม่นยำสูง หรือถ้ามีความคลาดเคลื่อน (errors) ปนอยู่บ้าง ก็ควรที่จะสามารถควบคุมขนาดของความคลาดเคลื่อนที่ปนมาให้มีความคลาดเคลื่อน น้อยที่สุด
2. ความทันเวลา (timeliness) เป็นข้อมูลที่ทันสมัย (up to date) และทันต่อความต้องการของ ผู้ใช้ ถ้าผลิตข้อมูลออกมาช้า ก็ไม่มีคุณค่าถึงแม้จะเป็นข้อมูลที่ถูกต้องแม่นยำก็ตาม
3. ความสมบูรณ์ครบถ้วน (completeness) ข้อมูลที่เก็บรวบรวมมาต้องเป็นข้อมูลที่ให้ข้อเท็จจริง (facts) หรือข่าวสาร (information) ที่ครบถ้วนทุกด้านทุกประการ มิใช่ขาดส่วนหนึ่งส่วนใดไปทำให้นำไปใช้การไม่ได้
4. ความกระทัดรัด (conciseness) ข้อมูลที่ได้รับส่วนใหญ่จะกระจัดกระจาย ควรจัดข้อมูลให้อยู่ใน รูปแบบที่กระทัดรัดไม่เยิ่นเย้อ สะดวกต่อการใช้และค้นหา ผู้ใช้มีความเข้าใจได้ทันที
5. ความตรงกับความต้องการของผู้ใช้ (relevance) ข้อมูลที่จัดทำขึ้นมาควรเป็นข้อมูลที่ผู้ใช้ ข้อมูลต้องการใช้ และจำเป็นต้องรู้ / ทราบ หรือเป็นประโยชน์ต่อการจัดทำแผน กำหนดนโยบายหรือตัดสินปัญหาในเรื่องนั้นๆ ไม่ใช่เป็นข้อมูลที่จัดทำขึ้นมาอย่างมากมาย แต่ไม่มีใครต้องการใช้หรือไม่ตรงกับความต้องการของผู้ใช้ข้อมูล
6. ความต่อเนื่อง (continuity) การเก็บรวบรวมข้อมูล ควรอย่างยิ่งที่จะต้องดำเนินการอย่างสม่ำเสมอและต่อเนื่องในลักษณะของอนุกรมเวลา (time-series) เพื่อจะได้นำไปใช้ประโยชน์ในด้านการวิเคราะห์วิจัยหรือหาแนวโน้มในอนาคต