ความรู้เบื้องต้นเกี่ยวกับสถิติ (Basic Statistics)คณิตศาสตร์ออนไลน์ ม.6
ความหมายของสถิติ
คำว่า สถิติ (Statistics) มาจากภาษาเยอรมันว่า Statistik มีรากศัพท์มาจาก Stat หมายถึง ข้อมูล หรือ สารสนเทศ ซึ่งจะอ านวยประโยชน์ต่อการบริหารประเทศในด้านต่าง ๆ เช่น การท าสำมะโนครัว เพื่อทราบพลเมือง
ในประเทศทั้งหมด ต่อมา สถิติ หมายถึงตัวเลขหรือข้อมูลที่ได้จากการเก็บรวบรวม เช่น จ านวนผู้ประสบอุบัติเหตุ บนท้องถนน อัตราการเกิดของเด็กทารก ปริมาณน้ าฝนในแต่ละปี สถิติในความหมายนี้ เรียกว่าข้อมูลทางสถิติ
(Statistical data) อีกความหมายหนึ่ง สถิติ หมายถึงวิธีการที่ว่าด้วยการเก็บรวบรวมข้อมูล การนำเสนอข้อมูล การวิเคราะห์
ข้อมูล และการตีความหมายข้อมูล
ประเภทของสถิติ
สถิติแบ่งออกเป็น 2 ประเภทคือ
1.สถิติพรรณนา (Descriptive Statistics) เป็นสถิติที่ใช้อธิบายคุณลักษณะของสิ่งที่ต้องการศึกษากลุ่มใดกลุ่ม
หนึ่ง ไม่สามารถอ้างอิงไปยังกลุ่มอื่น ๆ ได้ สถิติที่อยู่ในประเภทนี้ เช่น ค่าเฉลี่ย ค่ามัธยฐาน ค่าฐานนิยม ส่วน
เบี่ยงเบนมาตรฐาน พิสัย ฯลฯ
2. สถิติอ้างอิง (Inferential Statistics) เป็นสถิติที่ใช้อธิบายคุณลักษณะของสิ่งที่ต้องการศึกษากลุ่มใดกลุ่ม
หนึ่งหรือหลายกลุ่มแล้วสามารถอ้างอิงไปยังกลุ่มประชากรได้ โดยกลุ่มที่น ามาศึกษาจะต้องเป็นตัวแทนที่ดีของ
ประชากร ตัวแทนที่ดีของประชากรได้มาโดยวิธีการสุ่มตัวอย่าง และตัวแทนที่ดีของประชากรเรียกว่ากลุ่มตัวอย่าง
สถิติอ้างอิงสามารถแบ่งออกเป็น 2 ประเภท คือ
2.1 สถิติมีพารามิเตอร์ (Parametric Statistics) เป็นวิธีการทางสถิติที่จะต้องเป็นไป
ตามข้อตกลงเบื้องต้นดังนี้
1. ข้อมูลต้องอยู่ในระดับช่วงขึ้นไป
2. ข้อมูลที่ได้จากกลุ่มตัวอย่างจะต้องมีการแจกแจงเป็นโค้งปกติ
3. กลุ่มประชากรแต่ละกลุ่มที่น ามาศึกษาต้องมีความแปรปรวนเท่ากัน
สถิติประเภทนี้เช่น t-test, Z-test, ANOVA, Regression ฯลฯ
2.2 สถิติไร้พารามิเตอร์ (Nonparametric Statistics) เป็นวิธีการทางสถิติที่
สามารถน ามาใช้ได้โดยปราศจากข้อตกลงเบื้องต้น สถิติที่อยู่ในประเภทนี้ เช่น ไคสแควร์, Median test, Sign test ฯลฯ โดยปกติแล้วนักวิจัยนิยมใช้สถิติมีพารามิเตอร์ทั้งนี้เพราะผลลัพธ์ที่ได้จากการใช้สถิติมีพารามิเตอร์มีอ านาจ การทดสอบ (Power of Test) สูงกว่าการใช้สถิติไร้พารามิเตอร์ สถิติมีพารามิเตอร์เป็นการทดสอบที่ได้มาตรฐาน มี 2 ขั้นตอนต่าง ๆ ที่สมบูรณ์ ดังนั้นเมื่อข้อมูลมีคุณสมบัติที่สอดคล้องกับข้อตกลงเบื้องต้นในการใช้สถิติมีพารามิเตอร์จึง
ไม่มีผู้ใดคิดที่จะหันกลับไปใช้สถิติไร้พารามิเตอร์ในการทดสอบสมมติฐาน ระดับการวัด การวัดเป็นการกำหนดตัวเลขให้กับสิ่งที่ต้องการศึกษาภายใต้กฎเกณฑ์ที่แน่นอนการวัดแบ่งออกเป็น 4 ระดับ
คือ ระดับที่ 1 ระดับนามบัญญัติ (Nominal Scale) เป็นระดับที่ใช้แยกความแตกต่างของสิ่งที่ต้องการวัด
ออกเป็นกลุ่ม เช่น เพศ แบ่งออกเป็นกลุ่มเพศชาย และกลุ่มเพศหญิง โดยให้เลข 1 แทน เพศชายและเลข 2 แทน
เพศหญิง หรือระดับการศึกษาแบ่งออกเป็นกลุ่มที่มีการศึกษาต่ ากว่าปริญญาตรี ให้แทนด้วยเลข 1 กลุ่มที่มีการศึกษา ระดับปริญญาตรีให้แทนด้วยเลข 2 และกลุ่มที่มีการศึกษาสูงกว่าระดับปริญญาตรีให้แทนด้วยเลข 3 เป็นต้น ซึ่งตัวเลข 1,2,3 ที่ใช้แทนกลุ่มต่างๆ ถือเป็นตัวเลขในระดับนามบัญญัติไม่สามารถน ามาบวก ลบ คูณ หาร หรือหาสัดส่วนได้
ระดับที่ 2 ระดับอันดับที่ (Ordinal Scales) เป็นระดับที่ใช้ส าหรับจัดอันดับที่หรือต าแหน่งของสิ่งของที่
ต้องการวัด เช่น ดำสอบได้ที่ 1 แดงสอบได้ที่ 2 เขียวสอบได้ที่ 3 ซึ่งตัวเลข 1, 2, 3 เป็นตัวเลขในระดับอันดับที่ สามารถนำมาบวก ลบกันได้ ระดับที่ 3 ระดับช่วง (Interval Scales) เป็นระดับที่สามารถกำหนดค่าตัวเลขโดยมีช่วงห่างระหว่างตัวเลข
เท่าๆ กัน แต่ไม่มี 0 (ศูนย์)แท้ มีแต่ 0 (ศูนย์) สมมติ เช่น นายวิชัยสอบได้ 0 คะแนน มิได้หมายความว่าเขาไม่มีความรู้ เพียงแต่เขาไม่สามารถท าข้อสอบซึ่งเป็นตัวแทนของความรู้ทั้งหมดได้ ระดับนี้สามารถน าตัวเลขมาบวก ลบ คูณ หาร
กันได้ ระดับที่ 4 ระดับอัตราส่วน (Ratio Scales) เป็นระดับที่สามารถก าหนดค่าตัวเลขให้กับสิ่งที่ต้องการวัดมี 0 (ศูนย์) แท้ เช่น น้ าหนัก ความสูง อายุ เป็นต้น ระดับนี้สามารถน าตัวเลขมาบวก ลบ คูณ หาร หรือหาอัตราส่วน
กันได้
ประชากรและกลุ่มตัวอย่าง
ประชากร คือ กลุ่มของการวัดทั้งหมดที่สนใจศึกษา
ตัวอย่าง คือ สับเซตของการวัดที่มาจากประชากรที่สนใจศึกษา
พารามิเตอร์ คือ ค่าจริงหรือค่าประชากร ซึ่งโดยทั่วไปไม่ทราบค่า
ตัวแปร
ตัวแปร คือ คุณลักษณะที่เปลี่ยนแปลงได้ ขึ้นอยู่กับความแตกต่างเฉพาะบุคคลหรือกลุ่มตัวอย่าง เช่น อุณหภูมิ ของร่างกายคือตัวแปรที่เปลี่ยนแปลงไปในแต่ละบุคคล การนับถือศาสนา รายได้ อายุ ความสูง ตัวแปรคุณลักษณะ เหล่านี้ขึ้นอยู่กับแต่ละบุคคล 3 ชนิดของตัวแปร
1. ตัวแปรเชิงคุณภาพ เป็นตัวแปรที่ข้อมูลไม่ใช่ตัวเลขแต่เป็นข้อมูลที่มีลักษณะเป็นการแบ่งประเภทให้เห็น
ถึงความแตกต่างของกลุ่มตัวอย่างแต่ละกลุ่ม เช่น ศาสนา อาชีพ สถานภาพสมรส ระดับการศึกษา
2. ตัวแปรเชิงปริมาณ เป็นตัวแปรที่ถูกวัดมามีค่าเป็นตัวเลข เช่น จ านวนบุตร รายได้ คะแนนสอบ ราคา
สิ่งของ การเก็บรวบรวมข้อมูลและการสุ่มตัวอย่าง งานวิจัยในสาขาวิชาต่างๆ เป็นกระบวนการเชิงวิทยาศาสตร์ มีการวางแผนหรือการก าหนดแนวความคิด
สมมติฐานของการวิจัย ตัวแบบที่ท าวิจัย ข้อมูลที่ต้องการเก็บรวบรวม วิธีการทดลองหรือเทคนิคการส ารวจ ขนาด
ตัวอย่าง และวิธีวิเคราะห์ข้อมูล ตลอดจนวิธีรายงานผล เพื่อประเมินผลลัพธ์และตอบปัญหาของการวิจัยต่อไป
ข้อมูล คือความจริงที่ให้ความรู้ความเข้าใจในเรื่องที่วิจัยได้ ข้อมูลอาจเป็นตัวเลขหรือไม่เป็นตัวเลขที่ เกี่ยวกับเรื่องที่สนใจศึกษา ข้อมูลจ าเป็นต้องมีคุณภาพ เพื่อน าไปวิเคราะห์หาสารสนเทศที่ให้ความรู้หรือช่วยในการ ตัดสินใจให้ถูกต้อง
วิธีการเก็บรวบรวมข้อมูล ก่อนอื่นผู้วิจัยควรศึกษาและก าหนดข้อมูลที่ใช้หรือที่สนใจเก็บรวบรวมว่ามี อะไรบ้าง ซึ่งอาจก าหนดในรูปของแบบบันทึกข้อมูลหรือการสร้างแบบสอบถามไว้ก่อนแล้วจึงเลือกวิธีการเก็บ รวบรวมข้อมูล โดยวิธีการเก็บรวบรวมข้อมูลมี 4 วิธีดังนี้
1. วิธีส ามะโนครัว คือ การเก็บรวบรวมข้อมูลจากทุกหน่วยของประชากร
2. วิธีส ารวจตัวอย่าง คือ การเก็บรวบรวมข้อมูลจากหน่วยตัวอย่าง ซึ่งโดยทั่วไปควรอาศัยเทคนิคการสุ่ม
ตัวอย่าง เพื่อเลือกหน่วยตัวอย่างที่เป็นตัวแทนที่ดีของประชากร
3. วิธีการทดลอง คือ การเก็บรวบรวมข้อมูลหรือสังเกตการณ์จากงานทดลองด้านต่าง ๆ ที่อาจท าใน
ห้องปฏิบัติการหรือนอกห้องปฏิบัติการของการทดลอง
4. วิธีเก็บรวบรวมจากทะเบียน คือ การเก็บรวบรวมข้อมูลที่มีผู้บันทึกรวบรวมข้อมูลไว้เสร็จแล้ว ผู้ใช้ไป
ศึกษาค้นคว้าและน ามาใช้อีกต่อหนึ่ง
การสุ่มตัวอย่าง คือ การเลือกตัวอย่างและเทคนิคการประมาณค่าพารามิเตอร์ที่สนใจ เช่น ค่าเฉลี่ย ค่า
สัดส่วน เป็นต้น ภายใต้ทฤษฎีการสุ่มตัวอย่าง และนิยมใช้ในกรณีที่ประชากรมีขนาดใหญ่ ซึ่งการเลือกตัวอย่าง
แบ่งเป็น 2 วิธีหลัก ๆ คือ
1. การเลือกตัวอย่างที่ใช้ความน่าจะเป็น เป็นเทคนิคการหาข้อมูลที่เป็นตัวอย่างเชิงความน่าจะเป็น ซึ่งมี
คุณสมบัติว่าแต่ละหน่วยประชากรมีค่าความน่าจะเป็นที่ไม่เท่ากับศูนย์ที่จะถูกเลือกมาเป็นตัวอย่าง เช่น
การเลือกตัวอย่างสุ่มแบบง่าย เช่น จับฉลาก ตารางเลขสุ่ม ใช้คอมพิวเตอร์ การเลือกตัวอย่างแบบมีระบบ เช่น เส้นตรง วงกลม
การเลือกตัวอย่างแบบเป็นชั้นภูมิ เช่น อย่างง่าย แบบกลุ่ม หลายขั้น
2. การเลือกตัวอย่างที่ไม่ใช้ความน่าจะเป็น เป็นการเลือกตัวอย่างที่ไม่ค านึงถึงโอกาสที่หน่วยต่าง ๆ ใน
ประชากรจะถูกเลือกขึ้นมาอย่างไร วิธีการนี้บางหน่วยของประชากรอาจไม่มีโอกาสจะถูกเลือกเลย จะไม่สามารถน า
ผลสรุปจากระดับตัวอย่างไปอนุมานเพื่อหาข้อสรุปถึงระดับประชากรได้ เช่น การเลือกตัวอย่างแบบบังเอิญ การเลือก
ตัวอย่างแบบสโนว์บอล
การเลือกตัวอย่างแบบโควตา
การวางแผนการส ารวจ ควรมีการกำ าหนดขั้นตอนการท างานตามลำดับ ประกอบด้วยขั้นตอนต่าง ๆ โดย
สรุปดังนี้
1. วัตถุประสงค์และทรัพยากร
2. ประชากรเป้าหมายและประชากรของการส ารวจ
3. หน่วยประชากรและหน่วยตัวอย่าง
4. แผนแบบการสุ่มตัวอย่างและวิธีการเลือกตัวอย่าง
5. วิธีการประมาณค่าพารามิเตอร์และตัวประมาณที่ใช้
6. วิธีวิเคราะห์และการอนุมานผลลัพธ์
7. การสร้างเครื่องมือของการวิจัยหรือแบบบันทึกข้อมูล แบบสอบถาม แบบทดสอบ
8. การท าการมทดลองเครื่องมือและการส ารวจทดลอง
9. ขนาดตัวอย่าง
10. วิธีเก็บรวบรวมข้อมูล
11. งานสนามและงานเอกสาร
12. การประมวลผลและการวิเคราะห์
13. การประเมินผล
14. การรายงานผล
15. การสรุปผล
การเตรียมข้อมูลเพื่อการวิเคราะห์
การจะให้ SPSSวิเคราะห์ข้อมูลให้ จำเป็นต้องเตรียมข้อมูลให้อยู่ในรูปแบบที่คอมพิวเตอร์สามารถอ่านได้
ก่อน
◆ Case Variables และ Value
Case คือหน่วยสังเกตหรือหน่วยวิเคราะห์ เช่น ในการสัมภาษณ์ความคิดเห็นของผู้ใช้ยาสีฟันยี่ห้อ
งามฟัน ผู้ถูกสัมภาษณ์แต่ละคนคือหน่วยสังเกต หรือ Case
Variable คือลักษณะต่าง ๆ ของหน่วยสังเกตที่วัดหรือสอบถามมา คือตัวแปร
Value คือค่าของลักษณะที่วัดมาได้ คือ ค่าของตัวแปร
5
◆ การบันทึกข้อมูล
เมื่อตัดสินใจว่าจะเก็บข้อมูลเกี่ยวกับตัวแปรใดแล้ว สิ่งสำคัญประการหนึ่งคือ ต้องตัดสินใจว่าจะ
บันทึกข้อมูลอย่างไร เช่น อายุ จะบันทึกเป็น วัน เดือน ปี ที่เกิด หรือบันทึกเป็นปี หรือบันทึกเป็นช่วงอายุ
◆ การลงรหัสข้อมูล (Coding) เป็นการเปลี่ยนรูปแบบข้อมูลโดยให้รหัสแทนข้อมูลเพื่อสามารถจ าแนก
ลักษณะของข้อมูล รหัสที่ใช้แทนอาจจะอยู่ในรูปตัวเลข ตัวอักษร หรือข้อความ เช่น อาชีพ อาจให้รหัส “1” แทน
อาชีพรับราชการ รหัส “2” แทนพนักงานเอกชน รหัส “3” แทนอาชีพเกษตรกรรม รหัส “4” แทนอาชีพอื่น ๆ เป็น
ต้น ผู้วิจัยควรทำสมุดคู่มือก าหนดรหัสให้ตัวแปร โดยในคู่มือจะต้องก าหนดชื่อตัวแปร ชนิด
และขนาดของตัวแปร และกำหนดรหัสตัวแปรไว้ด้วย