ความรู้เบื้องต้นเกี่ยวกับสถิต
ความหมายของสถิติ
คำว่า สถิติ (Statistics) มาจากภาษาเยอรมันว่า Statistik มีรากศัพท์มาจาก Stat หมายถึงข้อมูล หรือสารสนเทศ ซึ่งจะอำนวยประโยชน์ต่อการบริหารประเทศในด้านต่าง ๆ เช่น การทำสำมะโนครัว เพื่อจะทราบจำนวนพลเมืองในประเทศทั้งหมด ในสมัยต่อมา คำว่า สถิติ ได้หมายถึง ตัวเลขหรือข้อมูลที่ได้จากการเก็บรวบรวม เช่น จำนวนผู้ประสบอุบัติเหตุบนท้องถนน อัตราการเกิดของเด็กทารก ปริมาณน้ำฝนในแต่ละปี เป็นต้น สถิติในความหมายที่กล่าวมานี้เรียกอีกอย่างหนึ่งว่า ข้อมูลทางสถิติ (Statistical data)อีกความหมายหนึ่ง สถิติหมายถึง วิธีการที่ว่าด้วยการเก็บรวบรวมข้อมูล การนำเสนอข้อมูล การวิเคราะห์ข้อมูล และการตีความหมายข้อมูล สถิติในความหมายนี้เป็นทั้งวิทยาศาสตร์และศิลปศาสตร์ เรียกว่า “สถิติศาสตร์”สถิติแบ่งออกเป็น 2 ประเภทคือ
สถิติพรรณนา (Descriptive Statistics) เป็นสถิติที่ใช้อธิบายคุณลักษณะต่าง ๆ ของสิ่งที่ต้องการศึกษาในกลุ่มใดกลุ่มหนึ่ง วิธีการทางสถิติที่อยู่ในประเภทนี้ เช่น
การจัดกระทำกับข้อมูลโดยนำเสนอในรูปของตารางหรือรูปภาพ
การแปลงคะแนนให้อยู่ในรูปแบบอื่น ๆ เช่น เปอร์เซ็นต์ไทล์ คะแนนมาตรฐาน ฯ
การคำนวณหาค่าเฉลี่ยหรือการกระจายของข้อมูล เช่น มัชฌิมเลขคณิต มัธยฐาน ส่วนเบี่ยงเบนมาตรฐาน พิสัย ฯ
สถิติอ้างอิง (Inferential Statistics) เป็นสถิติที่ใช้อธิบายคุณลักษณะของสิ่งที่ต้องการศึกษาในกลุ่มใดกลุ่มหนึ่ง แล้วสามารถอ้างอิงไปยังกลุ่มอื่น ๆ ได้ โดยกลุ่มที่นำมาศึกษาจะต้องเป็นตัวแทนที่ดีของประชากร ตัวแทนที่ดีของประชากรได้มาโดยวิธีการสุ่มตัวอย่าง และตัวแทนที่ดีของประชากรจะเรียกว่า “กลุ่มตัวอย่าง” สถิติอ้างอิงสามารถแบ่งออกได้เป็น 2 ประเภทย่อย คือ
สถิติมีพารามิเตอร์ (Parametric Statistics) เป็นวิธีการทางสถิติที่จะต้องเป็นไปตามข้อตกลงเบื้องต้น 3 ประการ ดังนี้
ตัวแปรที่ต้องการวัดจะต้องอยู่ในมาตราการวัดระดับช่วงขึ้นไป (Interval Scale)
ข้อมูลที่เก็บรวบรวมได้จากกลุ่มตัวอย่างจะต้องมีการแจกแจงเป็นโค้งปกติ
กลุ่มประชากรแต่ละกลุ่มที่นำมาศึกษาจะต้องมีความแปรปรวนเท่ากัน
สถิติมีพารามิเตอร์ เช่น t-test, ANOVA, Regression Analysis ฯลฯ
สถิติไร้พารามิเตอร์ (Nonparametric Statistics) เป็นวิธีการทางสถิติที่ไม่มีข้อจำกัดใด ๆ นั่นก็คือ
ตัวแปรที่ต้องการวัดอยู่ในมาตราการวัดระดับใดก็ได้ (Norminal Scale, Ordinal Scale, Interval Scale, Ratio Scale)
ข้อมูลที่เก็บรวบรวมได้จากกลุ่มตัวอย่างมีการแจกแจงแบบใดก็ได้ (Free Distribution)
กลุ่มประชากรแต่ละกลุ่มที่นำมาศึกษาไม่จำเป็นต้องมีความแปรปรวนเท่ากัน
สถิติไร้พารามิเตอร์ เช่น ไคสแควร์, Median Test, Sign test ฯลฯโดยปกติแล้วนักวิจัยมักนิยมใช้สถิติมีพารามิเตอร์ทั้งนี้เพราะผลลัพธ์ที่ได้จากการใช้สถิติมีพารามิเตอร์มีอำนาจการทดสอบ (Power of Test) สูงกว่าการใช้สถิติไร้พารามิเตอร์ ดังนั้นเมื่อข้อมูลมีคุณสมบัติที่สอดคล้องกับข้อตกลงเบื้องต้นสามประการในการใช้สถิติมีพารามิเตอร์ จึงไม่มีผู้ใดคิดที่จะใช้สถิติไร้พารามิเตอร์ในการทดสอบสมมติฐาน
1) การเก็บรวบรวมข้อมูล (Data Collection) ก่อนอื่นผู้วิจัยควรศึกษาและกำหนดข้อมูลที่ใช้หรือที่สนใจเก็บรวบรวมว่ามี อะไรบ้าง ซึ่งอาจก าหนดในรูปของแบบบันทึกข้อมูลหรือการสร้างแบบสอบถามไว้ก่อนแล้วจึงเลือกวิธีการเก็บ รวบรวมข้อมูล โดยวิธีการเก็บรวบรวมข้อมูลมี 4 วิธีดังนี้
1. วิธีสำมะโนครัว คือ การเก็บรวบรวมข้อมูลจากทุกหน่วยของประชากร
2. วิธีสำรวจตัวอย่าง คือ การเก็บรวบรวมข้อมูลจากหน่วยตัวอย่าง ซึ่งโดยทั่วไปควรอาศัยเทคนิคการสุ่ม ตัวอย่าง เพื่อเลือกหน่วยตัวอย่างที่เป็นตัวแทนที่ดีของประชากร 3. วิธีการทดลอง คือ การเก็บรวบรวมข้อมูลหรือสังเกตการณ์จากงานทดลองด้านต่าง ๆ ที่อาจทำใน ห้องปฏิบัติการหรือนอกห้องปฏิบัติการของการทดลอง
4. วิธีเก็บรวบรวมจากทะเบียน คือ การเก็บรวบรวมข้อมูลที่มีผู้บันทึกรวบรวมข้อมูลไว้เสร็จแล้ว ผู้ใช้ไป ศึกษาค้นคว้าและน ามาใช้อีกต่อหนึ่ง
2) การวิเคราะห์ข้อมูล (Data Analysis) เป็นการหาข้อสรุปจากข้อมูล โดยการวิเคราะห์อาจทำได้ใน 2 ระดับ
การวิเคราะห์ข้อมูลขั้นต้น หรือ สถิติเชิงพรรณา (Descriptive Statistics) เป็นการอธิบายลัหษณะของข้อมูลในรูปของการบรรยายลักษณะทั่วๆ ไปของข้อมูลโดยจัดนำเสนอเป็นบทความ บทความกึ่งตาราง แสดงด้วยกราฟ หรือแผนภูมิ ตลอดจนทำเป็นรูปแบบ ของข้อมูลในเบื่องต้นให้สามารถตีความหมายของข้อมูลได้ตามความจริง สถิติบรรยายนี้อาจทำการศึกษากับข้อมูลที่เป็นกลุ่มเล็กๆ หรือกลุ่มใหญ่โดยทั่วๆ ไปก็ได้ และผลการวิเคราะห์จะใช้อธิบายเฉพาะกลุ่มที่นำมาศึกษาเท่านั้น สถิติบรรยายที่ใช้ในงานวิจัย เช่น การแจกแจงความถี่ ร้อยละ การวัดแนวโน้มเข้าสู่ส่วนกลาง การวัดการกระจาย เป็นต้น
การวิเคราะห์ข้อมูลขั้นสูง หรือ สถิติอนุมาน (Inferential Statistics) เป็นเทคนิคที่นำข้อมูล เพียงส่วนหนึ่งไปอธิบายเกี่ยวกับข้อมูลส่วนใหญ่โดยทั่วๆไปโดยใช้พื่้นฐานความน่าจะเป็น เป็นหลักในการอนุมาน หรือทพนายไปยั่งกลุ่มประชากรเป้าหมาย การใช้สถิติอ้างอิงทำได้ 2 ลักษณะ คือ ก่ารประมาณค่าประชากร และการทดสอบสมมติฐาน
3) การแปลความหมายข้อมูล (Data Interpretation) เป็นขั้นตอนของการนำผลการวิเคราะห์ มาอธิบายให้บุคคลทั่วไปเข้าใจ เพื่อใหเงานที่ศึกษาเป็นประโยชน์ต่อคนทั่วไปได้
4) การนำเสนอข้อสรุป (Data Presentation) เป็นการนำผลที่ได้จากการวิเคราะห์ไปตอบคำถาม หรือปํยหาที่ตั้งไว้ในรูปแบบที่คนทั่วไปเข้าใจได้อย่างชัดเจน