ความรู้เบื้องต้นเกี่ยวกับสถิต
ความหมายของสถิติ
คำว่า สถิติ (Statistics) มาจากภาษาเยอรมันว่า Statistik มีรากศัพท์มาจาก Stat หมายถึงข้อมูล หรือสารสนเทศ ซึ่งจะอำนวยประโยชน์ต่อการบริหารประเทศในด้านต่าง ๆ เช่น การทำสำมะโนครัว เพื่อจะทราบจำนวนพลเมืองในประเทศทั้งหมด ในสมัยต่อมา คำว่า สถิติ ได้หมายถึง ตัวเลข
หรือข้อมูลที่ได้จากการเก็บรวบรวม เช่น จำนวนผู้ประสบอุบัติเหตุบนท้องถนน อัตราการเกิดของเด็กทารก ปริมาณน้ำฝนในแต่ละปี เป็นต้น สถิติในความหมายที่กล่าวมานี้เรียกอีกอย่างหนึ่งว่า ข้อมูลทางสถิติ (Statistical data)อีกความหมายหนึ่ง สถิติหมายถึง วิธีการที่ว่าด้วยการเก็บรวบรวมข้อมูล การนำเสนอข้อมูล การวิเคราะห์ข้อมูล และการตีความหมายข้อมูล สถิติในความหมายนี้เป็นทั้งวิทยาศาสตร์และศิลปศาสตร์ เรียกว่า “สถิติศาสตร์”สถิติแบ่งออกเป็น 2 ประเภทคือ
สถิติพรรณนา (Descriptive Statistics) เป็นสถิติที่ใช้อธิบายคุณลักษณะต่าง ๆ ของสิ่งที่ต้องการศึกษาในกลุ่มใดกลุ่มหนึ่ง วิธีการทางสถิติที่อยู่ในประเภทนี้ เช่น
การจัดกระทำกับข้อมูลโดยนำเสนอในรูปของตารางหรือรูปภาพ
การแปลงคะแนนให้อยู่ในรูปแบบอื่น ๆ เช่น เปอร์เซ็นต์ไทล์ คะแนนมาตรฐาน ฯ
การคำนวณหาค่าเฉลี่ยหรือการกระจายของข้อมูล เช่น มัชฌิมเลขคณิต มัธยฐาน ส่วนเบี่ยงเบนมาตรฐาน พิสัย ฯ
สถิติอ้างอิง (Inferential Statistics) เป็นสถิติที่ใช้อธิบายคุณลักษณะของสิ่งที่ต้องการศึกษาในกลุ่มใดกลุ่มหนึ่ง แล้วสามารถอ้างอิงไปยังกลุ่มอื่น ๆ ได้ โดยกลุ่มที่นำมาศึกษาจะต้องเป็นตัวแทนที่ดีของประชากร ตัวแทนที่ดีของประชากรได้มาโดยวิธีการสุ่มตัวอย่าง และตัวแทนที่ดีของประชากรจะเรียกว่า “กลุ่มตัวอย่าง” สถิติอ้างอิงสามารถแบ่งออกได้เป็น 2 ประเภทย่อย คือ
สถิติมีพารามิเตอร์ (Parametric Statistics) เป็นวิธีการทางสถิติที่จะต้องเป็นไปตามข้อตกลงเบื้องต้น 3 ประการ ดังนี้
ตัวแปรที่ต้องการวัดจะต้องอยู่ในมาตราการวัดระดับช่วงขึ้นไป (Interval Scale)
ข้อมูลที่เก็บรวบรวมได้จากกลุ่มตัวอย่างจะต้องมีการแจกแจงเป็นโค้งปกติ
กลุ่มประชากรแต่ละกลุ่มที่นำมาศึกษาจะต้องมีความแปรปรวนเท่ากัน
สถิติมีพารามิเตอร์ เช่น t-test, ANOVA, Regression Analysis ฯลฯ
สถิติไร้พารามิเตอร์ (Nonparametric Statistics) เป็นวิธีการทางสถิติที่ไม่มีข้อจำกัดใด ๆ นั่นก็คือ
ตัวแปรที่ต้องการวัดอยู่ในมาตราการวัดระดับใดก็ได้ (Norminal Scale, Ordinal Scale, Interval Scale, Ratio Scale)
ข้อมูลที่เก็บรวบรวมได้จากกลุ่มตัวอย่างมีการแจกแจงแบบใดก็ได้ (Free Distribution)
กลุ่มประชากรแต่ละกลุ่มที่นำมาศึกษาไม่จำเป็นต้องมีความแปรปรวนเท่ากัน
สถิติไร้พารามิเตอร์ เช่น ไคสแควร์, Median Test, Sign test ฯลฯโดยปกติแล้วนักวิจัยมักนิยมใช้สถิติมีพารามิเตอร์ทั้งนี้เพราะผลลัพธ์ที่ได้จากการใช้สถิติมีพารามิเตอร์มีอำนาจการทดสอบ (Power of Test) สูงกว่าการใช้สถิติไร้พารามิเตอร์ ดังนั้นเมื่อข้อมูลมีคุณสมบัติที่สอดคล้องกับข้อตกลงเบื้องต้นสามประการในการใช้สถิติมีพารามิเตอร์ จึงไม่มีผู้ใดคิดที่จะใช้สถิติไร้พารามิเตอร์ในการทดสอบสมมติฐาน
1) การเก็บรวบรวมข้อมูล (Data Collection) ก่อนอื่นผู้วิจัยควรศึกษาและกำหนดข้อมูลที่ใช้หรือที่สนใจเก็บรวบรวมว่ามี อะไรบ้าง ซึ่งอาจก าหนดในรูปของแบบบันทึกข้อมูลหรือการสร้างแบบสอบถามไว้ก่อนแล้วจึงเลือกวิธีการเก็บ รวบรวมข้อมูล โดยวิธีการเก็บรวบรวมข้อมูลมี 4 วิธีดังนี้
1. วิธีสำมะโนครัว คือ การเก็บรวบรวมข้อมูลจากทุกหน่วยของประชากร
2. วิธีสำรวจตัวอย่าง คือ การเก็บรวบรวมข้อมูลจากหน่วยตัวอย่าง ซึ่งโดยทั่วไปควรอาศัยเทคนิคการสุ่ม ตัวอย่าง เพื่อเลือกหน่วยตัวอย่างที่เป็นตัวแทนที่ดีของประชากร 3. วิธีการทดลอง คือ การเก็บรวบรวมข้อมูลหรือสังเกตการณ์จากงานทดลองด้านต่าง ๆ ที่อาจทำใน ห้องปฏิบัติการหรือนอกห้องปฏิบัติการของการทดลอง
4. วิธีเก็บรวบรวมจากทะเบียน คือ การเก็บรวบรวมข้อมูลที่มีผู้บันทึกรวบรวมข้อมูลไว้เสร็จแล้ว ผู้ใช้ไป ศึกษาค้นคว้าและน ามาใช้อีกต่อหนึ่ง
2) การวิเคราะห์ข้อมูล (Data Analysis) เป็นการหาข้อสรุปจากข้อมูล โดยการวิเคราะห์อาจทำได้ใน 2 ระดับ
การวิเคราะห์ข้อมูลขั้นต้น หรือ สถิติเชิงพรรณา (Descriptive Statistics) เป็นการอธิบายลัหษณะของข้อมูลในรูปของการบรรยายลักษณะทั่วๆ ไปของข้อมูลโดยจัดนำเสนอเป็นบทความ บทความกึ่งตาราง แสดงด้วยกราฟ หรือแผนภูมิ ตลอดจนทำเป็นรูปแบบ ของข้อมูลในเบื่องต้นให้สามารถตีความหมายของข้อมูลได้ตามความจริง สถิติบรรยายนี้อาจทำการศึกษากับข้อมูลที่เป็นกลุ่มเล็กๆ หรือกลุ่มใหญ่โดยทั่วๆ ไปก็ได้ และผลการวิเคราะห์จะใช้อธิบายเฉพาะกลุ่มที่นำมาศึกษาเท่านั้น สถิติบรรยายที่ใช้ในงานวิจัย เช่น การแจกแจงความถี่ ร้อยละ การวัดแนวโน้มเข้าสู่ส่วนกลาง การวัดการกระจาย เป็นต้น
การวิเคราะห์ข้อมูลขั้นสูง หรือ สถิติอนุมาน (Inferential Statistics) เป็นเทคนิคที่นำข้อมูล เพียงส่วนหนึ่งไปอธิบายเกี่ยวกับข้อมูลส่วนใหญ่โดยทั่วๆไปโดยใช้พื่้นฐานความน่าจะเป็น เป็นหลักในการอนุมาน หรือทพนายไปยั่งกลุ่มประชากรเป้าหมาย การใช้สถิติอ้างอิงทำได้ 2 ลักษณะ คือ ก่ารประมาณค่าประชากร และการทดสอบสมมติฐาน
3) การแปลความหมายข้อมูล (Data Interpretation) เป็นขั้นตอนของการนำผลการวิเคราะห์ มาอธิบายให้บุคคลทั่วไปเข้าใจ เพื่อใหเงานที่ศึกษาเป็นประโยชน์ต่อคนทั่วไปได้
4) การนำเสนอข้อสรุป (Data Presentation) เป็นการนำผลที่ได้จากการวิเคราะห์ไปตอบคำถาม หรือปํยหาที่ตั้งไว้ในรูปแบบที่คนทั่วไปเข้าใจได้อย่างชัดเจน
1.1 ความหมายของสถิติ
ความหมายของสถิติ
คำว่า สถิติ (Statistics) มาจากภาษาเยอรมันว่า Statistik มีรากศัพท์มาจาก Stat หมายถึงข้อมูล หรือสารสนเทศ ซึ่งจะอำนวยประโยชน์ต่อการบริหารประเทศในด้านต่าง ๆ เช่น การทำสำมะโนครัว เพื่อจะทราบจำนวนพลเมืองในประเทศทั้งหมด ในสมัยต่อมา คำว่า สถิติ ได้หมายถึง ตัวเลขหรือข้อมูลที่ได้จากการเก็บรวบรวม เช่น จำนวนผู้ประสบอุบัติเหตุบนท้องถนน อัตราการเกิดของเด็กทารก ปริมาณน้ำฝนในแต่ละปี เป็นต้น สถิติในความหมายที่กล่าวมานี้เรียกอีกอย่างหนึ่งว่า ข้อมูลทางสถิติ (Statistical data)อีกความหมายหนึ่ง สถิติหมายถึง วิธีการที่ว่าด้วยการเก็บรวบรวมข้อมูล การนำเสนอข้อมูล การวิเคราะห์ข้อมูล และการตีความหมายข้อมูล สถิติในความหมายนี้เป็นทั้งวิทยาศาสตร์และศิลปศาสตร์ เรียกว่า “สถิติศาสตร์”สถิติแบ่งออกเป็น 2 ประเภทคือ
· สถิติพรรณนา (Descriptive Statistics) เป็นสถิติที่ใช้อธิบายคุณลักษณะต่าง ๆ ของสิ่งที่ต้องการศึกษาในกลุ่มใดกลุ่มหนึ่ง วิธีการทางสถิติที่อยู่ในประเภทนี้ เช่น
· การจัดกระทำกับข้อมูลโดยนำเสนอในรูปของตารางหรือรูปภาพ
· การแปลงคะแนนให้อยู่ในรูปแบบอื่น ๆ เช่น เปอร์เซ็นต์ไทล์ คะแนนมาตรฐาน ฯ
· การคำนวณหาค่าเฉลี่ยหรือการกระจายของข้อมูล เช่น มัชฌิมเลขคณิต มัธยฐาน ส่วนเบี่ยงเบนมาตรฐาน พิสัย ฯ
· สถิติอ้างอิง (Inferential Statistics) เป็นสถิติที่ใช้อธิบายคุณลักษณะของสิ่งที่ต้องการศึกษาในกลุ่มใดกลุ่มหนึ่ง แล้วสามารถอ้างอิงไปยังกลุ่มอื่น ๆ ได้ โดยกลุ่มที่นำมาศึกษาจะต้องเป็นตัวแทนที่ดีของประชากร ตัวแทนที่ดีของประชากรได้มาโดยวิธีการสุ่มตัวอย่าง และตัวแทนที่ดีของประชากรจะเรียกว่า “กลุ่มตัวอย่าง” สถิติอ้างอิงสามารถแบ่งออกได้เป็น 2 ประเภทย่อย คือ
· สถิติมีพารามิเตอร์ (Parametric Statistics) เป็นวิธีการทางสถิติที่จะต้องเป็นไปตามข้อตกลงเบื้องต้น 3 ประการ ดังนี้
· ตัวแปรที่ต้องการวัดจะต้องอยู่ในมาตรการวัดระดับช่วงขึ้นไป (Interval Scale)
· ข้อมูลที่เก็บรวบรวมได้จากกลุ่มตัวอย่างจะต้องมีการแจกแจงเป็นโค้งปกติ
· กลุ่มประชากรแต่ละกลุ่มที่นำมาศึกษาจะต้องมีความแปรปรวนเท่ากัน
สถิติมีพารามิเตอร์ เช่น t-test, ANOVA, Regression Analysis ฯลฯ
· สถิติไร้พารามิเตอร์ (Nonparametric Statistics) เป็นวิธีการทางสถิติที่ไม่มีข้อจำกัดใด ๆ นั่นก็คือ
· ตัวแปรที่ต้องการวัดอยู่ในมาตรการวัดระดับใดก็ได้ (Norminal Scale, Ordinal Scale, Interval Scale, Ratio Scale)
· ข้อมูลที่เก็บรวบรวมได้จากกลุ่มตัวอย่างมีการแจกแจงแบบใดก็ได้ (Free Distribution)
· กลุ่มประชากรแต่ละกลุ่มที่นำมาศึกษาไม่จำเป็นต้องมีความแปรปรวนเท่ากัน
สถิติไร้พารามิเตอร์ เช่น ไคสแควร์, Median Test, Sign test ฯลฯโดยปกติแล้วนักวิจัยมักนิยมใช้สถิติมีพารามิเตอร์ทั้งนี้เพราะผลลัพธ์ที่ได้จากการใช้สถิติมีพารามิเตอร์มีอำนาจการทดสอบ (Power of Test) สูงกว่าการใช้สถิติไร้พารามิเตอร์ ดังนั้นเมื่อข้อมูลมีคุณสมบัติที่สอดคล้องกับข้อตกลงเบื้องต้นสามประการในการใช้สถิติมีพารามิเตอร์ จึงไม่มีผู้ใดคิดที่จะใช้สถิติไร้พารามิเตอร์ในการทดสอบสมมติฐาน
1) การเก็บรวบรวมข้อมูล (Data Collection) ก่อนอื่นผู้วิจัยควรศึกษาและกำหนดข้อมูลที่ใช้หรือที่สนใจเก็บรวบรวมว่ามี อะไรบ้าง ซึ่งอาจกำหนดในรูปของแบบบันทึกข้อมูลหรือการสร้างแบบสอบถามไว้ก่อนแล้วจึงเลือกวิธีการเก็บ รวบรวมข้อมูล โดยวิธีการเก็บรวบรวมข้อมูลมี 4 วิธีดังนี้
1. วิธีสำมะโนครัว คือ การเก็บรวบรวมข้อมูลจากทุกหน่วยของประชากร
2. วิธีสำรวจตัวอย่าง คือ การเก็บรวบรวมข้อมูลจากหน่วยตัวอย่าง ซึ่งโดยทั่วไปควรอาศัยเทคนิคการสุ่ม ตัวอย่าง เพื่อเลือกหน่วยตัวอย่างที่เป็นตัวแทนที่ดีของประชากร 3. วิธีการทดลอง คือ การเก็บรวบรวมข้อมูลหรือสังเกตการณ์จากงานทดลองด้านต่าง ๆ ที่อาจทำใน ห้องปฏิบัติการหรือนอกห้องปฏิบัติการของการทดลอง
4. วิธีเก็บรวบรวมจากทะเบียน คือ การเก็บรวบรวมข้อมูลที่มีผู้บันทึกรวบรวมข้อมูลไว้เสร็จแล้ว ผู้ใช้ไป ศึกษาค้นคว้าและนำมาใช้อีกต่อหนึ่ง
2) การวิเคราะห์ข้อมูล (Data Analysis) เป็นการหาข้อสรุปจากข้อมูล โดยการวิเคราะห์อาจทำได้ใน 2 ระดับ
- การวิเคราะห์ข้อมูลขั้นต้น หรือ สถิติเชิงพรรณา (Descriptive Statistics) เป็นการอธิบายลักษณะของข้อมูลในรูปของการบรรยายลักษณะทั่วๆ ไปของข้อมูลโดยจัดนำเสนอเป็นบทความ บทความกึ่งตาราง แสดงด้วยกราฟ หรือแผนภูมิ ตลอดจนทำเป็นรูปแบบ ของข้อมูลในเบื้องต้นให้สามารถตีความหมายของข้อมูลได้ตามความจริง สถิติบรรยายนี้อาจทำการศึกษากับข้อมูลที่เป็นกลุ่มเล็กๆ หรือกลุ่มใหญ่โดยทั่วๆ ไปก็ได้ และผลการวิเคราะห์จะใช้อธิบายเฉพาะกลุ่มที่นำมาศึกษาเท่านั้น สถิติบรรยายที่ใช้ในงานวิจัย เช่น การแจกแจงความถี่ ร้อยละ การวัดแนวโน้มเข้าสู่ส่วนกลาง การวัดการกระจาย เป็นต้น
- การวิเคราะห์ข้อมูลขั้นสูง หรือ สถิติอนุมาน (Inferential Statistics) เป็นเทคนิคที่นำข้อมูล เพียงส่วนหนึ่งไปอธิบายเกี่ยวกับข้อมูลส่วนใหญ่โดยทั่วๆ ไปโดยใช้พื้นฐานความน่าจะเป็น เป็นหลักในการอนุมาน การใช้สถิติอ้างอิงทำได้ 2 ลักษณะ คือ การประมาณค่าประชากร และการทดสอบสมมติฐาน
3) การแปลความหมายข้อมูล (Data Interpretation) เป็นขั้นตอนของการนำผลการวิเคราะห์ มาอธิบายให้บุคคลทั่วไปเข้าใจ เพื่อให้งานที่ศึกษาเป็นประโยชน์ต่อคนทั่วไปได้
4) การนำเสนอข้อสรุป (Data Presentation) เป็นการนำผลที่ได้จากการวิเคราะห์ไปตอบคำถาม หรือปัญหาที่ตั้งไว้ในรูปแบบที่คนทั่วไปเข้าใจได้อย่างชัดเจน
1.2 ความหมายของข้อมูล
ความหมายของข้อมูล
ข้อมูล (Data) หมายถึงข้อเท็จจริงที่สามารถแสดงอยู่ในรูปของตัวเลขหรือข้อความ ซึ่งสามารถจำแนกได้ดังนี้
ประเภทของขอมูลโดยจำแนกตามลักษณะของข้อมูล แบ่งได้ดังนี้
1) ข้อมูลเชิงปริมาณ (Quantitative Data) เป็นข้อมูลที่แสดงความแตกต่างในเรื่องปริมาณหรือขนาด ในลักษณะของตัวเลขโดยตรง เช่น อายุ ส่วนสูง น้ำหนัก ซึ่งแบ่งได้เป็น 2 ประเภท คือ
– ข้อมูลแบบไม่ต่อเนื่อง (Discrete Data) หมายถึง ข้อมูลที่มีค่าเป็นเลขจำนวนเต็มที่มีความหมาย เช่น จำนวนสิ่งของ จำนวนคน เป็นต้น
– ข้อมูลแบบต่อเนื่อง ( Continuous Data) หมายถึง ข้อมูลที่อยู่ในรูปตัวเลขที่มีค่าได้ทุกค่าในช่วงที่กำหนด และมีความหมายด้วย เช่น รายได้ น้ำหนัก เป็นต้น
2) ข้อมูลเชิงคุณภาพ (Qualitative Data) หมายถึงข้อมูลที่แสดงอยู่ในรูปข้อความเป็นการอธิบายลักษณะเชิงคุณภาพ เช่น เพศ ศาสนา เป็นต้น
ประเภทของข้อมูลโดยจำแนกตามแหล่งข้อมูล แบ่งได้ดังนี้
1) ข้อมูลปฐมภูมิ (Primary Data) หมายถึงข้อมูลที่เก็บจากหน่วยที่ให้ข้อมูลโดยตรง ไม่มีการเปลี่ยนรูปหรือความหมาย เช่น ข้อมูลจากกาสัมภาษณ์ การสังเกต การทดลอง ฯลฯ เนื่องจากเป็นข้อมูลที่เก็บจากแหล่งข้อมูลโดยตรง ดังนั้นจึงมีความเชื่อถือได้สูง และเก็บข้อมูลได้ตรงกับความต้องการ แต่มีข้อจำกัดที่จะต้องใช้เวลา เสียค่าใช้จ่ายในการรวบรวมสูง
2) ข้อมูลทุติยภูมิ (Secondary Data) หมายถึงข้อมูลที่รวบรวมมาจากข้อมูลที่ผู้อื่นรวบรวมไว้แล้ว เช่น รายงานสถิติต่างๆ ข้อมูลเวชระเบียน เอกสารรายงานผู้ป่วย ฯลฯ
ข้อดีของการใช้ข้อมูลทุติยภูมิ คือ สะดวก รวดเร็ว ประหยัดเวลาแรงงาน มีข้อมูลที่สามารถย้อนหลังได้ แต่มีข้อจำกัดเนื่องจากข้อมูลมักไม่สมบูรณ์ ไม่ตรงกับเรื่องที่ต้องการศึกษา และไม่ทันสมัย
ข้อมูลสถิติ (Statistical Data) เป็นข้อมูลหลายๆ หน่วยซึงสามารถสรุปคุณลักษณะของข้อมูลชุดนั้นได้ น้ำหนักของเด็ก 10 คน หรือเป็นข้อมูลซึ่งเกิดจากการสรุปคุณลักษณะของข้อมูลชุดนั้น เช่น เด็กส่วนใหญ่หนัก 40 กิโลกรัม เป็นต้น
1.3 ระดับการวัดของข้อมูล
ระดับการวัดของข้อมูล
การวัดเป็นการกำหนดตัวเลขให้กับสิ่งที่ต้องการศึกษาภายใต้กฎเกณฑ์ที่แน่นอน ผู้วิจัยจำเป็นจะต้องทราบคุณลักษณะของข้อมูลที่ถูกวัด เพื่อใช้ในการพิจารณาว่าจะเลือกใช้วิธีการทางสถิติใดจึงจะเหมาะสม ดังนั้นจึงควรทราบว่าข้อมูลที่ถูกวัดมานั้นอยู่ในมาตรการวัดระดับใด ซึ่งมาตรการวัดแบ่งออกเป็น 4 ระดับคือ
ระดับที่ 1 มาตรการวัดระดับนามบัญญัติ (Nominal Scale) เป็นระดับที่ใช้จำแนกความแตกต่างของสิ่งที่ต้องการวัดออกเป็นกลุ่ม ๆ โดยใช้ตัวเลข เช่น ตัวแปรเพศ แบ่งออกเป็นกลุ่มเพศชายและกลุ่มเพศหญิง ในการกำหนดตัวเลขอาจจะใช้เลข 1 แทนเพศชาย และเลข 2 แทนเพศหญิง ตัวแปรระดับการศึกษา แบ่งออกเป็นกลุ่มที่มีการศึกษาต่ำกว่าปริญญาตรี อาจจะแทนด้วยเลข 1 กลุ่มที่มีการศึกษาระดับปริญญาตรี อาจจะแทนด้วยเลข 2 และกลุ่มที่มีการศึกษาสูงกว่าระดับปริญญาตรี อาจจะแทนด้วยเลข 3 เป็นต้น ตัวเลข 1 หรือ 2 หรือ 3 ที่ใช้แทนกลุ่มต่าง ๆ นั้น ถือเป็นตัวเลขในระดับนามบัญญัติไม่สามารถนำมาบวก ลบ คูณ หาร หรือหาสัดส่วนได้
ระดับที่ 2 มาตรการวัดระดับเรียงอันดับ (Ordinal Scales) เป็นระดับที่ใช้สำหรับจัดอันดับที่หรือตำแหน่งของสิ่งที่ต้องการวัด ตัวเลขในมาตรการวัดระดับนี้เป็นตัวเลขที่บอกความหมายในลักษณะมาก-น้อย สูง-ต่ำ เก่ง-อ่อน กว่ากัน เช่น ด.ช.ดำสอบได้ที่ 1 ด.ช.แดงสอบได้ที่ 2 ด.ญ.เขียวสอบได้ที่ 3 หรือ การประกวดร้องเพลง นางสาวเขียวได้รางวัลที่ 1 นางสาวชมพูได้รางวัลที่ 2 นางสาวเหลืองได้รางวัลที่ 3 เป็นต้น ตัวเลขอันดับที่แตกต่างกันไม่สามารถบ่งบอกถึงปริมาณความแตกต่างได้ เช่น ไม่สามารถบอกได้ว่าผู้ที่ประกวดร้องเพลงได้รางวัลที่ 1 มีความเก่งมากกว่าผู้ที่ได้รางวัลที่ 2 ในปริมาณเท่าใด ตัวเลขในระดับนี้สามารถนำมาบวกหรือลบ กันได้
ระดับที่ 3 มาตรการวัดระดับช่วง (Interval Scale) เป็นระดับที่สามารถกำหนดค่าตัวเลขโดยมีช่วงห่างระหว่างตัวเลขเท่า ๆ กัน สามารถนำตัวเลขมาเปรียบเทียบกันได้ว่าว่ามีปริมาณมากน้อยเท่าใด แต่ไม่สามารถบอกได้ว่าเป็นกี่เท่าของกันและกัน เพราะมาตรการวัดระดับนี้ไม่มี 0 (ศูนย์) แท้ มีแต่ 0 (ศูนย์) สมมติ เช่น นายวิชัยสอบได้ 0 คะแนน มิได้หมายความว่าเขาไม่มีความรู้ เพียงแต่เขาไม่สามารถทำข้อสอบซึ่งเป็นตัวแทนของความรู้ทั้งหมดได้ หรือ อุณหภูมิ 0 องศา มิได้หมายความว่าจะไม่มีความร้อน เพียงแต่มีความร้อนเป็น 0 องศาเท่านั้น จุดที่ไม่มีความร้อนอยู่เลยก็คือที่ –273 องศา ดังนั้นอุณหภูมิ 40 องศาจึงไม่สามารถบอกได้ว่ามีความร้อนเป็น 2 เท่าของอุณหภูมิ 20 องศา เป็นต้น ตัวเลขในระดับนี้สามารถนำมาบวก ลบ คูณ หรือหารกันได้
ระดับที่ 4 มาตรการวัดระดับอัตราส่วน (Ratio Scale) เป็นระดับที่สามารถกำหนดค่าตัวเลขให้กับสิ่งที่ต้องการวัด มี 0 (ศูนย์) แท้ เช่น น้ำหนัก ความสูง อายุ เป็นต้น ระดับนี้สามารถนำตัวเลขมาบวก ลบ คูณ หาร หรือหาอัตราส่วนกันได้ คือสามารถบอกได้ว่า ถนนสายหนึ่งยาว 50 กิโลเมตร ยาวเป็น 2 เท่าของถนนอีกสายหนึ่งที่ยาวเพียง 25 กิโลเมตร
ดังนั้น ผู้วิจัยจึงต้องมีความรู้ในเรื่องของมาตรการวัดระดับต่าง ๆ เป็นอย่างดี เพื่อใช้ในการวินิจฉัยตัวแปรในงานวิจัยว่าอยู่ในมาตรการวัดระดับใด เพื่อประโยชน์ในการเลือกใช้วิธีการทางสถิติให้มีความถูกต้องเหมาะสม
1.4 ประชากรและกลุ่มตัวอย่าง
ประชากรและกลุ่มตัวอย่าง
ประชากร (Population) หมายถึง ทั้งหมดของสิ่งที่ผู้วิจัยต้องการศึกษาอาจเป็นสิ่งมีชีวิตหรือไม่มีชีวิตก็ได้ขอบเขตประชากรที่ใช้ในการวิจัยจะกว้างมากหรือน้อยขื้นอยู่กับจุดมุ่งหมายของผู้วิจัย และประโยชน์ที่จะนำผลการวิจัยไปใช้
หัวข้อปัญหา : ผลสัมฤทธิ์ทางการเรียนคณิตศาสตร์ของนักเรียนมัธยมศึกษาตอนปลาย
ประชากร คือ นักเรียนมัธยมศึกษาตอนปลายทั่วประเทศ
หัวข้อปัญหา : ผลสัมฤทธิ์ทางการเรียนคณิตศาสตร์ของนักเรียนมัธยมศึกษาตอนปลายในเขตกรุงเทพมหานคร
ประชากร คือ นักเรียนมัธยมศึกษาตอนปลายในเขตกรุงเทพมหานคร
ความสำคัญของการกำหนดประชากรในการวิจัย
1. ทำให้ผู้วิจัยทราบว่าประชากรที่จะศึกษาคืออะไร มีขอบเขตที่จะเก็บข้อมูลแค่ไหน จะได้
ดำเนินการเก็บข้อมูลเฉพาะกลุ่มที่อยู่ในขอบเขตประชากรเท่านั้น ที่อยู่นอกเหนือขอบเขตจะ
ไม่เข้าไปเก็บข้อมูล
2. ทำให้ผู้วิจัยสามารถสรุปผลและอ้างอิงผลการวิจัยจากกลุ่มตัวอย่างไปสู่ประชากรได้ในการทำวิจัย ถ้าผู้วิจัยสามารถเก็บข้อมูลข้อมูลกับประชากรทั้งหมดได้จะได้ข้อมูลที่ตรงกับความจริง แต่บางครั้งถ้าจำนวนประชากรมีมากจนเกินไป จะทำให้สิ้นเปลืองเวลา แรงงาน งบประมาณ จำนวนมาก และ เกิดความคลาดเคลื่อนในระหว่างการเก็บและการจัดกระทำข้อมูลได้สูง จึงต้องทำการสุ่มกลุ่มตัวอย่างจากประชากรให้มีจำนวนน้อยลง แล้วจึงเก็บข้อมูลจากกลุ่มตัวอย่าง
กลุ่มตัวอย่าง (Sample)หมายถึง บางส่วนของประชากรที่ผู้วิจัยเลือกมาเป็นตัวแทนในการศึกษา คำว่า ตัวแทน แปลว่า มีคุณสมบัติเท่าเทียมกัน ใช้แทนกันได้
ลักษณะของกลุ่มตัวอย่างที่เป็นตัวแทนของประชากร
1. ต้องมีขนาดหรือจำนวนพอเหมาะ ทำได้โดยการกำหนดเป็นเปอร์เซ็นของจำนวนประชากร ใช้สูตรคำนวณ หรือใช้ตารางกำหนดขนาดกลุ่มตัวอย่างสำเร็จรูป
2. ต้องมีลักษณะเหมือนกลุ่มประชากร ทำได้โดยใช้วิธีสุ่มตัวอย่าง
การกำหนดขนาดของกลุ่มตัวอย่าง
1.กำหนดโดยใช้เปอร์เซ็นของจำนวนประชากร ดังนี้
ถ้าจำนวนประชากรมีจำนวนหลักร้อย ใช้กลุ่มตัวอย่าง 25 %
ถ้าจำนวนประชากรมีจำนวนหลักพัน ใช้กลุ่มตัวอย่าง 10 %
ถ้าจำนวนประชากรมีจำนวนหลักหมื่น ใช้กลุ่มตัวอย่าง 5 %
ถ้าจำนวนประชากรมีจำนวนหลักแสน ใช้กลุ่มตัวอย่าง 1 %
2. กำหนดโดยใช้สูตรคำนวณ เช่น
3. กำหนดโดยใช้ตารางกำหนดขนาดกลุ่มตัวอย่างสำเร็จรูป เช่น ตารางสำเร็จรูปของเครจซีและมอร์แกน (Krejcie and Morgan)
กรณีไม่ทราบขนาดที่แน่นอนของประชากรใช้สูตรของ W.G.cochran
การสุ่มตัวอย่าง (Random Sampling)
การสุ่มตัวอย่างแบ่งเป็น 2 ประเภท คือ
1. การสุ่มตัวอย่างโดยไม่ใช้ความน่าจะเป็น เป็นการสุ่มตัวอย่างที่ไม่เปิดโอกาสให้ทุกหน่วยของประชากรมีโอกาสถูกเลือกเท่า ๆ กัน ได้แก่
การสุ่มแบบบังเอิญ สุ่มโดยพบใครที่เป็นกลุ่มเป้าหมายก็เข้าไปเก็บข้อมูลจนได้กลุ่มตัวอย่างครบตามจำนวนที่กำหนด
การสุ่มแบบโควต้า สุ่มโดยแบ่งประชากรออกเป็นกลุ่ม ๆ แล้วกำหนดสัดส่วนแต่ละกลุ่ม แล้วจึงสุ่มตัวอย่างในแต่ละกลุ่มตามสัดส่วนที่กำหนด โดยใช้การสุ่มแบบบังเอิญ
การสุ่มแบบตามจุดมุ่งหมาย สุ่มโดยเลือกกลุ่มตัวอย่างตามวิจารณญานของผู้วิจัยว่ากลุ่มตัวอย่างลักษณะใดจึงเหมาะสมกับจุดมุ่งหมายการวิจัย
การสุ่มแบบตามสะดวก สุ่มโดยเลือกกลุ่มตัวอย่างตามความสะดวกในการเก็บข้อมูลของผู้วิจัย
การสุ่มแบบก้อนหิมะ สุ่มโดยเลือกตัวอย่างที่มีคุณสมบัติตามที่ต้องการ 1 คนเมื่อได้ข้อมูลแล้ว ขอให้แนะนำคนอื่นต่อ ๆ ไป
2. การสุ่มตัวอย่างโดยใช้ความน่าจะเป็น เป็นการสุ่มตัวอย่างที่เปิดโอกาสให้ทุกหน่วย
ของประชากรมีโอกาสถูกเลือกเท่า ๆ กัน
การสุ่มอย่างง่าย (Simple Random Sampling) เหมาะกับประชากรที่มีจำนวนไม่มาก และมีลักษณะไม่แตกต่างกัน มี 2 วิธี คือ
1) วิธีการจับฉลาก ทำได้โดย
1. เขียนชื่อสมาชิกทุกคนลงในฉลาก
2. กำหนดจำนวนกลุ่มตัวอย่าง
3. นำฉลากใส่กล่องแล้วสุ่มหยิบขึ้นมา ให้ครบตามจำนวนกลุ่มตัวอย่าง
2) วิธีเปิดตารางเลขสุ่มตัวอย่าง ทำได้โดย
1. กำหนดเลขที่แทนทุกหน่วยของประชากร
2. กำหนดจำนวนกลุ่มตัวอย่าง
3. กำหนดทิศทางของการอ่านตารางว่าจะ อ่านขึ้น ลง ซ้าย หรือขวา
4. อ่านตัวเลขเท่ากับหลักของจำนวนประชากรเช่น ประชากรมี 500 คน ให้อ่านทีละ 3 หลัก ตัวเลขที่ได้คือหน่วยที่ถูกเลือกมา เป็นกลุ่มตัวอย่าง ถ้าซ้ำหรือเกินให้ข้ามไป
5. อ่านตัวเลขจนครบตามจำนวนกลุ่มตัวอย่าง
ตัวอย่างตารางเลขสุ่มตัวอย่าง
การสุ่มแบบมีระบบ (Systematic Random Sampling) เหมาะกับประชากรที่จัดเรียงเป็นระบบอยู่แล้ว เช่น เรียงตามตัวอักษร ทำได้โดย
1. กำหนดเลขที่แทนทุกหน่วยของประชากร
2. กำหนดจำนวนกลุ่มตัวอย่าง
3. หาช่วงของการสุ่ม ( i =N/n) เมื่อ N แทน จำนวนประชากร n แทน จำนวนกลุ่มตัวอย่าง)
4. เลือกหน่วยเริ่มต้นโดยการสุ่ม หรือ อาจใช้ตารางเลขสุ่ม
5. เลือกหน่วยต่อ ๆ ไปที่ตกอยู่ในช่วงการสุ่ม จนครบตามจำนวนกลุ่มตัวอย่าง เช่น ประชากรมี 20 คน ลำดับที่ 1 – 20 ต้องการสุ่ม 4 คน ช่วงการสุ่ม i = 20/4 = 5
สุ่มหน่วยเริ่มต้น ได้หมายเลข 3 หน่วยต่อไป คือ 3 + 5 = 8 8 + 5 = 13 และ 13 + 5 = 18
ดั้งนั้น กลุ่มตัวอย่าง 4 คน คือ หมายเลข 3 8 13 และ 18
การสุ่มแบบระดับชั้น (Startified Random Sampling) เหมาะกับประชากรที่มีลักษณะแตกต่างกันจนแยกเป็นกลุ่มย่อยตามที่แตกต่างกันได้ เช่น เพศ คณะที่สังกัด อาชีพ ระดับการศึกษา ทำได้โดย
1.แบ่งประชากรออกเป็นกลุ่มย่อย โดยให้ลักษณะภายในกลุ่มคล้ายคลึงกันมากที่สุด
ลักษณะระหว่างกลุ่มแตกต่างกันมากที่สุด
2. สุ่มตัวอย่างจากประชากรกลุ่มย่อยโดยการสุ่มอย่างง่าย ตามสัดส่วนประชากรกลุ่มย่อย
การสุ่มแบบแบ่งกลุ่ม (Cluster Random Sampling) เหมาะกับประชากรที่อยู่กระจัดกระจาย ทำได้โดย
1.แบ่งประชากรออกเป็นกลุ่มย่อย โดยให้ลักษณะภายในกลุ่มแตกต่างกันมากที่สุด
ลักษณะระหว่างกลุ่มคล้ายคลึงกันมากที่สุด
2. สุ่มบางกลุ่มขึ้นมาศึกษา
การสุ่มแบบหลายขั้นตอน(Multistage Random Sampling) เป็นการสุ่มตัวอย่างที่ประกอบด้วยหลาย ๆ วิธี หรือ วิธีเดียวแต่หลายขั้น เช่น
การสุ่มแบบแบ่งกลุ่มที่มีหลายขั้นตอน
การสุ่มแบบระดับชั้นที่มีหลายชั้น
การสุ่มผสมระหว่างแบ่งกลุ่ม กับระดับชั้น
การสุ่มแบบหลายขั้นตอนเหมาะกับประชากรที่มีขนาดใหญ่มาก