สถิติ (Statistics)
ความหมายและขอบเขตของวิชาสถิติ
สถิติ หมายถึง วิชาหรือศาสตร์ที่เป็นทั้งวิทยาศาสตร์และศิลป์ ที่ว่าด้วยการศึกษาข้อมูลซึ่งประกอบด้วยกัน 4 ขั้นตอน คือ
1. การเก็บรวบรวมข้อมูล ( collection of data )
2. การนำเสนอข้อมูล ( presentation of data )
3. การวิเคราะห์ข้อมูล ( analysis of data )
4. การตีความข้อมูล ( interpretation of data )
และอีกนัยหนึ่ง สถิติ หมายถึง ตัวเลขหรือกลุ่มตัวเลขที่แทนข้อเท็จจริงเกี่ยวกับเรื่องใดเรื่องหนึ่ง หรือข้อมูลที่มีการเปลี่ยนแปลง อาจจะนำมาใช้พยากรณ์
ล่วงหน้า หรือนำมาใช้พยากรณ์ล่วงหน้าไม่ได้ เช่น สถิติของนักท่องเที่ยวชาวต่างประเทศที่มาเที่ยวเมืองไทย สถิติของปริมาณน้ำฝนของแต่ละจังหวัด
สถิติของการตัดสินใจและการวางแผน
การตัดสินใจเกี่ยวกับเรื่องต่างๆ ไม่สามารถใช้ข้อมูลเพียงอย่างเดียว ต้องมีการวิเคราะห์ข้อมูลที่เกี่ยวข้องเสียก่อนจึงจะนำมาใช้เพื่อการตัดสินใจ ข้อมูลที่ผ่านการวิเคราะห์ไม่ว่าจะใช้การวิเคราะห์เบื้องต้นหรือขั้นสูงก็ตาม เรียกว่า สารสนเทศ หรือ ข่าวสาร ( Information)
การตัดสินใจจะมีโอกาสผิพลาดได้มากน้อยขึ้นอยู่กับข้อมูลและสารสนเทศที่ผู้ตัดสินใจมีอยู่ โดยข้อมูลและสารสนเทศดังกล่าว หามาด้วยวิธีทางสถิติ ซึ่งเป็นกระบวนการที่เกี่ยวกับการเก็บข้อมูล การนำเสนอข้อมูล การวิเคราะห์ข้อมูลและการตีความหมายของข้อมูลนั่นเอง ดังนั้นควรรู้จักถึงคำหรือนิยามที่ใช้ในทางสถิติ ดังนี้
1. ประชากร หมายถึง เซตของข้อมูลทั้งหมดที่เราต้องการศึกษา
2. ตัวอย่าง หมายถึง สับเซตของประชากรที่เลือกมาศึกษา
3. พารามิเตอร์ หมายถึง ค่าต่างๆที่ใช้อธิบายประชากร เช่นค่าเฉลี่ยเลขคณิความแปรปรวน เป็นต้น
4. ค่าสถิติ หมายถึง ค่าที่คำนวณได้จากตังอย่างและใช้อธิบายตัวอย่าง เช่น ค่าเฉลี่ยเลขคณิต , ส่วนเบี่ยงเบนมาตรฐาน ( SD) เป็นต้น ซึ่งค่าเหล่านี้มักถูกนำมาใช้เป็นค่าประมาณของพารามิเตอร์
5. ค่าสังเกต หมายถึง ค่าของข้อมูลแต่ละตัว
6. ข้อมูลสถิติ หมายถึง ตัวเลขหรือข้อความของค่าสังเกตทั้งหมดของตัวอย่างที่เป็นจริง
โดยทั่วไปแล้ว สิ่งที่เราสนใจก็คือ เรื่องเกี่ยวกับประชากร เช่น ต้องการศึกษาเกี่ยวกับรายได้ของคนกรุงเทพฯ ซึ่งประชากรนั้นมีจำนวนมาก ยากต่อการเก็บรวบรวมข้อมูลได้ครบถ้วน ดังนั้นในทางปฏิบัติ จึงทำ การสุ่มตัวอย่าง กลุ่มหนึ่งออกมา ซึ่งเป็นส่วนหนึ่งของรายได้คนกรุงเทพฯ โดยการสุ่มหรือเลือกตัวอย่างต้องไม่มีความลำเอียงเกิดขึ้น และจำนวนตัวอย่างต้องมีมากพอและเหมาะสมในการศึกษา รายได้ของคนกรุงเทพฯที่เก็บมาได้ในแต่ละรายเรียกว่า ค่าสังเกต นำค่าสังเกตของตังอย่างที่ต้องการรวมกันทั้งหมด เรียกว่า ข้อมูลสถิติ จากนั้นก็นำข้อมูลทางสถิติมานำเสนออย่างเช่น สร้างเป็นตารางแจกแจงความถี่ของรายได้แต่ละช่วง และทำการวิเคราะห์ข้อมูล อย่างเช่น หาค่ากลางที่เหมาะสมสำหรับรายได้ของคนกรุงเทพฯ ใช้เป็นรายได้เฉลี่ยของตัวอย่างคนกรุงเทพฯ ซึ่งอาจจะใช้ค่าเฉลี่ยเลขคณิต ถ้าค่าสังเกตที่เก็บมาได้ใกล้เคียงกัน แต่ถ้ามีค่าสังเกตส่วนน้อยที่มีรายได้สูงมากๆ เมื่อเทียบกับค่าสังเกตทั้งหมด อาจจะต้องใช้ค่ามัธยฐานเป็นรายได้เฉลี่ยของตัวอย่างคนกรุงเทพฯ
เมื่อค่ารายได้เฉลี่ยของตัวอย่างคนกรุงเทพฯเป็นตัวเลขออกมาแล้ว ค่าดังกล่าวเรียกว่า ค่าสถิติ จากนั้นนำค่าสถิติดังกล่าวมาตีความหมายต่อสู่ประชากร นั่นคือ นำค่ารายได้เฉลี่ยของตัวอย่างคนกรุงเทพฯ ไปวิเคราะห์ขั้นสูง เพื่อหารายได้เฉลี่ยของคนกรุงเทพฯออกมา ซึ่งค่าดังกล่าวคือ พารามิเตอร์
ขบวนการทางสถิติจากตังอย่างข้างต้น ถ้าหาเฉพาะค่ารายได้เฉลี่ยของคนกรุงเทพฯในตัวอย่างที่สุ่มมาเท่านั้น ไม่ได้ผ่านกระบวนการวิเคราะห์ขั้นสูงต่อ เพื่อที่จะอธิบายรายได้เฉลี่ยของคนกรุงเทพฯอย่างแท้จริง เราเรียกขบวนการการวิเคราะห์ตรงนี้ว่าเป็น “สถิติเชิงพรรณนา”
· สถิติเชิงพรรณนา ( descriptive statistic) หมายถึง สถิติที่ว่าด้วยการเก็บรวบรวม การนำเสนอ การวิเคราะห์ และการตีความหมายของข้อมูล ซึ่งค่าสถิติที่ได้จะแสดงลักษณะของข้อมูลนั้นเพียงอย่างเดียว ไม่สามารถนำไปใช้พยากรณ์หรือคาดคะเนลักษณะของประชากรได้
แต่ถ้านำค่ารายได้เฉลี่ยของตัวอย่างคนกรุงเทพฯไปวิเคราะห์ต่อในขั้นสูง เพื่อคาดคะเนหรือพยากรณ์รายได้เฉลี่ยของคนกรุงเทพฯทั้งหมดของปีที่ทำการเก็บข้อมูลมาหรือนำไปพยากรณ์ในปีถัดไปพร้อมปัจจัยที่มีผลต่อรายได้คนกรุงเทพฯ เราเรียกขบวนการการวิเคราะห์ดังกล่าวนี้ว่า “สถิติเชิงอนุมาน”
· สถิติเชิงอนุมาน ( inferential statistic ) หมายถึง สถิติที่ว่าด้วยการเก็บรวบรวม การนำเสนอ การวิเคราะห์ และการตีความหมายข้อมูล รวมทั้งการนำค่าสถิติไปดำเนินการทางสถิติเพื่อพยากรณ์หรือคาดคะเนเกี่ยวกับประชากรต่อไป