สถิติและการวิจัย
|
สถิติและการวิจัย
คำว่า
สถิติ (Statistics)
มาจากภาษาเยอรมันว่า Statistik มีรากศัพท์มาจาก
Stat หมายถึงข้อมูล หรือสารสนเทศ
ซึ่งจะอำนวยประโยชน์ต่อการบริหารประเทศในด้านต่าง ๆ เช่น การทำสำมะโนครัว
เพื่อจะทราบจำนวนพลเมืองในประเทศทั้งหมด ในสมัยต่อมา คำว่า สถิติ ได้หมายถึง
ตัวเลขหรือข้อมูลที่ได้จากการเก็บรวบรวม เช่น จำนวนผู้ประสบอุบัติเหตุบนท้องถนน
อัตราการเกิดของเด็กทารก ปริมาณน้ำฝนในแต่ละปี เป็นต้น
สถิติในความหมายที่กล่าวมานี้เรียกอีกอย่างหนึ่งว่า ข้อมูลทางสถิติ (Statistical
data) อีกความหมายหนึ่ง สถิติหมายถึง วิธีการที่ว่าด้วยการเก็บรวบรวมข้อมูล
การนำเสนอข้อมูล การวิเคราะห์ข้อมูล และการตีความหมายข้อมูล
สถิติในความหมายนี้เป็นทั้งวิทยาศาสตร์และศิลปศาสตร์ เรียกว่า
"สถิติศาสตร์"
ประเภท สถิติแบ่งออกเป็น 2 ประเภทคือ
สถิติพรรณนา (Descriptive Statistics) เป็นสถิติที่ใช้อธิบายคุณลักษณะต่าง
ๆ ของสิ่งที่ต้องการศึกษาในกลุ่มใดกลุ่มหนึ่ง วิธีการทางสถิติที่อยู่ในประเภทนี้
เช่น
การจัดกระทำกับข้อมูลโดยนำเสนอในรูปของตารางหรือรูปภาพ
การแปลงคะแนนให้อยู่ในรูปแบบอื่น ๆ เช่น เปอร์เซ็นต์ไทล์
คะแนนมาตรฐาน ฯ
การคำนวณหาค่าเฉลี่ยหรือการกระจายของข้อมูล เช่น มัชฌิมเลขคณิต
มัธยฐาน ส่วนเบี่ยงเบนมาตรฐาน พิสัย ฯ
สถิติอ้างอิง (Inferential Statistics) เป็นสถิติที่ใช้อธิบายคุณลักษณะของสิ่งที่ต้องการศึกษาในกลุ่มใดกลุ่มหนึ่ง
แล้วสามารถอ้างอิงไปยังกลุ่มอื่น ๆ ได้
โดยกลุ่มที่นำมาศึกษาจะต้องเป็นตัวแทนที่ดีของประชากร ตัวแทนที่ดีของประชากรได้มาโดยวิธีการสุ่มตัวอย่าง
และตัวแทนที่ดีของประชากรจะเรียกว่า "กลุ่มตัวอย่าง"
สถิติอ้างอิงสามารถแบ่งออกได้เป็น 2 ประเภทย่อย คือ
สถิติมีพารามิเตอร์ (Parametric Statistics) เป็นวิธีการทางสถิติที่จะต้องเป็นไปตามข้อตกลงเบื้องต้น
3 ประการ ดังนี้
ตัวแปรที่ต้องการวัดจะต้องอยู่ในมาตราการวัดระดับช่วงขึ้นไป (Interval
Scale)
ข้อมูลที่เก็บรวบรวมได้จากกลุ่มตัวอย่างจะต้องมีการแจกแจงเป็นโค้งปกติ
กลุ่มประชากรแต่ละกลุ่มที่นำมาศึกษาจะต้องมีความแปรปรวนเท่ากัน
สถิติมีพารามิเตอร์ เช่น t-test, ANOVA, Regression Analysis ฯลฯ
สถิติไร้พารามิเตอร์ (Nonparametric Statistics) เป็นวิธีการทางสถิติที่ไม่มีข้อจำกัดใด ๆ นั่นก็คือ
ตัวแปรที่ต้องการวัดอยู่ในมาตราการวัดระดับใดก็ได้ (Norminal
Scale, Ordinal Scale, Interval Scale, Ratio Scale)
ข้อมูลที่เก็บรวบรวมได้จากกลุ่มตัวอย่างมีการแจกแจงแบบใดก็ได้ (Free
Distribution)
กลุ่มประชากรแต่ละกลุ่มที่นำมาศึกษาไม่จำเป็นต้องมีความแปรปรวนเท่ากัน
สถิติไร้พารามิเตอร์ เช่น ไคสแควร์, Median Test, Sign test ฯลฯ
โดยปกติแล้วนักวิจัยมักนิยมใช้สถิติมีพารามิเตอร์ทั้งนี้เพราะผลลัพธ์ที่ได้จากการใช้สถิติมีพารามิเตอร์มีอำนาจการทดสอบ
(Power of Test) สูงกว่าการใช้สถิติไร้พารามิเตอร์
ดังนั้นเมื่อข้อมูลมีคุณสมบัติที่สอดคล้องกับข้อตกลงเบื้องต้นสามประการในการใช้สถิติมีพารามิเตอร์
จึงไม่มีผู้ใดคิดที่จะใช้สถิติไร้พารามิเตอร์ในการทดสอบสมมติฐาน
มาตราการวัด
ความหมาย
การวัดเป็นการกำหนดตัวเลขให้กับสิ่งที่ต้องการศึกษาภายใต้กฎเกณฑ์ที่แน่นอน
ผู้วิจัยจำเป็นจะต้องทราบคุณลักษณะของข้อมูลที่ถูกวัด
เพื่อใช้ในการพิจารณาว่าจะเลือกใช้วิธีการทางสถิติใดจึงจะเหมาะสม
ดังนั้นจึงควรทราบว่าข้อมูลที่ถูกวัดมานั้นอยู่ในมาตราการวัดระดับใด
ซึ่งมาตราการวัดแบ่งออกเป็น 4 ระดับคือ ระดับที่ 1 มาตราการวัดระดับนามบัญญัติ (Nominal Scale) เป็นระดับที่ใช้จำแนกความแตกต่างของสิ่งที่ต้องการวัดออกเป็นกลุ่ม
ๆ โดยใช้ตัวเลข เช่น ตัวแปรเพศ แบ่งออกเป็นกลุ่มเพศชายและกลุ่มเพศหญิง ในการกำหนดตัวเลขอาจจะใช้เลข
1 แทนเพศชาย และเลข 2 แทนเพศหญิง
ตัวแปรระดับการศึกษา แบ่งออกเป็นกลุ่มที่มีการศึกษาต่ำกว่าปริญญาตรี
อาจจะแทนด้วยเลข 1 กลุ่มที่มีการศึกษาระดับปริญญาตรี
อาจจะแทนด้วยเลข 2 และกลุ่มที่มีการศึกษาสูงกว่าระดับปริญญาตรี
อาจจะแทนด้วยเลข 3 เป็นต้น ตัวเลข 1 หรือ
2 หรือ 3 ที่ใช้แทนกลุ่มต่าง ๆ นั้น
ถือเป็นตัวเลขในระดับนามบัญญัติไม่สามารถนำมาบวก ลบ คูณ หาร หรือหาสัดส่วนได้
ระดับที่ 2 มาตราการวัดระดับเรียงอันดับ (Ordinal
Scales) เป็นระดับที่ใช้สำหรับจัดอันดับที่หรือตำแหน่งของสิ่งที่ต้องการวัด
ตัวเลขในมาตราการวัดระดับนี้เป็นตัวเลขที่บอกความหมายในลักษณะมาก-น้อย สูง-ต่ำ
เก่ง-อ่อน กว่ากัน เช่น ด.ช.ดำสอบได้ที่ 1 ด.ช.แดงสอบได้ที่ 2
ด.ญ.เขียวสอบได้ที่ 3 หรือ การประกวดร้องเพลง
นางสาวเขียวได้รางวัลที่ 1 นางสาวชมพูได้รางวัลที่ 2 นางสาวเหลืองได้รางวัลที่ 3 เป็นต้น ตัวเลขอันดับที่แตกต่างกันไม่สามารถบ่งบอกถึงปริมาณความแตกต่างได้
เช่น ไม่สามารถบอกได้ว่าผู้ที่ประกวดร้องเพลงได้รางวัลที่ 1 มีความเก่งมากกว่าผู้ที่ได้รางวัลที่
2 ในปริมาณเท่าใด ตัวเลขในระดับนี้สามารถนำมาบวกหรือลบ
กันได้ ระดับที่ 3 มาตราการวัดระดับช่วง (Interval
Scale) เป็นระดับที่สามารถกำหนดค่าตัวเลขโดยมีช่วงห่างระหว่างตัวเลขเท่า
ๆ กัน สามารถนำตัวเลขมาเปรียบเทียบกันได้ว่าว่ามีปริมาณมากน้อยเท่าใด
แต่ไม่สามารถบอกได้ว่าเป็นกี่เท่าของกันและกัน เพราะมาตราการวัดระดับนี้ไม่มี 0
(ศูนย์) แท้ มีแต่ 0 (ศูนย์) สมมติ เช่น นายวิชัยสอบได้
0 คะแนน มิได้หมายความว่าเขาไม่มีความรู้
เพียงแต่เขาไม่สามารถทำข้อสอบซึ่งเป็นตัวแทนของความรู้ทั้งหมดได้ หรือ อุณหภูมิ 0
องศา มิได้หมายความว่าจะไม่มีความร้อน เพียงแต่มีความร้อนเป็น 0
องศาเท่านั้น จุดที่ไม่มีความร้อนอยู่เลยก็คือที่ -273 องศา ดังนั้นอุณหภูมิ 40 องศาจึงไม่สามารถบอกได้ว่ามีความร้อนเป็น
2 เท่าของอุณหภูมิ 20 องศา เป็นต้น
ตัวเลขในระดับนี้สามารถนำมาบวก ลบ คูณ หรือหารกันได้ ระดับที่ 4 มาตราการวัดระดับอัตราส่วน (Ratio Scale) เป็นระดับที่สามารถกำหนดค่าตัวเลขให้กับสิ่งที่ต้องการวัด
มี 0 (ศูนย์) แท้ เช่น น้ำหนัก ความสูง อายุ เป็นต้น
ระดับนี้สามารถนำตัวเลขมาบวก ลบ คูณ หาร หรือหาอัตราส่วนกันได้ คือสามารถบอกได้ว่า
ถนนสายหนึ่งยาว 50 กิโลเมตร ยาวเป็น 2 เท่าของถนนอีกสายหนึ่งที่ยาวเพียง
25 กิโลเมตร ดังนั้น
ผู้วิจัยจึงต้องมีความรู้ในเรื่องของมาตราการวัดระดับต่าง ๆ เป็นอย่างดี
เพื่อใช้ในการวินิจฉัยตัวแปรในงานวิจัยว่าอยู่ในมาตราการวัดระดับใด
เพื่อประโยชน์ในการเลือกใช้วิธีการทางสถิติให้มีความถูกต้องเหมาะสม
การวัดแนวโน้มเข้าสู่ส่วนกลาง
การวัดแนวโน้มเข้าสู่ส่วนกลางเป็นการคำนวณหาค่าเฉลี่ยหรือค่ากึ่งกลางของข้อมูล
โดยปกติจะใช้ฐานนิยม (Mode) มัธยฐาน (Median) และ มัชฌิมเลขคณิต (Arithmetic Mean) แต่มีการแจกแจงความถี่บางอย่างซึ่งมีอยู่น้อยมากที่ใช้มัชฌิมเรขาคณิต
(Geometric Mean) และมัชฌิมฮาร์โมนิก (Harmonic Mean)
แต่การหาตำแหน่งกึ่งกลางที่เป็นที่นิยมใช้กันอย่างกว้างขวางที่สุดก็คือ
มัชฌิมเลขคณิต
ซึ่งเป็นค่าเฉลี่ยที่ใช้ได้กับข้อมูลที่อยู่มาตรวัดระดับช่วงและอัตราส่วน
นอกจากนี้ยังมี Trimmed Means เป็นสถิติปรับแก้ค่ามัชฌิมเลขคณิตกรณีที่มีข้อมูลสุดโต่ง
(Extreme Value) ส่วนฐานนิยมและมัธยฐานนั้นบางครั้งใช้กับข้อมูลที่อยู่ในมาตราวัดระดับนามบัญญัติและจัดอันดับ
แต่ก็สามารถใช้ได้กับระดับช่วงและอัตราส่วน ส่วนมัชฌิมเรขาคณิตและมัชฌิมฮาร์โมนิค
จะใช้เฉพาะข้อมูลที่มีคุณลักษณะพิเศษบางอย่างเท่านั้น
การคำนวณหาค่าเฉลี่ยหรือค่ากึ่งกลางของข้อมูลนั้นจะนำเสนอวิธีการดังนี้ 1. มัชฌิมเลขคณิต 2. Trimmed Means 3. มัธยฐาน 4.
ฐานนิยม 5. มัชฌิมเรขาคณิต 6. มัชฌิมฮาร์โมนิค
เปรียบเทียบมัชฌิมเลขคณิต, มัธยฐานและฐานนิยม
มัชฌิมเลขคณิตเป็นการหาค่าเฉลี่ยที่ใช้กับตัวแปรระดับช่วงขึ้นไป
โดยจะต้องนำข้อมูลทั้งหมดมาใช้ในการคำนวณ ค่ามัธยฐานเป็นสถิติในการจัดอันดับข้อมูล
การคำนวณอยู่บนพื้นฐานของข้อมูลที่อยู่ในมาตราจัดอันดับ
ถ้าค่าที่ได้จากการวัดถูกเรียงจากน้อยไปหามากหรือจากมากไปหาน้อยแล้ว
ค่ามัธยฐานคือค่าที่อยู่ตรงกลาง ซึ่งในการคำนวณไม่ต้องใช้ข้อมูลทั้งหมด
แต่เป็นการละเลยค่าที่อยู่เหนือและต่ำกว่ามัธยฐาน เช่นข้อมูล 2 ชุดมีค่า 5, 7, 20, 24, 25 และ 10, 15, 20,
52, 63 มีมัธยฐานเหมือนกันคือ 20 แต่ค่าเฉลี่ยตัวอื่นแตกต่างกัน
สำหรับฐานนิยมเป็นค่าหรือชั้นที่มีความถี่สูงที่สุดเป็นสถิติระดับนามบัญญัติ
การคำนวณไม่ได้ขึ้นอยู่กับค่าต่าง ๆ หรือการจัดอันดับแต่ดูที่ความถี่ การเปรียบเทียบค่าเฉลี่ย
มัธยฐานและฐานนิยม สามารถทำได้โดยการคำนวณทั้ง 3 วิธีกับข้อมูลที่มีการแจกแจงถี่ที่เหมือนกัน
ถ้านำการแจกแจงความถี่มานำเสนอด้วยกราฟ
มัชฌิมเลขคณิตก็คือจุดบนแกนนอนที่อยู่ตรงกึ่งกลางของแกน
ถ้าจุดตัดบนการแจกแจงทำให้เกิดความสมดุล จุดนั้นก็คือค่าเฉลี่ย
ค่ามัธยฐานคือจุดบนแกนนอน ที่แบ่งพื้นที่ใต้โค้งทั้งหมดออกเป็น 2 ส่วนเท่ากัน พื้นที่ครึ่งหนึ่งจะอยู่ทางซ้ายอีกครึ่งหนึ่งจะอยู่ทางขวา
ฐานนิยมคือจุดบนแกนนอนที่อยู่ตรงกับจุดที่สูงที่สุดของกราฟ
ถ้าการแจกแจงความถี่เป็นแบบสมมาตร จุดมัชฌิมเลขคณิต มัธยฐานและฐานนิยมจะอยู่ที่จุดเดียวกัน
ถ้าการแจกแจงเป็นแบบเบ้ จุดทั้ง 3 จุดจะไม่ใช่จุดเดียวกัน
ดังรูปภาพ 5 แสดงค่ามัชฌิมเลขคณิต มัธยฐานและฐานนิยม
สำหรับการแจกแจงความถี่แบบเบ้บวก
เราจะพบว่าค่ามัชฌิมเลขคณิตจะมากกว่ามัธยฐานและมากกว่าฐานนิยม
ถ้าการแจกแจงเป็นเบ้ลบ ค่าที่ได้จะตรงกันข้าม
คลิกอ่านรายละเอียดตามเว็ปไซต์ข้างล่างนี้ค่ะ ดีมากๆ
|