หน้าเว็บ

วันศุกร์ที่ 20 มิถุนายน พ.ศ. 2557

การทดสอบข้อตกลงเบื้องต้นของสถิติด้วย PSPP และ OpenStat


การเลือกสถิติใดๆจะต้องคำนึงถึงข้อตกลงเบื้องต้นของสถิตินั้น ซึ่งสถิติแต่ละตัวมีข้อตกลงเบื้องต้นแตกต่างกัน ผู้วิจัยจะต้องทำความเข้าใจและยึดถือปฎิบัติอย่างเคร่งครัด เพราะถ้าหากฝ่าฝืนข้อตกลงเหล่านั้น จะโดยตั้งใจหรือไม่ก็ตาม จะทำให้ความถูกต้องและความน่าเชื่อถือของผลการทดสอบลดลง
สถิติอ้างอิง (Inferential Statistics) แบ่งออกเป็น 2 ประเภทคือ 
 1.สถิติอ้างอิงมีพารามิเตอร์ (Parametric Inferential Statistics) 
 2.สถิติอ้างอิงไม่มีพารามิเตอร์ (Non-Parametric Inferential Statistics) 
  ในสถิติแต่ละประเภทมีข้อตกลงเบื้องต้นดังนี้


สถิติอ้างอิงมีพารามิเตอร์
1.ตัวแปรที่ต้องการวัดจะต้องอยู่ในมาตราวัดในระดับอันตรภาคชั้น (interval scale) ขึ้นไป
2.ข้อมูลที่รวบรวมได้จากกลุ่มตัวอย่างจะต้องมีการแจกแจงแบบปกติ (normal distribution)
3.กลุ่มประชากรแต่ละกลุ่มที่นำมาศึกษาจะต้องมีความแปรปรวนเท่ากัน
สถิติอ้างอิงไม่มีพารามิเตอร์
1.ตัวแปรที่ต้องการวัดจะอยู่ในมาตราวัดในระดับใดก็ได้ (norminal, ordinal, interval, ratio)
2.ข้อมูลที่รวบรวมได้จากกลุ่มตัวอย่างจะมีการแจกแจงแบบใดก็ได้ (free distribution)
3.กลุ่มประชากรแต่ละกลุ่มที่นำมาศึกษาไม่จำเป็นต้องมีความแปรปรวนเท่ากัน
ข้อตกลงเบื้องต้นบางประการผู้วิจัยสามารถจัดทำได้ เช่น สถิติแบบมีพารามิเตอร์ทุกตัวมีข้อตกลงเบื้องต้นว่าการวัดจะต้องอยู่ในมาตราวัดในระดับอันตรภาคขึ้นไป แต่ข้อตกลงเบื้องต้นบางประการต้องอาศัยการทดสอบทางสถิติเพื่อพิจารณาดูว่าเป็นไปตามข้อตกลงนั้นหรือไม่ เช่นข้อมูลที่รวบรวมได้จากกลุ่มตัวอย่างมีการแจกแจงแบบปกติหรือไม่ หรือกลุ่มประชากรแต่ละกลุ่มที่นำมาศึกษามีความแปรปรวนเท่ากันหรือไม่ ในบทความนี้จะกล่าวถึงข้อตกลงเบื้องต้นของสถิติที่ต้องอาศัยการทดสอบทางสถิติโดยจะแสดงวิธีการทดสอบด้วยโปรแกรม PSPP และโปรแกรม OpenStat ดังนี้
1.ข้อมูลที่ต้องการวัดมีการแจกแจงแบบปกติ (Normal Distribution) สามารถทดสอบข้อมูลที่เก็บรวบรวมมาได้โดยใช้คำสั่ง Explore หรือ The Kolmogorow-Smirnov Test สำหรับคำสั่ง Explore ในโปรแกรม PSPP สามารถรายงานผลเฉพาะสถิติพรรณาเท่านั้นยังไมมีฟังก์ชั่นสำคัญๆ เช่นคำสั่ง Plots ทำให้ไม่สามารถรายงานผลในรูป Boxplots, Histogram, Test of Normality ฯลฯ ส่วนคำสั่ง Kolmogorow-Smirnov Test ยังไม่มีใช้ใน PSPP ดังนั้นจึงใช้สถิติ Chi-Square ทดสอบภาวะสารูปสนิทดี (Chi-Square Goodness of Fit) แทน ในการทดสอบภาวะสารูปสนิทดีโดยใช้สถิติ Chi-Square 
สามารถตั้งสมมติฐานเพื่อการตรวจสอบได้ ดังนี้ H0: ข้อมูลมีการแจกแจงแบบปกติ และ H1: ข้อมูลไม่มีการแจกแจงแบบปกติ 
เริ่มต้นด้วยการกำหนดคุณสมบัติของตัวแปรต่างๆดังนี้

ข้อมูลเป็นคะแนนสอบวิชาคอมพิวเตอร์ของนักศึกษา 20 คน

อย่างไรก็ตามการทดสอบด้วย Chi-Square มีเงื่อนไขว่าจำนวนนับที่คาดหมาย(expected N) ของแต่ละลักษณะของตัวแปรไม่ควรน้อยกว่า 5 ดังนั้นจึงต้องมีการเพิ่มตัวแปรอีก 1 ตัวชื่อ ScoreGroup โดยใช้คำสั่ง Recode into Different Variables ซึ่งอยู่ในเมนู Transform เพื่อจัดกลุ่มคะแนนใหม่เป็น 3 กลุ่มคือ กลุ่ม1 เป็นกลุ่มที่คะแนนอยู่ในช่วง 80-83 กลุ่ม2 คะแนนอยู่ในช่วง 84-87 และกลุ่ม3 คะแนนอยู่ในช่วง 88-91
ด้วยวิธีนี้จะทำให้จำนวนนับที่สังเกตได้ (observed N) ของคะแนนในแต่ละกลุ่มเพิ่มขึ้น

หลังจากนั้นใช้คำสั่ง Chi-Square ซึ่งอยู่ที่เมนูย่อย Non-Parametric Statistics เมนูหลัก Analyze โดยใช้ตัวแปร ScoreGroup เป็น Test Variable ผลลัพธ์ที่ได้
ตารางบนแสดงกลุ่มของคะแนนซึ่งมี 3 กลุ่มจะเห็นว่าจำนวนนับที่คาดหมาย (expected N) ของแต่ละกลุ่มมีค่ามากกว่า 5 มีผลทำให้การทดสอบนี้มีความน่าเชื่อถือ ส่วนตารางล่างแสดงค่า Chi-Square, df และ Asymp. Sig. โดย Asymp. Sig. มีค่าเท่ากับ .52 ซึ่งมากกว่า .05 จึงยอมรับ H0 หมายความว่าข้อมูลชุดนี้มีการแจกแจงแบบปกติ ที่ระดับนัยสำคัญ .05

การตรวจสอบการแจกแจงแบบปกติ (Normal Distribution) ด้วยโปรแกรม OpenStat
โปรแกรม OpenStat มีคำสั่ง Normality test สำหรับใช้ตรวจสอบการแจกแบบปกติดังนี้...เว็บไซต์ OpenStat 
>>

ข้อมูลนำเข้า (input)

 ผลลัพธ์ (out put)

นอกจากนั้นผู้วิจัยยังสามารถใช้โปรแกรม OpenStat วิเคราะห์เป็นแผนภาพได้ดังนี้
♦แผนภาพแท่ง (Histogram) สามารถใช้พิจารณาลักษณะการแจกแจงของข้อมูลว่ามีแนวโน้มเข้าใกล้โค้งปกติหรือไม่ แผนภาพดังกล่าวจะใช้ประกอบการพิจาณาปรับแก้ไขการแจกแจงให้มีความเหมาะสมมากขึ้น


♦แผนภาพต้นไม้และใบ (Stem and Leaf) มีลักษณะคล้ายกับแผนภาพ Histogram แต่ให้รายละเอียดของข้อมูลดิบมากกว่า

♦แผนภาพ Normality plot with tests แสดงผลลัพธ์เป็นกราฟ Normal Probability Plot หรือ Normality Q-Q plot

♦แผนภาพ Box Plot แสดงข้อมูลในตำแหน่ง Quartile ที่1 (Percentile ที่ 25), Quartile ที่ 2 (Percentile ที่ 50 หรือมัธยฐาน) และQuartile ที่ 3 (Percentile ที่ 75) แยกตามตัวแปรกลุ่ม นอกจากนั้นยังแสดงค่าต่ำสุดและสูงสุด

 2.ความเป็นเอกพันธ์ของความแปรปรวน (Homogeneity of Variance) หมายถึงความแปรปรวนของประชากรแต่ละชุดเท่ากันในกรณีที่มีกลุ่มประชากร 2 กลุ่มสามารถใช้ t-test Independent ทดสอบได้ ในกรณีที่มีประชากรมากกว่า 2 กลุ่มจะมีสถิติที่ทดสอบข้อตกลงนี้ (Homogeneity) รวมอยู่ในการวิเคราะห์ความแปรปรวนทางเดียว (One way ANOVA) ซึ่งมีรายละเอียดอยู่ในหัวข้อเรื่องการวิเคราะห์ความแปรปรวนทางเดียว (One way ANOVA)”
ยังมีข้อตกลงเบื้องต้นของสถิติต่างๆอีกหลายข้อ ดังนั้นผู้วิจัยจะต้องระมัดระวังในการเลือกใช้สถิติเหล่านั้น โดยต้องตรวจสอบและทดสอบข้อตกลงเบื้องต้นของสถิตินั้นๆก่อนนำไปใช้วิเคราะห์ข้อมูล อย่างไรก็ตามหากทดสอบแล้วพบว่าไม่ได้เป็นไปตามข้อตกลงเบื้องต้นข้อใดข้อหนึ่ง เช่นข้อมูลของประชากรบางชุดมีการแจกแจงที่ไม่เป็นไปตามข้อตกลงเบื้องต้นข้อ1 ก็สามารถทำการแก้ไขได้หลายวิธี เช่นเปลี่ยนไปใช้สถิติประเภท Non-Parametric หรือเก็บข้อมูลเพิ่มเติม หรือใช้วิธีแปลงข้อมูล เป็นต้น

ไม่มีความคิดเห็น:

แสดงความคิดเห็น