หน้าเว็บ

วันศุกร์ที่ 20 มิถุนายน พ.ศ. 2557

การวิเคราะห์ข้อมูลทางสถิติด้วยโปรแกรม PSPP


โปรแกรม PSPP เป็น Open Source Software ที่มีฟังก์ชั่นการทำงานเหมือนกับโปรแกรม SPSS แต่ความสามารถยังเป็นรองในหลายๆด้าน PSPP มีฟังก์ชั่นการทำงานทั้งในส่วนของสถิติเชิงพรรณา (Descriptive Statistics) และสถิติอ้างอิง (Inferential Statistics) PSPP ไม่มีคำเต็มที่เป็นทางการแต่อาจหมายความถึง Perfect Statistics Professionally Presented หรือ Probabilities Sometimes Prevent Problems หรือ People Should Prefer PSPP หรือผู้ใดมีข้อความอื่นๆที่สอดคล้องกันก็สามารถโพสต์ขึ้นไปได้  ได้ทดลองใช้โปรแกรม PSPP สอนนักศึกษาปริญญาโทวิเคราะห์ข้อมูลทางสถิติทั้งในส่วนของ Descriptive Statistics และ Inferential Statistics โดยสอนการเปรี่ยบเทียบค่าเฉลี่ยในกรณีต่างๆโดยใช้คำสั่งในเมนู Compare Means ซึ่งมีอยู่ 4 คำสั่งคือ One Sample T test, Independent Samples T test, Paired Samples T test และ One way ANOVA พบว่ามีความสามารถเทียบเท่ากับโปรแกรม SPSS จะด้อยกว่าในส่วนของการรายงานผลเท่านั้น...เว็บไซต์ PSPP>>


สถิติเชิงพรรณา (Descriptive Statistics)
จาก ตัวอย่างการวิเคราะห์ข้อมูลหาค่าสถิติซึ่งมีตัวแปร 1 ตัวคือ score มีข้อมูลนำเข้า(Input) 10 ค่าคือ 10, 30, 30, 50, 50, 50, 50, 70, 70, 85 ใช้คำสั่ง Frequencies ซึ่งอยู่ในเมนู Descriptive Statistics ได้ผลลัพธ์ (outputs) 2 ตาราง คือตารางแจกแจงความถี่ และตารางแสดงค่าสถิติ ซึ่งเราสามารถเลือกค่าสถิติได้ตามที่ต้องการ

นอกจากความสามารถในการแสดงผลค่าสถิติต่างๆและตารางแจกแจงความถี่แล้ว ยังสามารถแสดงแผนภูมิในรูปแบบ Histogram with Normal Curve และ Pie Chart ได้

สถิติอ้างอิง (Inferential Statistics)
One Sample T test
คำสั่งในเมนู Compare Means มีอยู่ 4 คำสั่ง ใช้ในการเปรี่ยบเทียบค่าเฉลื่ยใดๆของประชากร เช่น รายได้เฉลี่ยต่อปี คะแนนเฉลี่ยความพึงพอใจในด้านต่างๆเป็นต้น คำสั่ง One Sample T test ใช้ทดสอบสมมติฐานกรณีประชากรกลุ่มเดียว คำสั่ง Independent Samples T test ใช้ทดสอบสมมติฐานกรณีประกร 2 กลุ่มอิสระ คำสั่ง Paired Samples T test ใช้ทดสอบสมมติฐานกรณีประชากร 2 กลุ่มที่มีความสัมพันธ์กัน หรือเรียกว่า Dependent Samples Test และคำสั่ง One Way ANOVA ใช้วิเคราะห์ความแปรปรวนแบบจำแนกทางเดียว (One-way Analysis of Variance)
ผลลัพธ์จากตาราง เป็น การทดสอบสมมติฐานกรณีประชากรกลุ่มเดียว (One Sample T test) โดยใช้กลุ่มตัวอย่างจำนวน 30 ชุดซึ่งเป็นน้ำหนักของขนมขบเคี้ยวยี่ห้อหนึ่งว่าเท่ากับ 200 กรัมหรือไม่ที่ระดับนัยสำคัญทางสถิติ(α) .05 โดยตั้งสมมติฐานทางสถิติไว้ดังนี้ H0: μ=200, H1: μ≠200 เมื่อดูจาก p-value ที่ช่อง Sig.(2-tailed) มีค่าเท่ากับ .01 ซึ่งน้อยกว่าค่า α หรือ .05 สรุปได้ว่ายอมรับ H1 ดังนั้นน้ำหนักเฉลี่ยของกลุ่มตัวอย่าง(203.33 กรัม) มากกว่า 200 กรัมอย่าง มีนัยสำคัญทางสถิติ ที่ระดับนัยสำคัญทางสถิติ .05 หรือผลการทดสอบ Significance นั่นเอง


Independent Samples T test
กำหนดคุณสมบัติของตัวแปรต่างๆดังนี้

ข้อมูลนำเข้า (input) จำนวน 30 ชุด ดังนี้

ผลลัพธ์จากตาราง output

จากตารางบน เป็นการทดสอบสมมติฐานกรณีประชากร 2 กลุ่มอิสระ (Independent Sample T test) โดยใช้กลุ่มตัวอย่างจำนวน 30 ชุด ตัวแปรต้นคือกลุ่ม(group)แบ่งเป็นนักศึกษาชาย และนักศึกษาหญิง ตัวแปรตามมี 3 ตัวคือคะแนนความพึงพอใจในผู้บรรยาย (score1) คะแนนความพึงพอใจในเนื้อหาการบรรยาย (score2) และคะแนนความพึงพอใจในเอกสารประกอบการบรรยาย (score3) ต้องการทดสอบว่าค่าเฉลี่ยของคะแนนความพึงพอใจในแต่ละด้านของนักศึกษาชายและ นักศึกษาหญิงแตกต่างกัน หรือไม่
การวิเคราะห์ข้อมูลเริ่มต้นจาก F ซึ่งเป็นสถิติที่ใช้ในการทดสอบสมมติฐานเกี่ยวกับค่าความแปรปรวน (variance) โดยตั้งสมมติฐานทางสถิติไว้ดังนี้ H0 : σ12 = σ22, H1 : σ12 ≠ σ22 เมื่อดูจากค่า Sig. พบว่ามากกว่า .05 ทั้ง 3 รายการ (.09, .95 และ .56) จึงยอมรับ H0 ทั้ง 3 รายการ
ขั้นตอนต่อไป คือการทดสอบสมมติฐานเปรียบเทียบค่าเฉลี่ยของคะแนนคาวมพึงพอใจในด้านต่างๆ โดยตั้งสมมติฐานทางสถิติไว้ดังนี้ H0 : μ1 = μ2, H1 : μ1 ≠ μ2 เมื่อพิจารณาจากค่า Sig. ทำให้เราสามารถตัดสินใจได้ว่าจะเลือกค่า t ตัวบนหรือตัวล่าง ในกรณีนี้ต้องเลือกค่า t ตัวบน ซึ่ง เป็นกรณี Equal variances assumed ใช้สูตรการคำนวณค่า t แบบ Pooled Variance ทั้ง 3 รายการ (การคำนวณค่า t ตัวล่างหรือกรณี Equal variances not assumed ใช้สูตร Separated Variance)
ขั้นตอนสรุป เมื่อดูค่า Sig.(2-tailed) พบว่ามีเพียงกรณีเดียวเท่านั้นที่ Significance(ยอมรับ H1) คือคะแนนเฉลี่ยความพึงพอใจในผู้บรรยาย (score1)ของนักศึกษาหญิง (4.35) มากกว่านักศึกษาชาย (3.85) อย่างมีนัยสำคัญทางสถิติ ที่ระดับนัยสำคัญทางสถิติ .05 (ค่า Sig.(2-tailed) หรือ p-value=.04 ซึ่งน้อยกว่า .05) สำหรับคะแนนเฉลี่ย score2 และ score3 ของทั้งนักศึกษาชายและนักศึกษาหญิง ถือว่าไม่แตกต่างกัน (ยอมรับ H0)

Pair Samples T test
กำหนดคุณสมบัติของตัวแปรต่างๆดังนี้

ข้อมูลนำเข้า (input) จำนวน 30 ชุด ดังนี้

ผลลัพธ์จากตาราง output
จากตารางบน เป็นรายงานการทดสอบสมมติฐานกรณีประชากร 2 กลุ่มที่มีความสัมพันธ์กัน (Paired Samples T test) มีตัวแปร 2 ตัวคือคะแนนความพึงพอใจต่อผู้บรรยายในการบรรยายครั้งที่1 (score1) และคะแนนความพึงพอใจต่อผู้บรรยายในบรรยายครั้งที่2 (score2) ต้องการทดสอบว่าค่าเฉลี่ยของคะแนนความพึงพอใจต่อผู้บรรยายในการบรรยายทั้ง 2 ครั้ง แตกต่างกันหรือไม่ ที่ระดับนัยสำคัญทางสถิติ .05 โดยตั้งสมมติฐานทางสถิติไว้ดังนี้ H0 : μ1 = μ2, H1 : μ1 ≠ μ
การวิเคราะห์ข้อมูล เริ่มต้นด้วยการดูค่าสหสัมพันธ์ (correlation) ซึ่งเท่ากับ .42 แสดงว่าข้อมูลมีความสัมพันธ์ในทางเดียวกันหรือทางบวกในระดับค่อนข้างตำ ค่า Sig.=.02 แสดงว่าขอมูล 2 ชุดมีความสัมพันธ์อย่างมีนัยสำคัญทางสถิติ ที่ระดับนัยสำคัญทางสถิติ .05
จากตาราง Paired Differences ค่า Sig.(2-tailed) หรือ p-value=.02 ซึ่งน้อยกว่า .05 จึงยอมรับ H1 สรุปได้ว่า คะแนนเฉลี่ยความพึงพอใจในตัวผู้บรรยายครั้งที่2 (4.47) มากกว่าครั้งที่1 (4.13) อย่าง มีนัยสำคัญทางสถิติ ที่ระดับนัยสำคัญทางสถิติ .05
จากตัวอย่าง Output tables ของโปรแกรม PSPP ที่นำมาให้ดูจะเห็นว่าการแสดงผลใกล้เคียงกับโปรแกรม SPSS มาก แต่มีข้อด้อยคือไม่สามารถแสดงผลภาษาไทยได้ และการนำตารางไปลงในแฟ้มเอกสารอื่นๆค่อนข้างยุ่งยาก ผู้ใช้อาจต้องสร้างตารางขึ้นมาเองแล้วพิมพ์ข้อมูลลงไป หรือใช้โปรแกรม Capture หน้าจอแล้วนำไปวางไว้ในแฟ้มเอกสารก็ได้ นอกจากนั้นโปรแกรม PSPP ยังไม่มีคำสั่งสำคัญๆหลายคำสั่ง เช่น คำสั่ง Means ซึ่งใช้หาค่าสถิติพื้นฐานของกลุ่มย่อย คำสั่งที่ใช้ในการสร้างรายงาน (Reports) เช่น OLAP Cubes (OLAP ย่อมาจาก Online Analytical Processing หมายถึงเทคโนโลยีที่ใช่ข้อมูลจากคลังข้อมูลเพื่อใช้ในการวิเคราะห์และตัดสิน ใจทางธุรกิจอย่างมีประสิทธิภาพ แก้ปัญหาที่มีความซับซ้อนโดยใช้เวลาระยะสั้น ระบบจะต้องทำงานได้รวดเร็ว สามารถค้นหาข้อมูลจากฐานข้อมูลขนาดใหญ่มาคำนวณได้อย่างครบถ้วนไม่ตกหล่น) คำ สั่ง Report Summaries in Columns ฯลฯ  ผู้เขียนได้ทดลองใช้และติดตามการพัฒนาและปรับปรุงโปรแกรม PSPP มาเป็นระยะเวลานานพอสมควร พบว่ามีการพัฒนาอย่างต่อเนื่องถึงแม้จะเป็นซอฟต์แวร์ฟรีก็ตาม ถ้าหากมีการใช้โปรแกรม PSPP กันอย่างแพร่หลายนอกจากจะสามารถลดค่าใช้จ่ายในการซื้อซอฟต์แวร์ที่มีลิขสิทธ์อย่างเช่น SPSS ได้อย่างมหาศาลแล้ว ยังสามารถลดปริมาณการใช้ซอฟต์แวร์อย่างผิดกฎหมายลงอีกด้วย ซึ่งไทยเป็นอีกประเทศหนึ่งที่กำลังถูกจับตาดูในเรื่องนี้

ไม่มีความคิดเห็น:

แสดงความคิดเห็น