หน้าเว็บ

วันเสาร์ที่ 27 กันยายน พ.ศ. 2557

การจำลองสถานะการณ์ด้วยโปรแกรม LazStats


LazStats เป็นโปรแกรมวิเคราะห์ข้อมูลทางสถิติ ประเภท Open Source Software อีกโปรแกรมหนึ่งของ Professor Bill Miller แห่งมหาวิทยาลัยไอโอวา ประเทศสหรัฐอเมริกา
LazStats สามารถจำลองสถานการณ์ (simulation) การทดสอบและวิเคราะห์ข้อมูลทางสถิติได้หลายรูปแบบ โดยผู้ใช้สามารถสร้างแบบจำลองต่างๆขึ้นมาศึกษาได้ด้วยตนเอง ซึ่งจะทำให้เข้าใจสถิติต่างๆได้ง่ายและรวดเร็วยิ่งขึ้น 
โปรแกรม LazStats ได้รับการปรับปรุงและเพิ่มเติมขีดความสามารถมาโดยตลอด ล่าสุดเมื่อเดือนสิงหาคม 2557 เช่นเดียวกับโปรแกรม OpenStat ซึ่งได้รับการ update ล่าสุดเมือ 13 มิถุนายน 2557 
อ่านบทความเกี่ยวกับ OpenStat..» การทดสอบข้อตกลงเบื้องต้นของสถิติด้วย PSPP และ OpenStat  
สามารถดาวน์โหลดโปรแกรม LazStats และ OpenStat ได้ที่..» http://statpages.info/miller/ 

คำสั่งต่างๆที่ใช้ในการสร้างข้อมูลจำลองทางสถิติ
  1. การสร้างแผนภูมิกระจาย (scatter plot) จากคำสั่ง Bivariate Scatter Plot

 ผู้วิจัย สามารถกำหนดค่าพารามิเตอร์ (parameters) โดยโปรแกรมจะนำค่าพารามิเตอร์เหล่านี้ไปสร้างข้อมูลจำลอง (simulated data) แล้วนำไปสร้างแผนภูมิกระจายต่อไป

รายงานค่าสถิติ มี 3 ส่วนคือ ค่าพารามิเตอร์ของประชากร ค่าสถิติของกลุ่มตัวอย่าง 1000 ตัวอย่าง และข้อมูลจำลองที่สร้างโดยโปรแกรมจำนวน 1000 คู่ เพื่อนำไปลงในแกน x และแกน y

  แผนภูมิกระจาย N Size=1000

  ปรับลด N Size ลงจาก 1000 เป็น 100

  แผนภูมิกระจาย N Size=100

 คำสั่ง Bivariate Scatter Plot ทำให้ผู้ใช้สามารถสร้างสถานการณ์จำลองเพื่อเรียนรู้ความสัมพันธ์ของข้อมูล 2 ชุด (Pearson Product-Moment Correlation) โดยผู้ใช้สามารถดัดแปลงและปรับเปลี่ยนข้อกำหนดต่างๆ เพื่อศึกษาสถิติในสถานการณ์เหล่านั้น

    2. การสร้างข้อมูลจำลองจากค่าสหสัมพันธ์ของตัวแปรหลายตัว จากคำสั่ง Multivariate Distribution


ผู้วิจัยต้องกำหนด จำนวนตัวแปร (มากกว่า 2 ตัว) กำหนดค่าสหสัมพันธ์ใน Rho Matrix ค่าเฉลี่ย (Mu) ส่วนเบี่ยงเบนมาตรฐาน (Sigma) และขนาดของกลุ่มตัวอย่าง (Sample Size)

  รายงานค่าพารามิเตอร์ ของกลุ่มประชากร ตามที่ผู้ใช้กำหนด

   รายงานค่าสถิติ กลุ่มตัวอย่าง 50 ตัวอย่าง ตามที่ผู้ใช้กำหนด

    ข้อมูลจำลอง (Simulated Data) ของตัวแปร 3 ตัวซึ่งโปรแกรมสร้างให้

3. การหาขนาดของกลุ่มตัวอย่างเพื่อควบคุมความคลาดเคลื่อนแบบ Type1 และ Type2 จากคำสั่ง Type1 and Type2 Error Curves

 กำหนดข้อมูล และคุณลักษณะต่างๆ ดังนี้

  เส้นโค้งปกติ ของความคลาดเคลื่อน Type1(Alpha)(0.05) และ Type2(Beta)(0.05)

เส้นโค้งปกติ ของความคลาดเคลื่อน Type1(Alpha)(0.05) และ Type2(Beta)(0.01)

   ตารางความสัมพันธ์ ของความคลาดเคลื่อน Type1 และ Type2
ผลการทดสอบ
H0 เป็นจริง
H0 ไม่จริง
ยอมรับ H0
   1-Alpha (ระดับความเชื่อมั่น)
   Beta error (Type2)
ปฏิเสธ H0
   Alpha error (Type1)
  (ระดับนัยสำคัญทางสถิติ)
   1-Beta
  (อำนาจการทดสอบ)





  Type1 error (Alpha) : ความน่าจะเป็นในการปฎิเสธ H0 เมื่อ H0 เป็นจริง
  Type2 error (Beta) : ความน่าจะเป็นในการยอมรับ H0 เมื่อ H0 ไม่จริง หรือ เป็นเท็จ
  ตารางต่อไปนี้ แสดงผลของการควบคุมความคลาดเคลื่อน
Alpha
Beta
1-Beta
0.01
0.78
0.22
0.05
0.52
0.48
0.10
0.37
0.63
  ข้อมูลในตาราง เป็นค่าความน่าจะเป็น (Probability) มีค่าตั้งแต่ ถึง 1

จะเห็นว่าความคลาดเคลื่อนทั้ง 2 ชนิดมีทิศทางสวนกัน ถ้าควบคุม Alpha ให้น้อย Beta ก็จะสูงขึ้น มีคำกล่าวว่า การทดสอบสมมติฐานควรพยายามลดโอกาสที่จะเกิดความผิดพลาดแบบที่ 2 ให้น้อยที่สุดเท่าที่จะน้อยได้ มีหลายเหตุผลที่สนับสนุนคำกล่าวนี้ 
ลองพิจารณาตรรกะ ต่อไปนี้...
Type1 error : Reject good (ถ้าเราปฏิเสธสิ่งดีๆ ชิวิตเราคงไม่ดีขึ้นหรือแย่ไปกว่าเดิม ก็แค่เสียโอกาสไปเท่านั้น)
Type2 error : Accept bad (ถ้าเรายอมรับสิ่งเลวๆ ชิวิตเราคงแย่ไปกว่าเดิมแน่)
มีวิธีที่จะควบคุม Type2 error หลายวิธีนอกเหนือจากการเพิ่มค่า Alpha ซึ่งจะทำให้อำนาจการทดสอบ (1-Beta) เพิ่มขึ้นอีกด้วย แต่จะทำให้ระดับความเชื่อมั่น (1-Alpha) ลดลง การเพิ่มขนาดของกลุ่มตัวอย่างก็จะมีผลทำให้ Type2 error ลดลงได้ เช่นกัน  
รายละเอียดของความคลาดเคลื่อน Type1 และ Type2 สามารถค้นหาเพิ่มเติมได้ในอินเตอร์เน็ต...

4. การสร้าง Power Curves จากคำสั่ง Power Curves for z tests

 กำหนดค่าต่างๆ เพื่อนำไปสร้าง Power Curves

Power Curves ที่ระดับของ Type1 error = 0.10, 0.05 และ 0.01


 ข้อมูลจำลอง สร้างโดยโปรแกรม

Power Curves แสดงอำนาจการทดสอบ (Power of Test) ในแต่ระดับของ Type1 error สะท้อนถึงคุณภาพของการทดสอบนั้นๆ

5. การสร้าง Probability Distribution แบบต่างๆ จากคำสั่ง Distribution Plots and Critical Values

กำหนดรูปแบบการแจกแจง แบบ Chi-Square Distribution

ภาพการแจกแจง แบบ Chi-Square Distribution

 กำหนดรูปแบบ การแจกแจงแบบ Central F Distribution

 ภาพการแจกแจง แบบ Central F Distribution


6. การสร้างข้อมูลต่อเนื่อง จากคำสั่ง Generate Sequential Values


 สร้างเลขคี่ จำนวน 100 ชุดต่อเนื่องกัน
 

ข้อมูล เลขคี่เริ่มจาก 1 ถึง 199


7. การสร้างข้อมูลสุ่มที่มีการแจกแจงแบบต่างๆ จากคำสั่ง Random Theoretical Values


กำหนดรูปแบบ การแจกแจง และจำนวนข้อมูลสุ่มที่ต้องการ

ข้อมูลสุ่มที่มีการแจกแจงปกติ (Normal Distribution) จำนวน 80 ตัวเลข

ไม่มีความคิดเห็น:

แสดงความคิดเห็น