(ต่อจาก เรียนสถิติด้วยภาพ ตอนที่ 1 Confidence Interval & alpha level)
ลองดูข้อมูลดิบตั้งต้น ของข้อมูลสองหย่อม
ถ้าเราเล็มขอบทิ้งไป alpha เหลือแกนกลางเป็น confidence interval เราก็จะเห็นส่วนที่เป็นแกนกลางที่ขอบคมกริบขึ้น เห็นข้อมูลสองหย่อมชัดเจน เพราะขีดตีวงไว้
สมมติว่า แต่ละหย่อม เล็มทิ้งไป 5 % (alpha level = 0.05) ทำให้แกนกลาง เหลือ 95 % ในกรณีนี้ เราจะเห็นว่า ข้อมูลสองหย่อมนี้ เกยกันอยู่
สถิติ มีศัพท์เรียกว่า "ไม่แตกต่างทางสถิติ ที่ alpha level = 0.05"
แต่เมื่อขยายค่า alpha ออกไปให้ใหญ่ขึ้น confidence interval แต่ละหย่อม ก็ค่อย ๆ หดตัวเล็กลง จนถึงจุดหนึ่ง ที่ขอบนอกของ confidence interval แตะกันพอดี
ค่า alpha level ที่กรณีเฉพาะนี้ คือ p-value
สมมติว่ากรณีนี้ ได้ p-value = 0.07
เกิดอะไรขึ้น ถ้า alpha level โตขึ้น ๆ จน confidence interval แต่ละหย่อมหดตัวเล็กลง ๆ จนแยกข้อมูลทั้งสองกองขาดออกมาจากกัน ?
สมมติว่ากรณีนี้ alpha level = 0.2 ซึ่งเราจะเห็นข้อมูลสองหย่อมหลุดขาดจากกันแล้ว
กรณีที่ข้อมูลสองกองนี้หลุดขาดจากกัน เรียกว่า "แตกต่างกันทางสถิติ ที่ alpha level = 0.2"
หรืออาจบอกว่า "แตกต่างกันทางสถิติ เพราะ p-value < alpha level"
ถ้าดูให้ดี จะเห็นว่า ข้อมูลทั้งสองกอง ก็อยู่อย่างนั้นมาตลอด ไม่ได้เปลี่ยนแปลงอะไรเลย ที่เปลี่ยน คือการนิยามค่า confidence interval (หรือ alpha level) แล้วก็ทำให้เราเห็นว่า ข้อมูลสองหย่อมนั้น ขาดออกมาจากกันไหม ถ้ามองว่าไม่ขาด ก็ไม่ต่างทางสถิติ ถ้ามองว่าขาด ก็จะต่างทางสถิติ
ดังนั้น การต่างหรือไม่ต่างทางสถิติ จึงเป็นสิ่งที่ต้องมีกรอบอ้างอิงเสมอ กรอบอ้างอิงนี้ ก็คือ alpha level หรือ confidence interval
ลองดูกรณีสมมติ ...ดูดาวคู่

กรณีแรก (ซ้ายสุด) ดูตอนฟ้ามัว เห็นแสงเป็นฝ้าเบลอ ๆ จนดูแล้วแยกไม่ค่อยออก เห็นราวเป็นดาวเดี่ยว กรณีนี้ ถ้าเปรียบเทียบระยะห่างระหว่างจุดศูนย์กลาง จะมี p-value สูง ทำให้ต้องสรุปว่า ไม่แตกต่างกันทางสถิติ (คนที่เรียนสถิติมาก็จะบอกว่า อ๋อ ก็ p-value สูงกว่า alpha นั่นไง มันจึงไม่แตกต่าง ก็คือภาพแรกนี้)
แต่พอท้องฟ้าเริ่มใสขึ้น ๆ สองหย่อมก็เริ่มสามารถมองเห็นขาดจากกันได้ชัดเจนขึ้นเรื่อย ๆ เกิดกรณีที่ แตกต่างกันอย่างมีนัยสำคัญ
แต่ประเด็นที่ต้องระลึกถึงคือ ระยะห่างทางกายภาพของดาวทั้งคู่ เหมือนเดิมทุกครั้ง แต่ก็อาจได้ข้อสรุปทางสถิติที่หลากหลาย ขึ้นกับคุณภาพข้อมูล ซึ่งในที่นี้ ก็คือ ความแปรปรวน หรือเทียบได้กับการที่ฟ้ามัวสลัวหม่น
พูดอีกนัยหนึ่ง แตกต่างทางสถิติ อาจไม่ได้บอกอะไรเลยว่า แตกต่างทางกายภาพไหม !
พวกงานวิจัยมั่วนิ่มจำนวนมาก ชอบเอาช่องโหว่ตรงนี้แหละมาใช้ เช่น บอกว่า ยานี้ลดความดันดีกว่ากลุ่มยาหลอกได้ดีอย่างมีนัยสำคัญยิ่งทางสถิติ แต่อ้อมแอ้มเลี่ยงไปว่า ที่ต่างน่ะ แค่ 10 mmHg ซึ่งจิ๊บจ๊อยมาก ซึ่งงานวิจัยที่ดี ควรแตกต่างทั้งทางสถิติ และแตกต่างทางปฎิบัติในชีวิตจริง จึงจะถือว่า แตกต่างอย่างมีคุณภาพ
สารบัญเรื่อง


เมนูของ wwibul









เมื่อ อ. 07 ต.ค. 2551 @ 00:04
862684 [ลบ]
เริ่มเห็นภาพครับ
ข้อมูลมันก็อยู่ของมันอย่างนั้น แต่เราไปนิยามมันว่าต้องกำหนดค่า alpha เท่าไร
ความแตกต่างจึงเกิดจาก การกำหนดค่า confidence interval
ขอบคุณครับ อ.
เมื่อ อ. 07 ต.ค. 2551 @ 15:03
863442 [ลบ]
เริ่มเข้าใจมากขึ้นคะ
ขอบคุณคะ
เมื่อ อ. 07 ต.ค. 2551 @ 21:21
864341 [ลบ]
เพิ่งถึงบาง..อ้อ