เวลาเปรียบเทียบค่าเฉลี่ยของข้อมูลสองกอง เราจะเทียบอย่างไร ?
ก่อนอื่น เราต้องตระหนักว่า เราไม่ได้เปรียบเทียบประชากรแต่ละรายของทั้งสองกองโดยตรง แต่เปรียบเทียบค่าเฉลี่ยที่ได้จากการสุ่มทดลอง
สมมติว่า จากประชากรที่เป็นได้ข้างต้นนี้ เราสุ่มมาแต่ละกอง กองละ 25 หน่วย แล้วมาหาค่าเฉลี่ย เวลาลงจุด เราก็จะเห็นจุดสองจุดลอยอยู่
ปัญหาคือ เวลาเราเห็นจุดสองจุดลอยอยู่แบบไม่มีกรอบอ้างอิง หรือใช้กรอบอ้างอิงไม่เหมาะสม เราบอกไม่ถูกว่า มันใกล้กัน หรือไกลกัน
ลองดูเมฆที่ลอยใกล้พระจันทร์สิครับ เราบอกได้ไหม ถ้าไม่เรียนวิทยาศาสตร์มาก่อน ว่าเมฆห่างดวงจันทร์แค่ไหน
กรณีนี้ กรอบอ้างอิงคือ เมื่อเทียบกับความไม่แน่นอนของค่าเฉลี่ยแต่ละตัวที่เราวัดมาได้
ความไม่แน่นอนของค่าเฉลี่ยแต่ละตัวที่เราวัดมาได้นี้ ตอนก่อนหน้า ก็พูดถึงแล้วว่า เรียก standard error of the mean หรือ SE
เราจะรู้ได้อย่างไร ว่ามี SE เท่าไหร่
ง่าย ๆ ก็คือ ถ้าทดลองซ้ำหลาย ๆ รอบ แต่ละรอบ ก็ทำแบบเดิม คือหยิบมากองละ 25 หาค่าเฉลี่ย แล้วลงจุด
พอทำแล้ว ก็จะเห็นแบบนี้
เวลาจะเปรียบเทียบกัน เขาใช้วิธีโกยความไม่แน่นอนของกองหนึ่งไปให้อีกกอง เรียกว่า pooled standard error ทำให้กองหนึ่ง มีความไม่แน่นอนมากขึ้น อีกกอง กลายเป็นจุดอ้างอิง ซึ่งความไม่แน่นอนรวมนี้เอง ที่ถูกใช้อ้างอิงเป็นหน่วยวัดระยะมาตรฐาน
ลองดูอย่างเครื่องชั่งหรือเครื่องตวง ค่าที่ไม่แน่นอนในการอ่าน ก็ราว ๆ 1 ขีด เขาก็ใช้ 1 ขีดเป็นหน่วยวัดระยะอ้างอิง
ระยะห่างของจุดศูนย์กลาง จะดูว่าไกลกันไหม ก็หารด้วยหน่วยวัดมาตรฐาน คำนวณตามสูตรแรก
เวลาเราดูระยะห่างจุดอ้างอิงทั้งสอง เราก็ดูโดยเทียบจากระดับความไม่แน่นอน โดยแปลงให้เป็นหน่วย t-scale โดยระยะ t-scale รอบจุดศูนย์กลางที่คลุมจุดประมาณ 68 % เรียกว่า สเกลเป็น 1 หน่วยของ t
คราวนี้ เราก็ดูได้เลยว่า สองจุดนี้ห่างกันแค่ไหน ส่วนรอบนอกของความไม่แน่นอนของกองหนึ่ง เกยล้ำไปถึงจุดอ้างอิงแค่ไหน ระดับการล้ำก็คือ p-value
p-value บอกถึงขนาดของการเกย ค่าน้อยคือเกยน้อย เกยน้อยคืออยู่ไกล คือแตกต่าง
ถ้าเกยกันมาก คือไม่แตกต่างทางสถิติ
ถ้าไม่เกยกัน แถมห่างกันให้เห็นชัด คือแตกต่างทางสถิติอย่างมีนัยสำคัญ
สนใจอ่าน เรียนสถิติด้วยภาพ แบบครบทุกตอน เข้าไปที่
http://www.gotoknow.org/posts?tag=เรียนสถิติด้วยภาพ
ไม่มีความเห็น