ตอนแรกนี้ เป็นเรื่องของ confidence interval
Confidence interval เป็นการบอกว่า ข้อมูลส่วนใหญ่ของเรา อยู่ในช่วงไหน โดยกรองทิ้งข้อมูลส่วนน้อยออกไป
ทำไมต้องกรองทิ้งข้อมูลส่วนน้อย ? ทำไมไม่ใช้ช่วงค่าสูงสุดต่ำสุดมาเป็นตัวบอก เก็บทุกอย่างไว้ทั้งหมด ? (แบบว่า งกอ่ะนะ)
นั่นเป็นเพราะข้อมูลส่วนน้อยที่สุดโต่ง เวลาสุดโต่งขึ้นมา จะผิดปรกติแบบเอาแน่ไม่ได้ ทำให้ช่วงค่าสูงสุดต่ำสุด จะผันผวนมาก
แต่ถ้าเล็มทิ้งส่วนที่สุดโต่งออก แล้วดูแต่แกนที่เหลือข้างใน จะมีเสถียรภาพกว่า
ต่อให้เป็นเงาะที่มาจากช่อเดียวกันที่คล้ายกัน หากวัดตั้งแต่ปลายขนด้านหนึ่งไปสุดปลายขนอีกด้านหนึ่ง เราจะพบว่า ขนาดที่นิยามแบบนี้ จะผันผวนมาก เพราะปลายขนเงาะ อาจมีเส้นที่ยาวผิดปรกติ เลือกขนผิดเส้น อาจทำให้วัดขนาดเงาะที่แตกต่างหลากหลายมาก
แต่ถ้าเรากล้อนขนออกไป เหลือแต่เปลือกแบบไม่มีขน เวลาวัดขนาด เราจะวัดได้น่าเชื่อถือกว่า
การใช้ confidence interval ก็เหมือนเป็นการที่เราทิ้งข้อมูลชายขอบ ซึ่งจะผันผวนได้รุนแรง เหลือข้อมูลส่วนแกน ซึ่งจะเสถียรกว่า
การใช้ confidence interval จึงเป็นการแกล้งมองข้ามข้อมูลสุดโต่ง
รูปนี้ ตัดข้อมูลขอบทิ้งไป 10 %
confidence interval 100 % ก็คือ การเอาข้อมูลทั้งหมดมาใช้ [รูปบน]
confidence interval 99 % ก็คือ การเอาข้อมูลแกนกลางมาใช้ 99 % ที่เหลือทิ้ง (ทิ้งด้านบนที่สูงผิดปรกติไป 0.5 % และทิ้งด้านล่างที่ต่ำผิดปรกติไป 0.5 %) [รูปกลาง]
confidence interval 90 % ก็คือ การเอาข้อมูลแกนกลางมาใช้ 90 % ที่เหลือทิ้ง (ทิ้งด้านบนที่สูงผิดปรกติไป 5 % และทิ้งด้านล่างที่ต่ำผิดปรกติไป 5 %) [รูปล่าง]
ส่วนที่ทิ้งไป เรียกว่า alpha level (α)
หนุ่มไหนโดนสาวทิ้ง ลองถามสาวก่อนจากดูว่า "เธอเห็นฉันเป็น alpha level หรือไร" ?
...โห ฟังแล้วโรแมนติกมิเบาเลยนั่น...
confidence interval 90 % ก็คือ ทิ้งด้านบนที่สูงผิดปรกติไป 5 % (=α/2) และทิ้งด้านล่างที่ต่ำผิดปรกติไป 5 % (=α/2)
ระวังเรื่องหน่วย
confidence interval นิยมใช้หน่วย % คือเทียบฐาน 100
แต่ alpha level นิยมใช้หน่วย probability scale คือ เทียบฐาน 1
สมมติว่า ผมสนใจ 99 % confidence interval ล่ะ ? α จะเป็นเท่าไหร่ ?
alpha (α) ก็ต้องเป็น 0.01 เพราะเก็บแกน 99 % ไว้ ก็ต้องเล็มทิ้งไป 1 % ซึ่งก็คือ 0.01 เมื่อเทียบจาก 1
กรณีนี้ α/2 จะเท่ากับ 0.005
alpha = 1 - (% confidence interval หาร 100)
Confidence interval และ alpha สำคัญอย่างไร โปรดติดตามตอนต่อไป
สารบัญเรื่อง


เมนูของ wwibul








เมื่อ จ. 06 ต.ค. 2551 @ 11:19
861238 [ลบ]
มาสนับสนุนค่ะอาจารย์ เรื่องคณิตศาสตร์ เป็นเรื่องที่ต้องใช้ความเข้าใจจริงๆ ไม่ใช่จะท่องเอาได้ แต่ก็อยู่ที่วิธีการสอนด้วย ถ้าครูสอนไม่เก่ง ยังไง นักเรียนก็ไม่เข้าใจ
การที่เด็กจะเก่งคณิตศาสตร์ เด็กต้องเป็นคนชอบคณิตศาสตร์อยู่ก่อนเป็นพื้นแล้วไหมคะอาจารย์ ถ้าเป็นเด็กมีนิสัยชอบเลข ก็จะรับง่ายกว่าไหมคะ
จะมาตามอ่านไปเรื่อยๆค่ะ
เมื่อ จ. 06 ต.ค. 2551 @ 13:32
861479 [ลบ]
ขอบคุณครับอ.
ได้รื้อฟิ้นเรื่องสถิติขึ้นมานิดนึง ดีนะที่ตอนเรียนพอเข้าใจ พอฟังอ.แล้วเลยไม่ งง เท่าไร
แต่บางทีสำหรับนศ.บางกลุ่ม คำศัพท์ทางเทคนิคอาจจะทำให้มึนได้ครับ
เวลาผมอธิบายให้เพื่อนฟัง จะมีแต่
ค่าวิกฤต (Alpha) หรือค่าความผิดพลาดที่ยอมรับได้ ปกติคือ 0.05 กับ 0.01 มีที่มาจาก
ค่าความเชื่อมั่น (Confidence) เช่นต้องการความเชื่อมั่น 95% ค่าความผิดพลาดที่ยอมรับได้คือ 5% แปลว่า ค่าวิกฤตที่ได้คือ 0.05
แบบนี้ผมอธิบายถูกมั้ยครับ อ.
เมื่อ จ. 06 ต.ค. 2551 @ 14:04
861541 [ลบ]
ขอบคุณครับอ.
ผมเรียนมาไม่ค่อยได้ใช้ก็ลืมๆ ไป ถ้าให้คำนวนคงทำไม่ถูก แต่ถ้าให้อ่านแล้วแปลความนี่ยังพอไหว
รอติดตามตอนต่อไปครับ
เมื่อ จ. 06 ต.ค. 2551 @ 16:00
861787 [ลบ]
สวัสดีครับ พี่ศศิ
ขอบคุณครับ ที่มาตามอ่าน ให้กำลังใจผมมากเลย เพราะผมนึกไม่ออกว่าพี่จะไปใช้กับเรื่องอะไร
ขอบคุณเช่นกันครับ
เมื่อ จ. 06 ต.ค. 2551 @ 16:49
861847 [ลบ]
มาเรียนด้วยคนค่ะ
คงได้ใช้บ้าง..น่ะค่ะ
**การใช้ confidence interval ก็เหมือนเป็นการที่เราทิ้งข้อมูลชายขอบ ซึ่งจะผันผวนได้รุนแรง เหลือข้อมูลส่วนแกน ซึ่งจะเสถียรกว่า**
เวลาเขาตัดคะแนนสูงสุด ต่ำสุด(ในการตัดสินกีฬา)ใช่แนวคิดเดียวกันนี้หรือเปล่าคะ
ถามเพราะไม่รู้ ทั้งที่อาย ๆ ว่าไม่รู้ก็อยากถามค่ะ
เมื่อ จ. 06 ต.ค. 2551 @ 17:46
861934 [ลบ]
สวัสดีครับ คุณภู
เมื่อ จ. 06 ต.ค. 2551 @ 22:56
862602 [ลบ]
ครับอ.
จะติดตามตอนต่อไปครับ
เมื่อ อ. 07 ต.ค. 2551 @ 15:00
863429 [ลบ]
สวัสดีคะ อ.
จะตามอ่านต่อคะ เข้าใจขึ้นมากกว่าเดิมคะ