สมัครสมาชิก   เข้าระบบ  
ประกาศ: UKM 14 ที่ ม.มหาสารคาม เลื่อนเป็นวันที่ 9-10 ม.ค. 2552
ใบไม้ผลิ
อ่าน: 295
เรียนสถิติด้วยภาพ ตอนที่ 1 Confidence Interval & alpha level
ผมทดลองใช้ภาษาภาพในการทบทวนสถิติให้กับคนที่เรื้อสถิติไปนาน ๆ แล้วพบว่าได้ผลดี ทุ่นเวลาได้มาก วันก่อน พูดเรื่อง EBM ให้ทีม UsableLabs ฟัง ต้องพาดพิงถึงสถิติ ก็ไปคุ้ยสไลด์สถิติที่เคยใช้สอนฟื้นความจำแบบเร่งรัดให้นักศึกษาฟังเวลาจะสอนเรื่องการทำวิจัย เป็นสไลด์ที่เน้นการเล่า concept ด้วยภาพ เพราะเคยใช้แล้วได้ผลดี คือคนฟังจะไม่ทำหน้าชราภาพก่อนวัยอันสมควรให้ดู

ตอนแรกนี้ เป็นเรื่องของ confidence interval

Confidence interval เป็นการบอกว่า ข้อมูลส่วนใหญ่ของเรา อยู่ในช่วงไหน โดยกรองทิ้งข้อมูลส่วนน้อยออกไป

ทำไมต้องกรองทิ้งข้อมูลส่วนน้อย ? ทำไมไม่ใช้ช่วงค่าสูงสุดต่ำสุดมาเป็นตัวบอก เก็บทุกอย่างไว้ทั้งหมด ? (แบบว่า งกอ่ะนะ)

นั่นเป็นเพราะข้อมูลส่วนน้อยที่สุดโต่ง เวลาสุดโต่งขึ้นมา จะผิดปรกติแบบเอาแน่ไม่ได้ ทำให้ช่วงค่าสูงสุดต่ำสุด จะผันผวนมาก

แต่ถ้าเล็มทิ้งส่วนที่สุดโต่งออก แล้วดูแต่แกนที่เหลือข้างใน จะมีเสถียรภาพกว่า

Rambutanconfidenceinterval 
ลองดูเงาะรูปนี้

ต่อให้เป็นเงาะที่มาจากช่อเดียวกันที่คล้ายกัน หากวัดตั้งแต่ปลายขนด้านหนึ่งไปสุดปลายขนอีกด้านหนึ่ง เราจะพบว่า ขนาดที่นิยามแบบนี้ จะผันผวนมาก เพราะปลายขนเงาะ อาจมีเส้นที่ยาวผิดปรกติ เลือกขนผิดเส้น อาจทำให้วัดขนาดเงาะที่แตกต่างหลากหลายมาก

แต่ถ้าเรากล้อนขนออกไป เหลือแต่เปลือกแบบไม่มีขน เวลาวัดขนาด เราจะวัดได้น่าเชื่อถือกว่า

การใช้ confidence interval ก็เหมือนเป็นการที่เราทิ้งข้อมูลชายขอบ ซึ่งจะผันผวนได้รุนแรง เหลือข้อมูลส่วนแกน ซึ่งจะเสถียรกว่า

การใช้ confidence interval จึงเป็นการแกล้งมองข้ามข้อมูลสุดโต่ง

Ci-complete รูปแรก มีข้อมูลครบ 100 %

Ci-99pctรูปนี้ ตัดข้อมูลขอบทิ้งไป 1 %

 Ci-90pctรูปนี้ ตัดข้อมูลขอบทิ้งไป 10 %

 

confidence interval 100 % ก็คือ การเอาข้อมูลทั้งหมดมาใช้ [รูปบน]

confidence interval 99 % ก็คือ การเอาข้อมูลแกนกลางมาใช้ 99 % ที่เหลือทิ้ง (ทิ้งด้านบนที่สูงผิดปรกติไป 0.5 % และทิ้งด้านล่างที่ต่ำผิดปรกติไป 0.5 %)  [รูปกลาง]

confidence interval 90 % ก็คือ การเอาข้อมูลแกนกลางมาใช้ 90 % ที่เหลือทิ้ง (ทิ้งด้านบนที่สูงผิดปรกติไป 5 % และทิ้งด้านล่างที่ต่ำผิดปรกติไป 5 %)  [รูปล่าง]

 

ส่วนที่ทิ้งไป เรียกว่า alpha level (α)

 

หนุ่มไหนโดนสาวทิ้ง ลองถามสาวก่อนจากดูว่า "เธอเห็นฉันเป็น alpha level หรือไร" ?

...โห ฟังแล้วโรแมนติกมิเบาเลยนั่น...

confidence interval 90 % ก็คือ ทิ้งด้านบนที่สูงผิดปรกติไป 5 % (=α/2) และทิ้งด้านล่างที่ต่ำผิดปรกติไป 5 % (=α/2)

ระวังเรื่องหน่วย

confidence interval นิยมใช้หน่วย % คือเทียบฐาน 100

แต่ alpha level นิยมใช้หน่วย probability scale คือ เทียบฐาน 1

สมมติว่า ผมสนใจ 99 % confidence interval ล่ะ ? α  จะเป็นเท่าไหร่ ?

alpha (α) ก็ต้องเป็น 0.01 เพราะเก็บแกน 99 % ไว้ ก็ต้องเล็มทิ้งไป 1 % ซึ่งก็คือ 0.01 เมื่อเทียบจาก 1

กรณีนี้ α/2 จะเท่ากับ 0.005

alpha = 1 - (% confidence interval หาร 100)

Confidence interval และ alpha สำคัญอย่างไร โปรดติดตามตอนต่อไป

 

สารบัญเรื่อง 

เรียนสถิติด้วยภาพ ตอนที่ 3 Confidence Interval, alpha & beta    
เรียนสถิติด้วยภาพ ตอนที่ 2 Confidence Interval, alpha level & Statistical difference    
เรียนสถิติด้วยภาพ ตอนที่ 1 Confidence Interval & alpha level

สร้าง: จ. 06 ต.ค. 2551 @ 10:07   แก้ไข: อา. 12 ต.ค. 2551 @ 16:15   ขนาด: 8001 ไบต์
ความคิดเห็น
P
1. Sasinand
เมื่อ จ. 06 ต.ค. 2551 @ 11:19
861238 [ลบ]

มาสนับสนุนค่ะอาจารย์ เรื่องคณิตศาสตร์ เป็นเรื่องที่ต้องใช้ความเข้าใจจริงๆ ไม่ใช่จะท่องเอาได้ แต่ก็อยู่ที่วิธีการสอนด้วย ถ้าครูสอนไม่เก่ง ยังไง นักเรียนก็ไม่เข้าใจ
 
การที่เด็กจะเก่งคณิตศาสตร์  เด็กต้องเป็นคนชอบคณิตศาสตร์อยู่ก่อนเป็นพื้นแล้วไหมคะอาจารย์  ถ้าเป็นเด็กมีนิสัยชอบเลข ก็จะรับง่ายกว่าไหมคะ
จะมาตามอ่านไปเรื่อยๆค่ะ

P
2. Nat_Panik
เมื่อ จ. 06 ต.ค. 2551 @ 13:32
861479 [ลบ]

ขอบคุณครับอ.

ได้รื้อฟิ้นเรื่องสถิติขึ้นมานิดนึง ดีนะที่ตอนเรียนพอเข้าใจ พอฟังอ.แล้วเลยไม่ งง เท่าไร

แต่บางทีสำหรับนศ.บางกลุ่ม คำศัพท์ทางเทคนิคอาจจะทำให้มึนได้ครับ

เวลาผมอธิบายให้เพื่อนฟัง จะมีแต่

ค่าวิกฤต (Alpha) หรือค่าความผิดพลาดที่ยอมรับได้ ปกติคือ 0.05 กับ 0.01 มีที่มาจาก

ค่าความเชื่อมั่น (Confidence) เช่นต้องการความเชื่อมั่น 95% ค่าความผิดพลาดที่ยอมรับได้คือ 5% แปลว่า ค่าวิกฤตที่ได้คือ 0.05

แบบนี้ผมอธิบายถูกมั้ยครับ อ.

P
3. Mr.JoH
เมื่อ จ. 06 ต.ค. 2551 @ 14:04
861541 [ลบ]

ขอบคุณครับอ.

ผมเรียนมาไม่ค่อยได้ใช้ก็ลืมๆ ไป ถ้าให้คำนวนคงทำไม่ถูก แต่ถ้าให้อ่านแล้วแปลความนี่ยังพอไหว

รอติดตามตอนต่อไปครับ

P
4. wwibul
เมื่อ จ. 06 ต.ค. 2551 @ 16:00
861787 [ลบ]

สวัสดีครับ พี่ศศิ

ขอบคุณครับ ที่มาตามอ่าน ให้กำลังใจผมมากเลย เพราะผมนึกไม่ออกว่าพี่จะไปใช้กับเรื่องอะไร  

สวัสดีครับปาณิก Nat_Panik
"แบบนี้ผมอธิบายถูกมั้ยครับ อ."
ผมอ่านแล้วก็งง ๆ นะ เพราะภาษาที่ใช้ ผมไม่คุ้น คงต้องให้คนที่เขาเรียนมาตรง ๆ ทางนี้ช่วยตอบ เท่าที่ดู โดยความหมายกว้าง ๆ แล้วก็ประมาณนั้นแหละ แต่นิยามแม่นตรงนี่ ไม่รู้เหมือนกันว่าจะถูกไหม 555

 
สวัสดีครับ Mr.JoH

ขอบคุณเช่นกันครับ

ไม่มีรูป
5. ภูสุภา
เมื่อ จ. 06 ต.ค. 2551 @ 16:49
861847 [ลบ]

มาเรียนด้วยคนค่ะ

คงได้ใช้บ้าง..น่ะค่ะ

**การใช้ confidence interval ก็เหมือนเป็นการที่เราทิ้งข้อมูลชายขอบ ซึ่งจะผันผวนได้รุนแรง เหลือข้อมูลส่วนแกน ซึ่งจะเสถียรกว่า**

เวลาเขาตัดคะแนนสูงสุด ต่ำสุด(ในการตัดสินกีฬา)ใช่แนวคิดเดียวกันนี้หรือเปล่าคะ

ถามเพราะไม่รู้ ทั้งที่อาย ๆ ว่าไม่รู้ก็อยากถามค่ะ

P
6. wwibul
เมื่อ จ. 06 ต.ค. 2551 @ 17:46
861934 [ลบ]

สวัสดีครับ คุณภู

  • ใช่แล้วครับ คะแนนชายขอบ มักสร้างปัญหา ซึ่งเกินแรง ๆ สักรายการหนึ่ง ก็ทำให้ภาพรวมเสียไปหมด การตัดชายขอบออก ทำให้เกิดเสถียรภาพมากขึ้น
P
7. Nat_Panik
เมื่อ จ. 06 ต.ค. 2551 @ 22:56
862602 [ลบ]

ครับอ.

จะติดตามตอนต่อไปครับ

P
8. สี่ซี่
เมื่อ อ. 07 ต.ค. 2551 @ 15:00
863429 [ลบ]

สวัสดีคะ อ.

จะตามอ่านต่อคะ เข้าใจขึ้นมากกว่าเดิมคะ

ชื่อ:
อีเมล:
IP แอดเดรส: 38.103.63.56
  เรียกใช้งานตัวจัดการข้อความ
ข้อความ:
 
รหัสสุ่ม: (ใส่รหัสสุ่มที่แสดงไว้ด้านบน)
  ยกเลิก