การตรวจจับค่าผิดปกติด้วยค่าพิสัยระหว่างควอไทล์ (IQR)


ค่าพิสัยระหว่างควอไทล์ (IQR) 

IQR หรือพิสัยระหว่างควอไทล์เป็นการวัดทางสถิติของการกระจายของข้อมูล เป็นความแตกต่างระหว่างควอไทล์บน (Q3) และควอไทล์ล่าง (Q1) และครอบคลุม 50% ตรงกลางของข้อมูล

นักวิจัยใช้ IQR เพื่อตรวจจับค่าผิดปกติเนื่องจากเป็นวิธีการวัดการกระจายที่เชื่อถือได้ IQR ดูที่การกระจายของข้อมูล 50% ตรงกลาง เนื่องจากพิจารณาจากค่ากลาง 50% เท่านั้น จึงทนทานต่ออิทธิพลของค่าที่สูงเกินไป ทำให้เป็นเครื่องมือที่มีประโยชน์มากในการตรวจจับค่าผิดปกติ

ค่าผิดปกติมักถูกกำหนดให้เป็นค่าสังเกตที่ต่ำกว่า Q1 − 1.5 IQR หรือสูงกว่า Q3 + 1.5 IQR ค่าเหล่านี้เป็นค่าที่ห่างจากข้อมูลส่วนที่เหลือพอสมควร 

ตัวอย่าง

สมมุติเรามีชุดข้อมูลคะแนนสอบดังนี้

75, 80, 85, 88, 89, 90, 90, 91, 92, 95, 96, 98, 100, 105, 110, 120, 130, 150.

ก่อนอื่นเราต้องคำนวณควอไทล์:

1. Q1 (ควอไทล์แรก) คือค่ามัธยฐานของครึ่งแรกของข้อมูล นี่คือ 88.5

2. Q3 (ควอไทล์ที่สาม) คือค่ามัธยฐานของครึ่งหลังของข้อมูล นี่คือ 105

ต่อไปคำนวณค่าพิสัยระหว่างควอไทล์ (IQR) ซึ่งก็คือ Q3 - Q1 = 105 - 88.5 = 16.5

เราใช้ IQR เพื่อกำหนด "ขอบเขต" สำหรับสิ่งที่ถือว่าเป็นค่าผิดปกติ:

1. เขตล่าง: Q1 - 1.5*IQR = 88.5 - 1.5*16.5 = 63

2. เขตบน: Q3 + 1.5*IQR = 105 + 1.5*16.5 = 130.5

จุดข้อมูลใด ๆ ที่อยู่นอกขอบเขตเหล่านี้ถือเป็นค่าผิดปกติ ดังนั้นในชุดข้อมูลนี้ ค่า "150" จึงเป็นค่าผิดปกติ เนื่องจากมีค่ามากกว่าขอบเขตบนของ 130.5 จุดข้อมูลอื่นๆ ทั้งหมดอยู่ในช่วงและไม่ถือว่าเป็นค่าผิดปกติ

ค่าผิดปกติไม่จำเป็นต้องเป็นข้อมูลที่ "ไม่ดี" หรือ "ผิด" แต่เป็นค่าที่มากเกินไปหรือน้อยเกินไปเทียบกับกลุ่มข้อมูลส่วนใหญ่

หมายเลขบันทึก: 712853เขียนเมื่อ 21 พฤษภาคม 2023 14:25 น. ()แก้ไขเมื่อ 23 พฤษภาคม 2023 19:13 น. ()สัญญาอนุญาต: สงวนสิทธิ์ทุกประการจำนวนที่อ่านจำนวนที่อ่าน:


ความเห็น (1)

This is when ‘exceptional cases’ get drop from further considerations. In statistics freaks, geniuses, and abnormal get dropped are not in the realm of ‘normal’ (Central Limit Theorem) and should be dealt with by ‘non-parametric statistical methods’ (eg. Kruskal-Wallis test - this also needs ‘large samples’).

Innovation may come from study of ‘these exceptional cases’ (then once learned and practiced they become ‘normal’ with higher average value.)

พบปัญหาการใช้งานกรุณาแจ้ง LINE ID @gotoknow
ClassStart
ระบบจัดการการเรียนการสอนผ่านอินเทอร์เน็ต
ทั้งเว็บทั้งแอปใช้งานฟรี
ClassStart Books
โครงการหนังสือจากคลาสสตาร์ท