เขียนเกี่ยวกับเรื่องเปอร์เซ็นไทล์และควอไทล์มาหลายบันทึกแล้ว ลองมาเปรียบเทียบให้เห็นกันชัดๆ อีกสักครั้ง
เปอร์เซ็นไทล์ (Percentiles) ควอไทล์ (Quartiles) และพิสัยระหว่างควอไทล์ Interquartile Range (IQR) เป็นวิธีอธิบายการกระจายของข้อมูลในชุดข้อมูล
เปอร์เซ็นไทล์เป็นการแบ่งข้อมูลออกเป็น 100 ส่วนเท่าๆ กัน เปอร์เซ็นไทล์ใข้ระบุว่ากี่เปอร์เซ็นต์ของจำนวนคะแนนที่มีค่าต่ำกว่าของคะแนนที่ตำแหน่งนั้น
ในการหาค่าเปอร์เซ็นไทล์ เราต้องจัดเรียงข้อมูลตามลำดับจากน้อยไปมากก่อน จากนั้นใช้สูตรเพื่อคำนวณตำแหน่งของเปอร์เซ็นไทล์ในชุดข้อมูล:
ตำแหน่งเปอร์เซ็นไทล์ = (เปอร์เซ็นไทล์ / 100) * จำนวนจุดข้อมูลทั้งหมด
สมมุติคะแนนแบบสุ่มของนักเรียน 100 คน:
[56, 67, 72, 75, 79, 80, 81, 82, 85, 86, 87, 88, 89, 90, 91, 92, 92, 93, 94, 94, 95, 95, 96, 96, 97 , 97, 98, 98, 98, 99, 99, 100, 100, 100, 100, 100, 100, 100, 100, 100, 100, 100, 100, 100, 100, 100, 100, 100, 100, 100 ...]
เราต้องการทราบว่าต้องได้คะแนนเท่าไรจึงจะอยู่ใน TOP 20% ของคะแนนทั้งหมด
หากเราจัดเรียงคะแนนจากน้อยไปมาก เปอร์เซ็นไทล์ที่ 80 คือคะแนนที่ตำแหน่งที่ 80 ซึ่งคือคะแนน 98
หมายความว่า 80% ของนักเรียนทำคะแนนได้ 98 หรือน้อยกว่า และ 20% ของนักเรียนทำคะแนนได้มากกว่า 98 กล่าวอีกนัยหนึ่ง นักเรียนจะต้องได้คะแนนมากกว่า 98 อยู่ใน TOP 20% ของนักเรียนทั้งหมด
ควอไทล์เป็นวิธีแบ่งข้อมูลออกเป็นสี่ส่วนเท่าๆ กัน มีสามควอไทล์: ควอไทล์แรก (Q1), ควอไทล์ที่สอง (Q2) และควอไทล์ที่สาม (Q3)
Q1 คือเปอร์เซ็นไทล์ที่ 25, Q2 คือเปอร์เซ็นไทล์ที่ 50 (หรือค่ามัธยฐาน) และ Q3 คือเปอร์เซ็นไทล์ที่ 75
ควอไทล์ คือตำแหน่งที่ระบุว่ามีจำนวนข้อมูลเท่าไรในสี่ส่วนของจำนวนข้อมูลที่มีค่าต่ำกว่าข้อมูลที่ตำแหน่งนั้น
ในการคำนวณควอไทล์ ให้ทำตามขั้นตอนเหล่านี้:
1. จัดเรียงข้อมูลตามลำดับจากน้อยไปมาก
2. หาค่ามัธยฐาน (Q2) คือตัวเลขตรงกลางในชุดข้อมูลที่เรียงลำดับ
- ถ้าเป็นจำนวนคี่ ค่ามัธยฐานจะเป็นจำนวนกลาง
- ถ้าเป็นจำนวนคู่ ค่ามัธยฐานคือค่าเฉลี่ยของจำนวนกลางสองตัว
3. หาควอไทล์แรก (Q1) คือค่ามัธยฐานของครึ่งล่างของข้อมูล คือข้อมูลประมาณ 25% แรก
- ถ้าเป็นจำนวนคี่ ให้แยกค่ามัธยฐานออก แล้วหาค่ามัธยฐานของครึ่งล่างของข้อมูล
- ถ้าเป็นจำนวนคู่ ให้หาค่ามัธยฐานของข้อมูลครึ่งล่างของข้อมูลได้เลย
4. หาควอไทล์ที่สาม (Q3) คือค่ามัธยฐานของครึ่งบนของข้อมูล คือประมาณ 75% ของข้อมูลจากข้อมูลที่สูงสุด 25%
- ถ้าเป็นจำนวนคี่ ให้แยกค่ามัธยฐานแล้วหาค่ามัธยฐานของครึ่งบน
- ถ้าเป็นจำนวนคู่ ให้หาค่ามัธยฐานของครึ่งบนของข้อมูลได้เลย
พิสัยระหว่างควอไทล์คือความแตกต่างระหว่างควอไทล์ที่หนึ่งและควอไทล์ที่สาม (Q3 - Q1) จะบอกเราถึงช่วงที่ค่ากลาง 50% ของช่วงอายุอยู่ ในตัวอย่างของเรา IQR = 19 - 5 = 14 ดังนั้น เด็กอายุ 50% กลางๆ ของเด็กที่มารวมตัวกันในครอบครัวของเราจะมีอายุตั้งแต่ 5 ถึง 19 ปี
ชุดคะแนนสอบของนักเรียน 9 คน:
39, 41, 43, 47, 49, 52, 54, 56, 58
ขั้นแรกต้องจัดเรียงข้อมูลจากน้อยไปหามาก
Q2 (ค่ามัธยฐาน) ค่ากลางในชุดข้อมูลที่จัดเรียง เนื่องจากมี 9 จุดข้อมูล จุดข้อมูลที่ 5 จะเป็นค่ามัธยฐาน ดังนั้นค่ามัธยฐานคือ 49
Q1 ค่ามัธยฐานของครึ่งล่างของข้อมูล ไม่รวม Q2 ครึ่งล่างคือ {39, 41, 43, 47} และค่ามัธยฐานคือค่าเฉลี่ยของ 41 และ 43 ซึ่งก็คือ 42
Q3 ค่ามัธยฐานของครึ่งบนของข้อมูล ไม่รวม Q2 ครึ่งบนคือ {52, 54, 56, 58} และค่ามัธยฐานคือค่าเฉลี่ยของ 54 และ 56 ซึ่งก็คือ 55
ดังนั้น ในคะแนนการทดสอบชุดนี้ คะแนนควอร์ไทล์แรกคือ 42 คะแนนมัธยฐานคือ 49 และคะแนนควอร์ไทล์ที่สามคือ 55
- 25% ของนักเรียนทำคะแนนได้ 42 หรือน้อยกว่า (Q1)
- 50% ของนักเรียนได้คะแนน 49 หรือน้อยกว่า (Q2/ค่ามัธยฐาน)
- 75% ของนักเรียนทำคะแนนได้ 55 คะแนนหรือน้อยกว่า (Q3)
- พิสัยระหว่างควอไทล์ (Q3-Q1) ซึ่งเป็นการวัดตำแหน่ง "กึ่งกลาง" คือ 55-42
- คะแนนสอบ 50% อยู่ระหว่าง 42 ถึง 55
- คะแนนใดๆ ที่สูงกว่า 55 จะถือว่าอยุ่ใน top 25% แรกของการสอบ
Ummh I think this “…ตัวอย่างเช่น ถ้านักเรียนคนหนึ่งทำคะแนนในการสอบได้ร้อยละ 90 นั่นหมายความว่าเขาทำคะแนนได้ดีกว่า 90% ของนักเรียนที่สอบ…” needs editing. It does not goes well with the rest (which are excellent and correct).
Sure! Thank you.