ค่าสัมประสิทธิ์ของการแปรผัน (ค่า CV) เปรียบเทียบการแปรปรวนระหว่างชุดข้อมูล


ค่าเฉลี่ย (Mean) และ ค่าเบี่ยงเบนมาตรฐาน (SD)

ในหลายบันทึกก่อนหน้านี้เราทราบแล้วว่า ค่าเฉลี่ย หรือค่า Mean จะบอกจุดศูนย์กลางของข้อมูล ในขณะที่ค่าเบี่ยงเบนมาตรฐาน หรือค่า SD ทำให้เราสามารถวัดได้ว่าค่าต่างๆ นั้นกระจายออกจากค่าเฉลี่ยอย่างไร

ค่า SD ต่ำ กับ สูง หมายความว่าอะไร

ค่า SD ต่ำ หมายความว่าข้อมูลส่วนใหญ่ใกล้เคียงกับค่าเฉลี่ย ค่า SD สูง หมายความว่าตัวเลขกระจายออกไปมากขึ้น

แต่การพิจารณาว่าค่า SD ควรสูงหรือต่ำนั้นขึ้นอยู่กับบริบท ตัวอย่างเช่น ความสูงเฉลี่ยของผู้ใหญ่ ค่าเบี่ยงเบนมาตรฐาน 10 ซม. อาจถือว่าค่อนข้างสูง เนื่องจากความสูงของมนุษย์จะรวมกันอยู่รอบๆ ค่าเฉลี่ย

ในทางกลับกัน หากเรากำลังดูรายได้เฉลี่ยในประเทศ ค่า SD ที่ 5,000 บาทอาจถือว่าต่ำ เนื่องจากรายได้อาจอยู่ในช่วงกว้าง

สิ่งสำคัญคือ ค่าเฉลี่ยและค่า SD มีความหมายมากที่สุดสำหรับข้อมูลที่กระจายแบบสมมาตร หากข้อมูลเบ้หรือมีค่าผิดปกติ ค่าเฉลี่ยและ SD อาจไม่ได้ให้ภาพที่แท้จริงของการกระจายข้อมูล ในกรณีเช่นนี้ การวัดอื่นๆ เช่น มัธยฐาน ฐานนิยม ควอร์ไทล์ และ IQR (Inter Quartile Range) อาจเหมาะสมกว่า

ค่าสัมประสิทธิ์ของการแปรผัน (Coefficient of Variation) หรือ (CV)

หากเราต้องการเปรียบเทียบการแปรปรวนระหว่างชุดข้อมูลตั้งแต่สองชุดขึ้นไป (โดยเฉพาะอย่างยิ่งเมื่อชุดข้อมูลมีหน่วยที่ต่างกันหรือมาตราการวัดที่ต่างกัน) เราจะใช้ค่าสัมประสิทธิ์ของการแปรผัน (Coefficient of Variation) หรือ (CV) ซึ่งคำนวณหรือหาค่าได้โดย ค่า SD หารด้วยค่าเฉลี่ย

ถ้าค่า CV สูง แสดงว่ามีความแปรปรวนสูงเมื่อเทียบกับค่าเฉลี่ย และ ถ้าค่า CV ต่ำ แสดงว่ามีความแปรปรวนต่ำเมื่อเทียบกับค่าเฉลี่ย

ค่า CV มีประโยชน์เพราะช่วยให้เราสามารถเปรียบเทียบความแปรปรวนระหว่างกลุ่มได้แม้ว่าค่าเฉลี่ยจะแตกต่างกันมากก็ตาม

ชุดข้อมูลมีหน่วยหรือสัดส่วนที่ต่างกัน

ชุดข้อมูลที่แตกต่างกันสามารถมีหน่วยวัดหรือสัดส่วนต่างกันได้ ตัวอย่างเช่น ชุดข้อมูลหนึ่งอาจวัดรายได้เป็นบาท ในขณะที่อีกชุดข้อมูลอาจวัดความสูงเป็นเซนติเมตร ชุดข้อมูลเหล่านี้ไม่สามารถเปรียบเทียบได้โดยตรงเนื่องจากมีหน่วยและสัดส่วนต่างกัน

อย่างไรก็ตาม ด้วยการคำนวณค่า CV เราสามารถทำให้ความแปรปรวนของชุดข้อมูลเหล่านี้เป็นมาตรฐาน คำนวณเป็นอัตราส่วนของค่า SD ต่อค่าเฉลี่ย ซึ่งสามารถแสดงเป็นเปอร์เซ็นต์ได้ด้วยการคูณ ​100

ตัวอย่างค่า CV

ตัวอย่างเช่น เราต้องการเปรียบเทียบรายได้เฉลี่ยของสามอาชีพที่แตกต่างกัน ได้แก่ ครู พยาบาล และวิศวกร

ข้อมูลอาจมีลักษณะดังนี้:

 

อาชีพ รายได้เฉลี่ย ค่า SD ค่า CV
ครู    50,000   5,000   0.10  
พยาบาล   60,000   12,000   0.20  
วิศวกร   80,000   16,000   0.20  

ในตารางนี้ ค่า CV จะคำนวณเป็นอัตราส่วนของค่า SD ต่อค่าเฉลี่ยสำหรับแต่ละอาชีพ

ดังนั้นสำหรับครู CV คือ 5,000 / 50,000 = 0.10 สำหรับพยาบาล CV คือ 12,000 / 60,000 = 0.20 และสำหรับวิศวกร CV คือ 16,000 / 80,000 = 0.20

การอ่านค่า CV ในตาราง

เราสามารถอ่านค่าในตารางได้ดังนี้

จากตาราง เราจะเห็นว่าครูมีความแปรปรวนของรายได้ต่ำที่สุด (CV=0.10) ซึ่งหมายความว่ารายได้ของพวกเขาจะใกล้เคียงกับรายได้เฉลี่ยของอาชีพนี้

ในทางกลับกัน พยาบาลและวิศวกรมีความแปรปรวนของรายได้สูงกว่า (CV=0.20) หมายความว่าอาชีพเหล่านี้มีรายได้ที่หลากหลายกว่า

แม้ว่าวิศวกรจะมีรายได้เฉลี่ยสูงสุดและค่า SD สูงสุด แต่ค่า CV ก็เท่ากับพยาบาล ซึ่งชี้ให้เห็นว่าการกระจายรายได้จะเหมือนกันในสองอาชีพนี้ เมื่อพิจารณาโดยสัมพันธ์กับรายได้เฉลี่ย

 

หมายเลขบันทึก: 712902เขียนเมื่อ 23 พฤษภาคม 2023 19:22 น. ()แก้ไขเมื่อ 23 พฤษภาคม 2023 19:42 น. ()สัญญาอนุญาต: สงวนสิทธิ์ทุกประการจำนวนที่อ่านจำนวนที่อ่าน:


ความเห็น (2)

I think we should read carefully this “…แม้ว่าวิศวกรจะมีรายได้เฉลี่ยสูงสุดและค่า SD สูงสุด แต่ค่า CV ก็เท่ากับพยาบาล ซึ่งชี้ให้เห็นว่า”การกระจาย”รายได้จะ”เหมือนกัน”ในสองอาชีพนี้ เมื่อพิจารณาโดยสัมพันธ์กับรายได้เฉลี่ย…”. The thing that is similar is the relative deviation [from mean] not the “income” which is some 20,000 different.

One point often missing in CV is that it is a ratio at a ‘time’ [not specified here]. CV at different times [of data collections] can be different. And comparing CVs of different groups of different [data collection] times may be meaningless.

เราจะตัดสินว่าการกระจายของค่าของตัวแปรใดมากหรือน้อย จากค่า SD ไม่ได้ ยกเว้นนักวิจัยจะมีประสบการณ์กับข้อมูลนั้นมามากพอ เช่น ศึกษาเรื่องความสูงของคนมาหลายครั้ง หรือศึกษา รายได้ของกลุ่มคนอาชีพหนึ่งมาหลาย ครั้งหลายกลุ่มจนเข้าใจพฤติกรรมของตัวแปร จึงพอบอกได้บ้างว่าการกระจายของค่าตัวแปรเหล่านั้นมากหรือน้อยอย่างไร แต่จะบอกได้ดีโดยการใช้ค่าสัมประสิทธิ์การแปรผัน CV ซึ่งมีเกณฑ์ให้ตัดสินว่า ค่าเท่าใดถือว่า แปรผันมาก และยังขึ้นอยู่กับความนิยมของนักวิจัยในสาขาต่างกันด้วย เช่่นทางเกษตรก็มีเกณฑ์ชุดหนึ่ง

พบปัญหาการใช้งานกรุณาแจ้ง LINE ID @gotoknow
ClassStart
ระบบจัดการการเรียนการสอนผ่านอินเทอร์เน็ต
ทั้งเว็บทั้งแอปใช้งานฟรี
ClassStart Books
โครงการหนังสือจากคลาสสตาร์ท