คือกราฟที่จัดกลุ่มของจุดข้อมูลเป็นช่วง ซึ่งแกน 'x' แสดงถึงช่วงเหล่านี้ และแกน 'y' แสดงถึงความถี่ ฮิสโตแกรมสามารถช่วยระบุลักษณะการกระจายข้อมูล เช่น ข้อมูลมีการกระจายตามปกติ เอียงไปทางซ้ายหรือขวา หรือมีจุดนอกกรอบหรือค่าผิดปกติหรือไม่
สมมุติว่ามีชุดข้อมูลอายุของคน 50 คน [21, 22, 23, 24, 24, 25, 26, 26, 27, 27, 27, 28, 28, 28, 28, 29, 29, 29, 30, 30, 30, 30, 30, 31, 32, 32, 33, 34, 34, 35, 36, 36, 36, 37, 38, 39, 40, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52] ดังต่อไปนี้
นำมาสร้างฮิสโตแกรมได้ดังนี้
ฮิสโตแกรมมีลักษณะเบ้ขวาเล็กน้อย โดยอายุที่พบบ่อยที่สุด (ค่าโหมด) อยู่ในวัยระหว่าง 26-31 ปี จะเห็นได้ว่า ฮิสโตแกรมสามารถช่วยให้เราเห็นภาพการกระจายของข้อมูล รวมถึงศูนย์กลางการกระจายของข้อมูลและลักษณะความเบ้
ฮิสโตแกรมเหมาะสำหรับข้อมูลที่เป็นตัวเลขต่อเนื่อง แม้ว่าจะสามารถใช้กับข้อมูลตัวเลขที่ไม่ต่อเนื่องได้ในบางสถานการณ์
ฮิสโตแกรมแสดงถึงความถี่ของช่วงต่างๆ ของข้อมูลตัวเลขต่อเนื่องในแต่ละ bin หรือช่วง ตัวอย่างเช่น หากเรามีอายุของคนกลุ่มหนึ่ง เราสามารถใช้ฮิสโตแกรมเพื่อแสดงภาพการกระจายอายุได้ แต่ละ bin อาจแสดงถึงช่วงอายุ (เช่น 20-30, 30-40 เป็นต้น) และความสูงของแต่ละแท่งกราฟจะแสดงถึงจำนวนคนในช่วงอายุนั้น ซึ่งจะช่วยให้เห็นการกระจายโดยรวมของข้อมูล ระบุแนวโน้มเข้าสู่ศูนย์กลางและการกระจาย และตรวจจับความเบ้หรือค่าผิดปกติได้
ในทางเทคนิค เราสามารถใช้ฮิสโตแกรมเพื่อแสดงข้อมูลตัวเลขแยก เช่น จำนวนเด็กในครอบครัว โดยที่ค่าจะใช้ได้เฉพาะกับจำนวนเต็ม เช่น 0, 1, 2, 3 เป็นต้น แต่โดยทั่วไปแล้วฮิสโตแกรมจะไม่ใช้สำหรับข้อมูลตัวเลขที่ไม่ต่อเนื่องชุดเล็กๆ สำหรับชุดข้อมูลแยกขนาดใหญ่ที่จุดข้อมูลกระจายมากขึ้นและสามารถประมาณข้อมูลที่ต่อเนื่องได้ ฮิสโตแกรมอาจยังเหมาะสม
อย่างไรก็ตาม ฮิสโตแกรมไม่เหมาะสำหรับข้อมูลที่เป็นหมวดหมู่ (nominal or ordinal) ซึ่งข้อมูลที่เป็นหมวดหมู่นี้ เหมาะที่จะใช้แผนภูมิแท่งหรือแผนภูมิวงกลมมากกว่า
ไม่มีความเห็น