ฮิสโตแกรมให้ข้อมูลใดบ้างที่ Boxplot ไม่มี
ถามโดย: Konstantine Herbschleb | ปรับปรุงล่าสุด: 20 มีนาคม 2563
หมวดหมู่: เทคโนโลยีและ คอมพิวเตอร์แอนิเมชั่นคอมพิวเตอร์แอนิเมชั่น
ในกรณีที่ไม่มีตัวแปร แผนภาพกล่อง ให้ ข้อมูล บางอย่างที่ ฮิสโตแกรมไม่มี (อย่างน้อยก็ ไม่ ชัดเจน) กล่าวคือ โดยทั่วไปจะ ให้ ค่ามัธยฐาน เปอร์เซ็นไทล์ที่ 25 และ 75 ต่ำสุด/สูงสุด ที่ ไม่ใช่ ค่าผิดปกติ และแยกจุดที่ถือว่าเป็นค่าผิดปกติออกอย่างชัดเจน
ในทำนองเดียวกันอาจมีคนถามว่า Boxplots แสดงว่าฮิสโตแกรมไม่แสดงอะไรฮิสโตแกรมช่วย ให้เข้าใจการกระจายตัวของตัวแปรได้ดี แผนภาพกล่อง พยายาม ทำ สิ่งเดียวกัน แต่อย่าให้ภาพที่ดีของการแจกแจงตัวแปรนี้
รู้ยัง กล่องพล็อตให้ข้อมูลอะไรบ้าง? Boxplot เป็นวิธีที่ได้มาตรฐานในการแสดงการกระจายข้อมูลโดยพิจารณาจากสรุปตัวเลขห้าตัว (“ขั้นต่ำ”, ควอร์ไทล์ที่หนึ่ง (Q1), ค่ามัธยฐาน, ควอร์ไทล์ที่สาม (Q3) และ “สูงสุด”) มันสามารถบอกคุณเกี่ยวกับค่าผิดปกติของคุณและสิ่งที่มีค่าของพวกเขา
นอกจากนี้ คุณจะเลือกพล็อตกล่องเหนือฮิสโตแกรมเมื่อใด
หากข้อมูลนี้สร้างกราฟอย่างง่ายๆ โดยใช้การลงจุดแบบ กล่อง ค่าต่างๆ จะ เฉลี่ยกันออกไป ทำให้การแจกแจงดูปกติอย่างคร่าวๆ อีกตัวอย่างหนึ่งที่ควรใช้ ฮิสโตแกรม มากกว่า แผนภาพกล่อง คือเมื่อความถี่ที่สังเกตพบมีความแปรปรวนน้อยมาก
คุณตีความข้อมูลจากฮิสโตแกรมอย่างไร
วิธีตีความรูปร่างของข้อมูลสถิติในฮิสโตแกรม
- สมมาตร. ฮิสโตแกรมจะสมมาตรหากคุณตัดมันลงมาตรงกลาง และด้านซ้ายมือและด้านขวาจะคล้ายกับภาพสะท้อนในกระจกของกันและกัน:
- เอียงขวา. ฮิสโตแกรมทางขวาที่เบ้ดูเหมือนเนินลาดเอียง โดยมีหางไปทางขวา:
- เอียงซ้าย.
พบคำตอบของคำถามที่เกี่ยวข้อง 36 ข้อ
ฮิสโตแกรมมีประโยชน์อย่างไร?
ข้อดี บาง ประการ ของ ฮิสโตแกรม ได้แก่ ฮิสโตแกรม ช่วยให้งานของเราระบุข้อมูลต่างๆ ได้ง่ายขึ้น ความถี่ของข้อมูลที่เกิดขึ้นในชุดข้อมูล และหมวดหมู่ที่ยากต่อการตีความในรูปแบบตาราง ช่วยให้เห็นภาพการกระจายของข้อมูล
Boxplots แสดงความแปรปรวนหรือไม่?
1 คำตอบ boxplot แสดงให้เห็นช่วงและช่วงระหว่างควอไทล์ (IQR) ซึ่งทั้งสองอย่างนี้เป็นการวัดการเปลี่ยนแปลงในชุดข้อมูล โดยทั่วไป พิสัยจะพิจารณาว่าได้รับอิทธิพลง่ายเกินไปจากค่าที่มากเกินไป ดังนั้นจึงควรใช้ IQR อย่างไรก็ตาม คุณ สามารถ ประมาณ ค่าความแปรปรวน จาก บ็อกซ์พล็อต ได้
คุณจะใช้ฮิสโตแกรมเมื่อใด
ข้อแตกต่างที่สำคัญคือ ฮิสโตแกรม ใช้เพื่อพล็อตความถี่ของการเกิดคะแนนในชุดข้อมูลต่อเนื่องที่แบ่งออกเป็นคลาสต่างๆ เท่านั้น เรียกว่าถังขยะ ในทางกลับกัน แผนภูมิแท่งสามารถใช้กับตัวแปรประเภทอื่นๆ ได้มากมาย รวมถึงชุดข้อมูลลำดับและค่าเล็กน้อย
ฮิสโตแกรมบอกอะไรเราบ้าง?
การกระจายความถี่จะแสดงความถี่ที่แต่ละค่าต่างๆ ในชุดข้อมูลเกิดขึ้น ฮิสโตแกรม เป็นกราฟที่ใช้บ่อยที่สุดในการ แสดง การแจกแจงความถี่ ดูเหมือนแผนภูมิแท่งมาก แต่มีความแตกต่างที่สำคัญระหว่างแผนภูมิเหล่านี้
กราฟแท่งและฮิสโตแกรมต่างกันอย่างไร?
ฮิสโตแกรม แสดงถึงการกระจายความถี่ของตัวแปรต่อเนื่อง ในทางกลับกัน กราฟแท่ง คือการเปรียบเทียบแบบไดอะแกรมของตัวแปรแบบไม่ต่อเนื่อง ฮิสโตแกรม แสดงข้อมูลตัวเลขในขณะที่ กราฟแท่ง แสดงข้อมูลหมวดหมู่ ฮิสโตแกรม ถูกวาด ใน ลักษณะที่ไม่มีช่องว่าง ระหว่าง แท่ง
คุณจะสร้างฮิสโตแกรมได้อย่างไร?
ในการสร้างฮิสโตแกรม ให้ทำตามขั้นตอนเหล่านี้:
- บนแกนตั้ง ให้วางความถี่ ติดป้ายกำกับแกนนี้ว่า "ความถี่"
- บนแกนนอน ให้วางค่าที่ต่ำกว่าของแต่ละช่วงเวลา
- วาดแถบที่ขยายจากค่าที่ต่ำกว่าของแต่ละช่วงเวลาไปยังค่าที่ต่ำกว่าของช่วงเวลาถัดไป
คุณจะรู้ได้อย่างไรว่า Boxplot นั้นเบ้?
ข้อมูลเบ้แสดง Boxplot ลำเอียงที่แบ่งตัดกล่องเป็นสองส่วนไม่เท่ากัน หาก ส่วนที่ยาวกว่าของกล่องอยู่ทางด้านขวา (หรือสูงกว่า) ค่ามัธยฐาน แสดงว่าข้อมูล เอียงไป ทางขวา ถ้า ส่วนที่ยาวกว่าอยู่ทางซ้าย (หรือด้านล่าง) ค่ามัธยฐาน ข้อมูลจะ เอียง ไปทางซ้าย
ข้อดีของกล่องพล็อตคืออะไร?
ข้อดี ของ Boxplots
แสดงตำแหน่งของตัวแปรแบบกราฟิกและกระจายอย่างรวดเร็ว ระบุข้อมูลบางส่วนเกี่ยวกับความสมมาตรและความเบ้ของข้อมูล บ็อกซ์พล็อต แสดงค่าผิดปกติต่างจากวิธีอื่นๆ ในการแสดงข้อมูล ทำไมคุณถึงใช้จุดพล็อต?
แผนภาพจุด เป็นการแสดงกราฟิกประเภทหนึ่งที่สามารถ ใช้ แสดงการกระจายข้อมูลได้ พวกเขามีความง่ายในการสร้างและให้ข้อมูลที่เป็นประโยชน์เช่นช่วงรูปร่างและรูปแบบของชุดของข้อมูล ใช้ สำหรับข้อมูลที่ไม่แปรผันเมื่อตัวแปรเป็นหมวดหมู่หรือเชิงปริมาณ
คุณหาควอร์ไทล์ได้อย่างไร?
ควอร์ไทล์ คือค่าที่แบ่งรายการตัวเลขออกเป็นสี่ส่วน: จัดรายการตัวเลขตามลำดับ จากนั้นตัดรายการออกเป็นสี่ส่วนเท่าๆ กัน ในกรณีนี้ ควอไทล์ทั้งหมดอยู่ระหว่างตัวเลข:
- ควอร์ไทล์ 1 (Q1) = (4+4)/2 = 4
- ควอร์ไทล์ 2 (Q2) = (10+11)/2 = 10.5
- ควอร์ไทล์ 3 (Q3) = (14+16)/2 = 15
ความเหมือนและความแตกต่างระหว่างฮิสโตแกรมและตารางความถี่คืออะไร
ใน ฮิสโตแกรม คุณสามารถใช้ช่วงเวลาเดียวกันกับที่คุณทำกับ ตารางความถี่ แท่งใน ฮิสโตแกรม จะไม่มีช่องว่าง ระหว่าง แท่ง เหล่านั้น ฮิสโตแกรม แสดงข้อมูลเดียวกับที่ ตารางความถี่แสดง อย่างไรก็ตาม ฮิสโตแกรม เป็นประเภทของ กราฟ ซึ่งหมายความว่าเป็นการแสดงภาพ
คุณอ่านพล็อตกล่องในสถิติอย่างไร?
Boxplot คืออะไร?
- ค่าต่ำสุด (จำนวนที่น้อยที่สุดในชุดข้อมูล)
- ควอร์ไทล์ที่หนึ่ง Q 1 คือด้านซ้ายสุดของกล่อง (หรือด้านขวาสุดของหนวดซ้าย)
- ค่ามัธยฐานจะแสดงเป็นเส้นตรงตรงกลางกล่อง
- ควอร์ไทล์ที่สาม Q 3 แสดงที่ด้านขวาสุดของกล่อง (ที่ด้านซ้ายสุดของหนวดขวา)
แผนภูมิชนิดใดที่เหมาะกับการแสดงความถี่สะสม
ความถี่สะสม ใช้เพื่อกำหนดจำนวนการสังเกตที่อยู่เหนือ (หรือต่ำกว่า) ค่าใดค่าหนึ่ง 4. แผนภูมิแท่ง : แผนภูมิแท่งมี ประโยชน์ในการเปรียบเทียบคลาสหรือกลุ่มข้อมูล
คุณหา q1 และ q3 ได้อย่างไร
Q1 คือค่ามัธยฐาน (ตรงกลาง) ของครึ่งล่างของข้อมูล และ Q3 คือค่ามัธยฐาน (ตรงกลาง) ของครึ่งบนของข้อมูล (3, 5, 7, 8, 9), | (11, 15, 16, 20, 21) Q1 = 7 และ Q3 = 16. ขั้นตอนที่ 5: ลบ Q1 ออกจาก Q3
คุณจะใช้แผนภาพกล่องและหนวดเมื่อใด
เมื่อใดควรใช้พล็อตกล่องและมัสสุ
ใช้แผนภาพกล่องและมัสสุ เมื่อคุณมีชุดข้อมูลหลายชุดจากแหล่งอิสระที่เกี่ยวข้องกันในทางใดทางหนึ่ง ตัวอย่าง ได้แก่ คะแนนการทดสอบระหว่างโรงเรียนหรือห้องเรียน ข้อมูลจากก่อนและหลังการเปลี่ยนแปลงกระบวนการ คุณจะหาค่าผิดปกติในกล่องพล็อตได้อย่างไร?
ค่าข้อมูลจะต้องเป็น:
- มากกว่า Q3 อย่างน้อย 1.5 เท่าของช่วงควอไทล์ (IQR) หรือ
- น้อยกว่า Q1 อย่างน้อย 1.5 เท่าของ IQR
คุณจะสร้างพล็อตกระจายได้อย่างไร?
ขั้นตอนแผนภาพการกระจาย
- รวบรวมข้อมูลคู่ที่สงสัยว่ามีความสัมพันธ์
- วาดกราฟด้วยตัวแปรอิสระบนแกนนอนและตัวแปรตามบนแกนตั้ง
- ดูรูปแบบของจุดเพื่อดูว่าความสัมพันธ์ชัดเจนหรือไม่
- แบ่งจุดบนกราฟออกเป็นสี่ส่วน