แกนและตัวดำเนินการในจุดประกายคืออะไร?
ผู้ดำเนินการ คือกระบวนการของโหนดผู้ปฏิบัติงานที่รับผิดชอบการเรียกใช้งานแต่ละรายการในงาน Spark ที่ กำหนด โดยจะเปิดตัวเมื่อเริ่มต้นแอปพลิเคชัน Spark และโดยทั่วไปจะทำงานตลอดอายุของแอปพลิเคชัน เมื่อพวกเขาทำงานเสร็จ พวกเขาก็จะส่งผลไปยังไดรเวอร์
นอกจากนี้ แกนประกายไฟคืออะไร? Spark Core เป็นหน่วยพื้นฐานของโครงการ Spark ทั้งหมด มันมีฟังก์ชันการทำงานทุกประเภท เช่น การส่งงาน การจัดกำหนดการ และการดำเนินการอินพุต-เอาต์พุต เป็นต้น Spark ใช้ประโยชน์จากโครงสร้างข้อมูลพิเศษที่เรียกว่า RDD (ชุดข้อมูลที่กระจายแบบยืดหยุ่น) เป็นบ้านสำหรับ API ที่กำหนดและจัดการ RDD
ในที่นี้คุณจะเลือกจำนวนผู้บริหารในจุดประกายได้อย่างไร?
จำนวน executors ที่ มีอยู่ = (total cores/num-cores-per- executor ) = 150/5 = 30 ปล่อยให้ 1 executor สำหรับ ApplicationManager => --num- executors = 29. จำนวน executors ต่อ node = 30/10 = 3 . หน่วยความจำต่อตัว ดำเนินการ = 64GB/3 = 21GB
หน่วยความจำตัวดำเนินการเส้นด้ายประกายไฟใช้ทำอะไร?
คุณค่าของ ประกายไฟ เส้นด้าย ผู้ดำเนินการ คุณสมบัติ memoryOverhead ถูกเพิ่มในหน่วยความจำตัว ดำเนินการ เพื่อกำหนดคำขอหน่วยความจำแบบเต็มไปยัง YARN สำหรับตัว ดำเนินการ แต่ละตัว
หน่วยความจำตัวดำเนินการ spark เริ่มต้นคืออะไร
หน่วยความจำของผู้บริหารใน spark คืออะไร?
จะเกิดอะไรขึ้นเมื่อผู้ดำเนินการล้มเหลวในประกายไฟ
ฉันจะปรับแต่งงาน Spark ได้อย่างไร
- เลือกนามธรรมข้อมูล
- ใช้รูปแบบข้อมูลที่เหมาะสมที่สุด
- เลือกที่เก็บข้อมูลเริ่มต้น
- ใช้แคช
- ใช้หน่วยความจำอย่างมีประสิทธิภาพ
- เพิ่มประสิทธิภาพการจัดลำดับข้อมูล
- ใช้การฝากข้อมูล
- เพิ่มประสิทธิภาพการรวมและสับเปลี่ยน
ฉันจะตั้งค่าหน่วยความจำไดรเวอร์และตัวดำเนินการใน spark ได้อย่างไร
- การตั้งค่าในไฟล์คุณสมบัติ (ค่าเริ่มต้นคือ $SPARK_HOME/conf/spark-defaults.conf ) spark.driver.memory 5g
- หรือโดยการจัดหาการตั้งค่าการกำหนดค่าที่รันไทม์ $ ./bin/spark-shell --driver-memory 5g