ในการวิเคราะห์ทางสถิติ ความแปรปรวน ในหมู่สมาชิกของชุดข้อมูลแสดงให้เห็นว่าจุดข้อมูลแยกจากเทรนด์ไลน์หรือที่เรียกว่า a เส้นการถดถอย. ยิ่งความแปรปรวนสูงเท่าไหร่จุดข้อมูลก็ยิ่งกระจายตัวมากขึ้นเท่านั้น การศึกษาการวิเคราะห์ความแปรปรวนแสดงให้เห็นว่าส่วนใดของความแปรปรวนสามารถอธิบายได้ด้วยลักษณะของข้อมูลและสามารถนำมาประกอบกับปัจจัยสุ่ม ส่วนของความแปรปรวนที่ไม่สามารถอธิบายได้เรียกว่าความแปรปรวนที่เหลือ.
ใช้สเปรดชีต Excel เพื่อคำนวณผลต่างที่เหลือ
สูตรการคำนวณความแปรปรวนที่เหลือเกี่ยวข้องกับการคำนวณที่ซับซ้อนมากมาย สำหรับชุดข้อมูลขนาดเล็กกระบวนการคำนวณความแปรปรวนที่เหลือด้วยมืออาจเป็นเรื่องน่าเบื่อ สำหรับชุดข้อมูลขนาดใหญ่งานสามารถทำงานได้หมด ด้วยการใช้สเปรดชีต Excel คุณจะต้องป้อนจุดข้อมูลและเลือกสูตรที่ถูกต้องเท่านั้น โปรแกรมจัดการการคำนวณที่ซับซ้อนและให้ผลลัพธ์ที่รวดเร็ว
จุดข้อมูล
เปิดสเปรดชีต Excel ใหม่และป้อนจุดข้อมูลลงในสองคอลัมน์ เส้นการถดถอยกำหนดให้จุดข้อมูลแต่ละจุดมีองค์ประกอบสององค์ประกอบ โดยทั่วไปแล้วนักสถิติจะติดป้ายองค์ประกอบเหล่านี้ "X" และ "Y. " ตัวอย่างเช่น Generic Insurance Co. ต้องการค้นหาความแปรปรวนที่เหลือของความสูงและน้ำหนักของพนักงาน ตัวแปร X หมายถึงความสูงและตัวแปร Y หมายถึงน้ำหนัก ป้อนความสูงลงในคอลัมน์ A และน้ำหนักลงในคอลัมน์ B
การหาค่าเฉลี่ย
หมายความ แสดงค่าเฉลี่ยสำหรับแต่ละองค์ประกอบในชุดข้อมูล ในตัวอย่างนี้ประกันภัยทั่วไปต้องการค้นหาค่าเฉลี่ยส่วนเบี่ยงเบนมาตรฐานและความแปรปรวนร่วมของความสูงและน้ำหนักของพนักงาน 10 คน ค่าเฉลี่ยของความสูงที่ระบุไว้ในคอลัมน์ A สามารถทำได้โดยการป้อนฟังก์ชั่น "= AVERAGE (A1: A10)" ลงในเซลล์ F1 ค่าเฉลี่ยของน้ำหนักที่ระบุไว้ในคอลัมน์ B สามารถพบได้โดยการป้อนฟังก์ชั่น "= AVERAGE (B1: B10)" ในเซลล์ F3
การหาค่าเบี่ยงเบนมาตรฐานและความแปรปรวนร่วม
ส่วนเบี่ยงเบนมาตรฐาน วัดระยะห่างของจุดกระจายข้อมูลจากค่าเฉลี่ย แปรปรวน วัดปริมาณองค์ประกอบทั้งสองของจุดข้อมูลที่เปลี่ยนแปลงไปพร้อมกัน ค่าความเบี่ยงเบนมาตรฐานของความสูงพบได้โดยการป้อนฟังก์ชัน "= STDEV (A1: A10)" ลงในเซลล์ F2 ค่าเบี่ยงเบนมาตรฐานของน้ำหนักถูกค้นพบโดยการป้อนฟังก์ชัน "= STDEV (B1: B10)" ลงในเซลล์ F4 ความแปรปรวนร่วมระหว่างความสูงและน้ำหนักถูกค้นพบโดยการป้อนฟังก์ชัน "= COVAR (A1: A10; B1: B10)" ลงในเซลล์ F5
ค้นหาสายการถดถอย
เส้นการถดถอย แสดงถึงฟังก์ชั่นเชิงเส้นที่เป็นไปตามแนวโน้มของจุดข้อมูล สูตรสำหรับเส้นการถดถอยมีลักษณะดังนี้: Y = aX + b
ผู้ใช้สามารถค้นหาค่าสำหรับ "a" และ "b" โดยใช้การคำนวณหาค่าเฉลี่ยส่วนเบี่ยงเบนมาตรฐานและความแปรปรวนร่วม ค่าสำหรับ "b" หมายถึงจุดที่เส้นการถดถอยดักแกน Y สามารถหาค่าได้โดยการหาค่าความแปรปรวนร่วมและหารด้วยสแควร์ของค่าเบี่ยงเบนมาตรฐานของค่า X สูตร Excel เข้าสู่เซลล์ F6 และมีลักษณะดังนี้: = F5 / F2 ^ 2
ค่าของ "a" หมายถึงความชันของเส้นการถดถอย สูตร Excel เข้าสู่เซลล์ F7 และมีลักษณะดังนี้: = F3-F6 * F1
หากต้องการดูสูตรสำหรับบรรทัดการถดถอยให้ป้อนการต่อสตริงนี้เข้าสู่เซลล์ F8:
= CONCATENATE ("Y ="; ROUND (F6; 2); "X"; IF (SIGN (F7) = 1; "+"; "-"); ABS (รอบ (F7; 2)))
คำนวณค่า Y
ขั้นตอนถัดไปเกี่ยวข้องกับการคำนวณค่า Y บนบรรทัดการถดถอยสำหรับค่า X ที่กำหนดในชุดข้อมูล สูตรในการค้นหาค่า Y เข้าไปในคอลัมน์ C และมีลักษณะดังนี้:
= $ F $ 6 * A (i) + $ F $ 7
โดยที่ A (i) คือค่าสำหรับคอลัมน์ A ในแถว (i) สูตรมีลักษณะเช่นนี้ในสเปรดชีต:
= $ F $ 6 * A1 + $ F $ 7
= $ F $ 6 * A2 + $ F $ 7
= $ F $ 6 * A3 + $ F $ 7 และต่อไป
รายการในคอลัมน์ D แสดงความแตกต่างระหว่างค่าที่คาดหวังและค่าจริงสำหรับ Y สูตรมีลักษณะดังนี้:
= B (i) -C (i)
โดยที่ B (i) และ C (i) คือค่าใน Row (i) ในคอลัมน์ B และ C ตามลำดับ
การค้นหาความแปรปรวนที่เหลือ
สูตรสำหรับการแปรปรวนที่เหลือ เข้าสู่ Cell F9 และมีลักษณะดังนี้:
= SUMSQ (D1: D10) / (COUNT (D1: D10) -2)
โดยที่ SUMSQ (D1: D10) คือผลรวมของกำลังสองของความแตกต่างระหว่างค่า Y จริงและที่คาดหวังและ (COUNT (D1: D10) -2) คือจำนวนของจุดข้อมูลลบ 2 สำหรับองศาอิสระใน ข้อมูล.