วิธีการค้นหาผลต่างที่เหลือใน Excel

สารบัญ:

Anonim

ในการวิเคราะห์ทางสถิติ ความแปรปรวน ในหมู่สมาชิกของชุดข้อมูลแสดงให้เห็นว่าจุดข้อมูลแยกจากเทรนด์ไลน์หรือที่เรียกว่า a เส้นการถดถอย. ยิ่งความแปรปรวนสูงเท่าไหร่จุดข้อมูลก็ยิ่งกระจายตัวมากขึ้นเท่านั้น การศึกษาการวิเคราะห์ความแปรปรวนแสดงให้เห็นว่าส่วนใดของความแปรปรวนสามารถอธิบายได้ด้วยลักษณะของข้อมูลและสามารถนำมาประกอบกับปัจจัยสุ่ม ส่วนของความแปรปรวนที่ไม่สามารถอธิบายได้เรียกว่าความแปรปรวนที่เหลือ.

ใช้สเปรดชีต Excel เพื่อคำนวณผลต่างที่เหลือ

สูตรการคำนวณความแปรปรวนที่เหลือเกี่ยวข้องกับการคำนวณที่ซับซ้อนมากมาย สำหรับชุดข้อมูลขนาดเล็กกระบวนการคำนวณความแปรปรวนที่เหลือด้วยมืออาจเป็นเรื่องน่าเบื่อ สำหรับชุดข้อมูลขนาดใหญ่งานสามารถทำงานได้หมด ด้วยการใช้สเปรดชีต Excel คุณจะต้องป้อนจุดข้อมูลและเลือกสูตรที่ถูกต้องเท่านั้น โปรแกรมจัดการการคำนวณที่ซับซ้อนและให้ผลลัพธ์ที่รวดเร็ว

จุดข้อมูล

เปิดสเปรดชีต Excel ใหม่และป้อนจุดข้อมูลลงในสองคอลัมน์ เส้นการถดถอยกำหนดให้จุดข้อมูลแต่ละจุดมีองค์ประกอบสององค์ประกอบ โดยทั่วไปแล้วนักสถิติจะติดป้ายองค์ประกอบเหล่านี้ "X" และ "Y. " ตัวอย่างเช่น Generic Insurance Co. ต้องการค้นหาความแปรปรวนที่เหลือของความสูงและน้ำหนักของพนักงาน ตัวแปร X หมายถึงความสูงและตัวแปร Y หมายถึงน้ำหนัก ป้อนความสูงลงในคอลัมน์ A และน้ำหนักลงในคอลัมน์ B

การหาค่าเฉลี่ย

หมายความ แสดงค่าเฉลี่ยสำหรับแต่ละองค์ประกอบในชุดข้อมูล ในตัวอย่างนี้ประกันภัยทั่วไปต้องการค้นหาค่าเฉลี่ยส่วนเบี่ยงเบนมาตรฐานและความแปรปรวนร่วมของความสูงและน้ำหนักของพนักงาน 10 คน ค่าเฉลี่ยของความสูงที่ระบุไว้ในคอลัมน์ A สามารถทำได้โดยการป้อนฟังก์ชั่น "= AVERAGE (A1: A10)" ลงในเซลล์ F1 ค่าเฉลี่ยของน้ำหนักที่ระบุไว้ในคอลัมน์ B สามารถพบได้โดยการป้อนฟังก์ชั่น "= AVERAGE (B1: B10)" ในเซลล์ F3

การหาค่าเบี่ยงเบนมาตรฐานและความแปรปรวนร่วม

ส่วนเบี่ยงเบนมาตรฐาน วัดระยะห่างของจุดกระจายข้อมูลจากค่าเฉลี่ย แปรปรวน วัดปริมาณองค์ประกอบทั้งสองของจุดข้อมูลที่เปลี่ยนแปลงไปพร้อมกัน ค่าความเบี่ยงเบนมาตรฐานของความสูงพบได้โดยการป้อนฟังก์ชัน "= STDEV (A1: A10)" ลงในเซลล์ F2 ค่าเบี่ยงเบนมาตรฐานของน้ำหนักถูกค้นพบโดยการป้อนฟังก์ชัน "= STDEV (B1: B10)" ลงในเซลล์ F4 ความแปรปรวนร่วมระหว่างความสูงและน้ำหนักถูกค้นพบโดยการป้อนฟังก์ชัน "= COVAR (A1: A10; B1: B10)" ลงในเซลล์ F5

ค้นหาสายการถดถอย

เส้นการถดถอย แสดงถึงฟังก์ชั่นเชิงเส้นที่เป็นไปตามแนวโน้มของจุดข้อมูล สูตรสำหรับเส้นการถดถอยมีลักษณะดังนี้: Y = aX + b

ผู้ใช้สามารถค้นหาค่าสำหรับ "a" และ "b" โดยใช้การคำนวณหาค่าเฉลี่ยส่วนเบี่ยงเบนมาตรฐานและความแปรปรวนร่วม ค่าสำหรับ "b" หมายถึงจุดที่เส้นการถดถอยดักแกน Y สามารถหาค่าได้โดยการหาค่าความแปรปรวนร่วมและหารด้วยสแควร์ของค่าเบี่ยงเบนมาตรฐานของค่า X สูตร Excel เข้าสู่เซลล์ F6 และมีลักษณะดังนี้: = F5 / F2 ^ 2

ค่าของ "a" หมายถึงความชันของเส้นการถดถอย สูตร Excel เข้าสู่เซลล์ F7 และมีลักษณะดังนี้: = F3-F6 * F1

หากต้องการดูสูตรสำหรับบรรทัดการถดถอยให้ป้อนการต่อสตริงนี้เข้าสู่เซลล์ F8:

= CONCATENATE ("Y ="; ROUND (F6; 2); "X"; IF (SIGN (F7) = 1; "+"; "-"); ABS (รอบ (F7; 2)))

คำนวณค่า Y

ขั้นตอนถัดไปเกี่ยวข้องกับการคำนวณค่า Y บนบรรทัดการถดถอยสำหรับค่า X ที่กำหนดในชุดข้อมูล สูตรในการค้นหาค่า Y เข้าไปในคอลัมน์ C และมีลักษณะดังนี้:

= $ F $ 6 * A (i) + $ F $ 7

โดยที่ A (i) คือค่าสำหรับคอลัมน์ A ในแถว (i) สูตรมีลักษณะเช่นนี้ในสเปรดชีต:

= $ F $ 6 * A1 + $ F $ 7

= $ F $ 6 * A2 + $ F $ 7

= $ F $ 6 * A3 + $ F $ 7 และต่อไป

รายการในคอลัมน์ D แสดงความแตกต่างระหว่างค่าที่คาดหวังและค่าจริงสำหรับ Y สูตรมีลักษณะดังนี้:

= B (i) -C (i)

โดยที่ B (i) และ C (i) คือค่าใน Row (i) ในคอลัมน์ B และ C ตามลำดับ

การค้นหาความแปรปรวนที่เหลือ

สูตรสำหรับการแปรปรวนที่เหลือ เข้าสู่ Cell F9 และมีลักษณะดังนี้:

= SUMSQ (D1: D10) / (COUNT (D1: D10) -2)

โดยที่ SUMSQ (D1: D10) คือผลรวมของกำลังสองของความแตกต่างระหว่างค่า Y จริงและที่คาดหวังและ (COUNT (D1: D10) -2) คือจำนวนของจุดข้อมูลลบ 2 สำหรับองศาอิสระใน ข้อมูล.