วิธีการคำนวณความแปรปรวนที่เหลือ

สารบัญ:

Anonim

นักลงทุนใช้แบบจำลองการเคลื่อนไหวของราคาสินทรัพย์เพื่อคาดการณ์ว่าราคาของการลงทุนจะเป็นอย่างไรในเวลาใดก็ตาม วิธีการที่ใช้ในการคาดการณ์เหล่านี้เป็นส่วนหนึ่งของเขตข้อมูลในสถิติที่รู้จักกันว่า การวิเคราะห์การถดถอย. การคำนวณของ ความแปรปรวนที่เหลือ ของชุดของค่าเป็นเครื่องมือวิเคราะห์การถดถอยที่วัดความแม่นยำของการทำนายแบบจำลองที่ตรงกับค่าจริง

สายการถดถอย

เส้นการถดถอย แสดงให้เห็นว่ามูลค่าของสินทรัพย์มีการเปลี่ยนแปลงอย่างไรเนื่องจากการเปลี่ยนแปลงของตัวแปรต่างๆ ยังเป็นที่รู้จักกันในนาม เส้นแนวโน้มบรรทัดการถดถอยจะแสดง "แนวโน้ม" ของราคาสินทรัพย์ เส้นการถดถอยแสดงด้วยสมการเชิงเส้น:

Y = a + bX

โดยที่ "Y" คือมูลค่าสินทรัพย์ "a" เป็นค่าคงที่ "b" คือตัวคูณและ "X" เป็นตัวแปรที่เกี่ยวข้องกับมูลค่าสินทรัพย์

ตัวอย่างเช่นหากแบบจำลองทำนายว่าบ้านแบบหนึ่งห้องนอนมีราคา $ 300,000 บ้านแบบสองห้องนอนจะขายในราคา 400,000 ดอลลาร์และบ้านแบบสามห้องนอนมีราคา 500,000 ดอลลาร์สายการถดถอยจะมีลักษณะดังนี้:

Y = 200,000 + 100,000X

โดยที่ "Y" คือราคาขายบ้านและ "X" คือจำนวนห้องนอน

Y = 200,000 + 100,000 (1) = 300,000

Y = 200,000 + 100,000 (2) = 400,000

Y = 200,000 + 100,000 (3) = 500,000

scatterplot

scatterplot แสดงจุดที่แสดงถึงความสัมพันธ์จริงระหว่างมูลค่าสินทรัพย์และตัวแปร คำว่า "scatterplot" มาจากข้อเท็จจริงที่ว่าเมื่อจุดเหล่านี้ถูกพล็อตบนกราฟพวกเขาดูเหมือนจะ "กระจัดกระจาย" ไปรอบ ๆ แทนที่จะวางลงบนเส้นถดถอยอย่างสมบูรณ์แบบ จากตัวอย่างข้างต้นเราอาจมีจุดกระจายที่มีจุดข้อมูลเหล่านี้:

จุดที่ 1: 1BR ขายได้ในราคา $ 288,000

จุดที่ 2: 1BR ขายในราคา $ 315,000

จุดที่ 3: 2BR ขายได้ในราคา $ 395,000

จุดที่ 4: 2BR ขายได้ในราคา $ 410,000

จุดที่ 5: 3BR ขายได้ในราคา $ 492,000

จุดที่ 6: 3BR ขายได้ $ 507,000

การคำนวณผลต่างที่เหลือ

การคำนวณผลต่างคงเหลือเริ่มต้นด้วย ผลรวมของกำลังสอง ความแตกต่างระหว่างมูลค่าของสินทรัพย์ในบรรทัดการถดถอยและมูลค่าสินทรัพย์ที่สอดคล้องกันแต่ละรายการใน scatterplot

กำลังสองของความแตกต่างจะแสดงที่นี่:

จุดที่ 1: $ 288,000 - $ 300,000 = (- $ 12,000); (-12000)2 = 144,000,000

จุดที่ 2: $ 315,000 - $ 300,000 = (+ $ 15,000); (15000)2 = 225,000,000

จุดที่ 3: $ 395,000 - $ 400,000 = (- $ 5,000); (-5000)2 = 25,000,000

จุดที่ 4: $ 410,000 - $ 400,000 = (+ $ 10,000); (10000)2 = 100,000,000

จุดที่ 5: $ 492,000 - $ 500,000 = (- $ 8,000); (-8000)2 = 64,000,000

จุดที่ 6: $ 507,000 - $ 500,000 = (+ $ 7,000); (7000)2 = 49,000,000

ผลรวมของสี่เหลี่ยมจัตุรัส = 607,000,000

พบความแปรปรวนที่เหลือโดยการหาผลรวมของกำลังสองและหารด้วย (n-2) โดยที่ "n" คือจำนวนของจุดข้อมูลบนสแกตเตอร์แปลง

RV = 607,000,000 / (6-2) = 607,000,000 / 4 = 151,750,000

ใช้สำหรับความแปรปรวนที่เหลือ

ในขณะที่ทุกจุดบน scatterplot จะไม่เรียงกันอย่างสมบูรณ์กับเส้นถดถอย แต่ตัวแบบที่เสถียรจะมีจุด scatterplot ในการกระจายปกติรอบเส้นถดถอย ความแปรปรวนที่เหลือยังเป็นที่รู้จักกันในนาม "ความแปรปรวนของข้อผิดพลาด" ความแปรปรวนตกค้างสูงแสดงว่าเส้นการถดถอยในรูปแบบดั้งเดิมอาจมีข้อผิดพลาด ฟังก์ชันสเปรดชีตบางฟังก์ชั่นสามารถแสดงกระบวนการที่อยู่เบื้องหลังการสร้างเส้นการถดถอยที่เหมาะสมยิ่งขึ้นกับข้อมูล scatterplot