รูปแบบการถดถอยเชิงเส้นใช้เพื่อแสดงหรือทำนายความสัมพันธ์ระหว่างสองตัวแปรหรือปัจจัย ปัจจัยที่ถูกคาดการณ์ (ปัจจัยที่สมการ แก้สำหรับ ) เรียกว่าตัวแปรขึ้นอยู่กับ. ปัจจัยที่ใช้พยากรณ์ค่าของตัวแปรอิสระจะเรียกว่าตัวแปรอิสระ
ข้อมูลที่ดีไม่ได้บอกเล่าเรื่องราวที่สมบูรณ์ การวิเคราะห์การถดถอยเป็นเรื่องปกติที่ใช้ในการวิจัยเนื่องจากพบว่ามีความสัมพันธ์ระหว่างตัวแปร
แต่ความสัมพันธ์ไม่เหมือนกับสาเหตุ แม้บรรทัดในการถดถอยเชิงเส้นอย่างง่ายที่เหมาะกับจุดข้อมูลที่ดีอาจไม่ได้พูดอะไรบางอย่างที่ชัดเจนเกี่ยวกับความสัมพันธ์ของเหตุและผล
ในการถดถอยเชิงเส้นแบบง่ายๆการสังเกตแต่ละครั้งประกอบด้วยสองค่า ค่าหนึ่งสำหรับตัวแปรอิสระและหนึ่งค่าสำหรับตัวแปรอิสระ
การวิเคราะห์การถดถอยเชิงเส้นแบบง่าย (Simple Linear Regression Analysis) รูปแบบการวิเคราะห์การถดถอยแบบง่ายที่สุดใช้ตัวแปรอิสระและตัวแปรอิสระหนึ่งตัวแปร ในรูปแบบง่ายๆนี้เส้นตรงจะประมาณความสัมพันธ์ระหว่างตัวแปรอิสระและตัวแปรอิสระ- การวิเคราะห์การถดถอยเชิงพหุ (Multiple Regression Analysis) เมื่อมีการใช้ตัวแปรอิสระสองตัวหรือมากกว่าในการวิเคราะห์การถดถอยแบบจำลองแบบนี้จะไม่เป็นแบบเส้นตรงอีกต่อไป
- แบบจำลองการถดถอยเชิงเส้นแบบง่าย
y
= ( β 0 β ในการวิเคราะห์ทางคณิตศาสตร์พบว่าทั้งสองปัจจัยมีส่วนร่วมในการวิเคราะห์การถดถอยเชิงเส้นแบบง่ายๆคือ x และ y
สมการที่ อธิบายว่า y เกี่ยวข้องกับ x หรือที่เรียกว่า
ถดถอยแบบ แบบจำลองการถดถอยเชิงเส้นยังมีข้อผิดพลาดที่แสดงโดย << หรือ epsilon จดหมายกรีกคำผิดพลาดใช้เพื่ออธิบายความแปรปรวนใน y ซึ่งไม่สามารถอธิบายได้ด้วยความสัมพันธ์เชิงเส้นระหว่าง x กับ y > นอกจากนี้ยังมีพารามิเตอร์ที่แสดงถึงประชากรที่กำลังศึกษาพารามิเตอร์เหล่านี้ของโมเดลที่แสดงด้วย ( 0 1 x )
การถดถ้วนเชิงเส้นแบบง่าย สมการถดถอยเชิงเส้นแบบง่ายจะถูกแสดงดังนี้: Ε ( y ) = (
0 +
β 1 x ) สมการถดถอยเชิงเส้นแบบง่ายจะถูกกราฟเป็นเส้นตรง การสกัดกั้นของเส้นถดถอย y
β 1 คือความชัน Ε ( y
) เป็นค่าเฉลี่ยหรือที่คาดว่าจะ y
สำหรับค่าที่กำหนด x บรรทัดการถดถอยสามารถแสดงความสัมพันธ์เชิงเส้นบวกความสัมพันธ์เชิงลบเชิงเส้น, หรือไม่มีความสัมพันธ์ถ้าเส้นกราฟในการถดถอยเชิงเส้นแบบเรียบง่าย (ไม่ลาดเอียง) ไม่มีความสัมพันธ์ระหว่างสองตัวแปร หากเส้นการถดถอยขึ้นลงด้วยปลายล่างของเส้นที่ y การสกัดกั้น (แกน) ของกราฟและส่วนบนของเส้นที่ยื่นขึ้นไปด้านบนลงในฟิลด์กราฟห่างจาก x intercept (แกน) มีความสัมพันธ์เชิงเส้นบวกอยู่ ถ้าเส้นการถดถอยพุ่งลงไปกับปลายด้านบนของเส้นที่
y การสกัดกั้น (แกน) ของกราฟและด้านล่างสุดของเส้นที่ยื่นลงไปในฟิลด์กราฟไปทาง x < intercept (แกน) มีความสัมพันธ์ทางสายตาเชิงลบอยู่ สมการถดถอยเชิงเสนโดยประมาณ ถาคาพารามิเตอรของประชากรเปนที่รูจักสามารถใชสมการถดถอยเชิงเสนใตเรียบ (ดูดานลาง) เพื่อหาคาเฉลี่ย y x Ε
(
y ) = ( β 0 + β
1 x ) อย่างไรก็ตามในทางปฏิบัติค่าพารามิเตอร์ไม่เป็นที่รู้จักดังนั้นจึงต้องมีการประมาณค่าโดยใช้ข้อมูลจากตัวอย่างประชากร พารามิเตอร์ประชากรถูกประมาณโดยใช้สถิติตัวอย่าง สถิติตัวอย่างแสดงด้วย b 0 + b 1 เมื่อสถิติตัวอย่างถูกแทนที่สำหรับพารามิเตอร์ประชากรจะมีการสร้างสมการถดถอยที่ประมาณไว้ สมการถดถอยประมาณที่แสดงด้านล่าง
<=
กราฟของสมการถดถอยแบบเรียบง่ายโดยประมาณ b 1 คือความลาดชัน ŷ
) คือค่าประมาณ y สำหรับค่าที่กำหนด x
หมายเหตุสำคัญ:
การวิเคราะห์การถดถอยไม่ใช้ในการตีความความสัมพันธ์ระหว่างสาเหตุและผลระหว่างตัวแปร การวิเคราะห์การถดถอยสามารถอธิบายได้ว่าตัวแปรมีความเกี่ยวเนื่องกันอย่างไรหรือตัวแปรที่เกี่ยวข้องกับตัวแปรอื่น ๆ ในการทำเช่นนี้การวิเคราะห์การถดถอยมีแนวโน้มที่จะสร้างความสัมพันธ์ที่เด่นชัดซึ่งจะทำให้นักวิจัยที่มีความรู้สามารถมองใกล้ได้มากขึ้น การถดถอยสองด้านการวิเคราะห์ถดถอย 999 ตัวอย่าง:
วิธีน้อยที่สุด เป็นวิธีการทางสถิติสำหรับการใช้ข้อมูลตัวอย่างเพื่อหาค่าของสมการถดถอยที่ประมาณ . วิธีการน้อยที่สุดที่เสนอโดยคาร์ลฟรีดริชเกาส์ผู้เกิดในปี พ.ศ. 2320 และเสียชีวิตในปี พ.ศ. 2398 วิธีการที่น้อยที่สุดก็ยังใช้กันอย่างแพร่หลาย
ที่มา: Anderson, D. R, Sweeney, D.J และ Williams, T. A. (2003) Essentials of Statistics for Business and Economics (ฉบับที่ 3) Mason, Ohio: Southwestern, Thompson Learning ______ (2010) อธิบาย: การวิเคราะห์การถดถอย ข่าว MIT McIntyre, L. (1994) การใช้ข้อมูลบุหรี่สำหรับการแนะนำการถดถอยพหุคูณ วารสารสถิติการศึกษา 2 (1) Mendenhall, W. และ Sincich, T. (1992) สถิติวิศวกรรมและวิทยาศาสตร์ (3rd ed.), New York, NY: Dellen Publishing Co.
Panchenko, D. 18 443 สถิติสำหรับการใช้งาน, ฤดูใบไม้ร่วง 2006, มาตรา 14, การถดถ้วนเชิงเส้นแบบง่าย (Massachusetts Institute of Technology: MIT OpenCourseWare)