Tìm hiểu những gì đơn giản hồi quy tuyến tính là và cách thức hoạt động

Một cách tiếp cận thống kê cơ bản để phân tích dữ liệu định lượng

Courtesy Colin Broug, Nhiếp ảnh gia. © June 10, 2010 Stock.xchng

Mô hình hồi quy tuyến tính được sử dụng để hiển thị hoặc dự đoán mối quan hệ giữa hai biến hoặc các yếu tố . Các yếu tố đang được dự đoán (yếu tố mà phương trình giải quyết cho ) được gọi là biến phụ thuộc. Các yếu tố được sử dụng để dự đoán giá trị của biến phụ thuộc được gọi là các biến độc lập.

Dữ liệu tốt không phải lúc nào cũng kể câu chuyện hoàn chỉnh. Phân tích hồi quy thường được sử dụng trong nghiên cứu vì nó xác định rằng một sự tương quan tồn tại giữa các biến.

Nhưng sự tương quan không giống như nhân quả . Ngay cả một dòng trong một hồi quy tuyến tính đơn giản phù hợp với các điểm dữ liệu cũng có thể không nói điều gì đó dứt khoát về một mối quan hệ nhân quả.

Trong hồi quy tuyến tính đơn giản, mỗi quan sát bao gồm hai giá trị. Một giá trị là cho biến phụ thuộc và một giá trị là cho biến độc lập.

Mô hình hồi quy tuyến tính đơn giản

Mô hình hồi quy tuyến tính đơn giản được biểu diễn như sau: y = ( β 0 + β 1 + Ε

Theo quy ước toán học, hai yếu tố liên quan đến phân tích hồi quy tuyến tính đơn giản được chỉ định xy .

Phương trình mô tả cách y liên quan đến x được gọi là mô hình hồi quy . Mô hình hồi quy tuyến tính cũng chứa một thuật ngữ lỗi được biểu thị bằng Ε hoặc chữ cái Hy Lạp epsilon. Thuật ngữ lỗi được sử dụng để giải thích sự thay đổi trong y không thể giải thích được bởi mối quan hệ tuyến tính giữa xy .

Ngoài ra còn có các tham số đại diện cho dân số đang được nghiên cứu. Các tham số này của mô hình được biểu diễn bằng ( β 0+ β 1 x ).

Mô hình hồi quy tuyến tính đơn giản

Phương trình hồi quy tuyến tính đơn giản được biểu diễn như sau: Ε ( y ) = ( β 0 + β 1 x ).

Phương trình hồi quy tuyến tính đơn giản được vẽ như một đường thẳng.

( β 0 là điểm chặn y của đường hồi qui.

β 1 là độ dốc.

Ε ( y ) là giá trị trung bình hoặc kỳ vọng của y cho một giá trị nhất định của x .

Đường hồi quy có thể hiển thị mối quan hệ tuyến tính dương, mối quan hệ tuyến tính âm hoặc không có mối quan hệ. Nếu đường đồ thị trong hồi quy tuyến tính đơn giản là phẳng (không dốc), thì không có mối quan hệ giữa hai biến. Nếu đường hồi quy dốc lên với đầu dưới của đường thẳng tại điểm đánh dấu (trục) y của đồ thị, và đầu trên của dòng mở rộng lên trên trường biểu đồ, cách xa đường kẻ x (trục) một mối quan hệ tuyến tính dương tồn tại . Nếu đường hồi quy dốc xuống với đầu trên của đường kẻ tại trục đánh dấu (trục) của đồ thị, và đầu dưới của dòng kéo dài xuống vào trường biểu đồ, hướng tới x chặn (trục) có mối quan hệ tuyến tính âm tồn tại.

Phương trình hồi quy tuyến tính ước tính

Nếu các tham số của quần thể đã được biết, phương trình hồi quy tuyến tính đơn giản (được hiển thị bên dưới) có thể được sử dụng để tính toán giá trị trung bình của y cho một giá trị đã biết của x .

Ε ( y ) = ( β 0 + β 1 x ).

Tuy nhiên, trên thực tế, các giá trị tham số không được biết nên chúng phải được ước tính bằng cách sử dụng dữ liệu từ một mẫu dân số. Các thông số dân số được ước tính bằng cách sử dụng thống kê mẫu . Số liệu thống kê mẫu được biểu diễn bằng b 0 + b 1. Khi các số liệu thống kê mẫu được thay thế cho các tham số dân số, phương trình hồi quy ước tính được hình thành.

Phương trình hồi quy ước tính được trình bày dưới đây.

( ŷ ) = ( β 0 + β 1 x

( ŷ ) được phát âm là mũ y .

Biểu đồ của phương trình hồi quy đơn giản ước tính được gọi là đường hồi quy ước tính.

B 0 là chặn y.

B 1 là độ dốc.

Giá trị ŷ ) là giá trị ước tính của y cho một giá trị cho trước của x .

Lưu ý quan trọng: Phân tích hồi quy không được sử dụng để diễn giải mối quan hệ nhân quả giữa các biến. Tuy nhiên, phân tích hồi quy có thể cho biết các biến có liên quan như thế nào hoặc các biến mức độ nào được liên kết với nhau.

Khi làm như vậy, phân tích hồi quy có xu hướng tạo ra các mối quan hệ nổi bật đảm bảo một nhà nghiên cứu có kiến ​​thức nhìn kỹ hơn .

Còn được gọi là: hồi quy bivariate, phân tích hồi quy

Ví dụ: Phương pháp hình vuông tối thiểu là một quy trình thống kê để sử dụng dữ liệu mẫu để tìm giá trị của phương trình hồi quy ước tính. Phương pháp hình vuông tối thiểu được đề xuất bởi Carl Friedrich Gauss, người sinh năm 1777 và mất năm 1855. Phương pháp hình vuông tối thiểu vẫn được sử dụng rộng rãi.

Nguồn:

Anderson, DR, Sweeney, DJ và Williams, TA (2003). Yếu tố thống kê về kinh doanh và kinh tế (ed lần thứ 3) Mason, Ohio: Tây Nam, Thompson Learning.

______. (2010). Giải thích: Phân tích hồi quy. Tin tức MIT.

McIntyre, L. (1994). Sử dụng dữ liệu thuốc lá để giới thiệu về sự hồi quy nhiều lần. Tạp chí Giáo dục Thống kê, 2 (1).

Mendenhall, W. và Sincich, T. (1992). Thống kê về Kỹ thuật và Khoa học (ed lần thứ 3), New York, NY: Công ty xuất bản Dellen

Panchenko, D. 18.443 Thống kê cho các ứng dụng, mùa thu năm 2006, mục 14, hồi quy tuyến tính đơn giản. (Viện Công nghệ Massachusetts: MIT OpenCourseWare)