Biến Giả ( Dummy Variable Là Gì, Định Nghĩa, Ví Dụ, Giải Thích

Chúng ta đã khá quen với việc sử dụng các biến độc lập là các biến định lượng. Tuy nhiên, trong nhiều tình huống chúng ta cần phân tích hồi quy với các biến độc lập là biến định tính. Nếu một biến là định danh, chúng ta không thực hiện hồi quy ngay trên các con số mã hóa nhóm giá trị bởi kết quả phân tích sẽ không mang lại bất kỳ một ý nghĩa gì cả. Và để có thể thực hiện được hồi quy với biến định tính, các nhà nghiên cứu đã đưa ra khái niệm biến giả hay còn gọi là biến Dummy.

Đang xem: Dummy variable là gì

*

Điều kiện để thực hiện phân tích hồi quy là các biến phải có đơn vị đo lường, phải có thang đo đơn vị. Ví dụ:
– Biến Thu nhập có đơn vị là đồng. Người A có thu nhập là 10.000 đồng, người B có thu nhập là 15.000 đồng, người C có thu nhập 20.000 đồng. Như vậy người B hơn người A 5.000 đồng, người C hơn người A 10.000 đồng, thu nhập người C hơn người A 2 lần.
>> Biến này có thể phân tích được hồi quy vì nó có đơn vị. Chúng ta xác định được sự cao hơn, thấp hơn là bao nhiêu đơn vị tính.
– Biến Tình trạng hôn nhân không có đơn vị tính. Người A có tình trạng là Độc thân, người B có tình trạng là Đã lập gia đình, người C có tình trạng là Ly hôn. Chúng ta mã hóa Độc thân mang giá trị 1, Đã lập gia đình mang giá trị 2, Ly hôn mang giá trị 3 nhưng các con số này chỉ là con số đại diện, chúng ta không thể thực hiện cộng trừ nhân chia với nó để xem nhóm này hơn nhóm kia bao nhiêu đơn vị. Chúng ta không thể nói: người Đã lập gia đình có tình trạng hôn nhân nhiều hơn người Độc thân 1 đơn vị, người Ly hôn có tình trạng hôn nhân cao hơn người Đã lập gia đình 2 đơn vị.
>> Biến này không thể phân tích hồi quy. Chúng ta không xác định được giữa Đã lập gia đình, Độc thân, Ly hôn cái nào cao hơn cái nào, cái nào gấp bao nhiêu lần cái nào bao nhiêu đơn vị.

Xem thêm: Nghĩa Của Từ Queen Bee Là Gì Trong Tiếng Việt? Queen Bee Nghĩa Là Gì

Chính vì vậy mà chúng ta cần chuyển các biến định đính không có thước đo đơn vị này về một dạng biến khác có thước đo đơn vị để có thể lượng hóa, đó là biến giả Dummy.
Biến giả là một biến được đặt giá trị tương đương với 0 hoặc 1, phụ thuộc vào việc liệu các quan sát có chứa các tính chất được quan tâm hay không.
Ví dụ, xem xét biến giới tính có thể giữ 2 giá trị: Nam và Nữ. Giới tính chuyển thành biến giả X1 như sau:
Do vậy, tập hợp dữ liệu về giới tính bao gồm Nam và Nữ giờ sẽ tương ứng với giá trị 0 và 1 của X1. Các bạn có thể mã hóa ngược lại Nữ là 1, Nam là 0, không có sự khác biệt về việc mã hóa ở đây.

Xem thêm: Membrane Là Gì ? Nghĩa Của Từ Membrane Flashing Trong Tiếng Việt

Nếu biến giới tính chỉ có 2 là giá trị khá đơn giản và không gặp khó khăn trong khâu chuyển sang biến giả thì biến từ 3 giá trị trở lên sẽ phức tạp hơn. Ví dụ biến tình trạng hôn nhân gồm: Đã lập gia đình, Độc thân, Ly hôn. Trường hợp này biến tình trạng hôn nhân có 3 giá trị, để giải thích cho tất cả các khả năng xảy ra, chúng ta cần 2 biến giả. Chúng có thể mã hóa như sau:
Nếu một người đồng thời không ở trong tình trạng Đã lập gia đình (X1 = 0) và Độc thân (X2 = 0) thì người đó sẽ rơi vào nhóm còn lại là Ly hôn. Chính vì vậy mà chúng ta không cần phải có biến X3 cho nhóm thứ 3 – Ly hôn.

*

*

*

*

Related Articles

Trả lời

Back to top button