为什么要引入虚拟变量?

虚拟变量引入的原则如下:

在模型中引入多个虚拟变量时,虚拟变量的个数应按下列原则确定:

(1)如果回归模型有截距项。

有m种互斥的属性类型,在模型中引入(m-1)个虚拟变量。

(2)如果回归模型无截距项,有m个特征,设置m个虚拟变量。

虚拟变量简介:

虚拟变量 ( Dummy Variables) 又称虚设变量、名义变量或哑变量,用以反映质的属性的一个人工变量,是量化了的自变量,通常取值为0或1。引入哑变量可使线形回归模型变得更复杂,但对问题描述更简明,一个方程能达到两个方程的作用,而且接近现实。

一般地,在虚拟变量的设置中:基础类型、肯定类型取值为1;比较类型,否定类型取值为0。



  • 寮曞叆铏氭嫙鍙橀噺鐨勫師鍥
    绛旓細鎺у埗鍏朵粬鍥犵礌銆1銆佽В閲婂畾鎬у彉閲忥細铏氭嫙鍙橀噺鍙敤浜庤В閲婃煇浜涘畾鎬у彉閲忓鍥犲彉閲忕殑褰卞搷銆傛у埆鏄竴涓畾鎬у彉閲忥紝寮曞叆铏氭嫙鍙橀噺鍚庯紝妯″瀷鍙互鏇村ソ鍦拌В閲婃у埆瀵圭粨鏋滅殑褰卞搷銆2銆佹帶鍒跺叾浠栧洜绱狅細鍦ㄥ洖褰掑垎鏋愪腑锛屽紩鍏ヨ櫄鎷熷彉閲忓彲浠ユ帶鍒跺叾浠栨棤娉曡娴嬪拰搴﹂噺鐨勫洜绱犵殑褰卞搷銆傞氳繃寮曞叆铏氭嫙鍙橀噺锛屽彲浠ユ洿鍑嗙‘鍦颁及璁¤嚜鍙橀噺瀵瑰洜鍙橀噺鐨勫奖鍝嶃
  • 涓轰粈涔堝紩鍏ヨ櫄鎷熷彉閲?
    绛旓細妯″瀷涓紩鍏ヨ櫄鎷熷彉閲忕殑浣滅敤 1銆佸垎绂诲紓甯稿洜绱犵殑褰卞搷锛屼緥濡傚垎鏋愭垜鍥紾DP鐨勬椂闂村簭鍒楋紝蹇呴』鑰冭檻鏃堕棿鍥犵礌瀵瑰浗姘戠粡娴庣殑鐮村潖鎬у奖鍝嶏紝鍓旈櫎涓嶅彲姣旂殑鍥犵礌銆2銆佹楠屼笉鍚屽睘鎬х被鍨嬪鍥犲彉閲忕殑浣滅敤锛屼緥濡傚伐璧勬ā鍨嬩腑鐨勬枃鍖栫▼搴︺佸鑺傚閿鍞鐨勫奖鍝嶃3銆鎻愰珮妯″瀷鐨勭簿搴锛岀浉褰撲簬灏嗕笉鍚屽睘鎬х殑鏍锋湰鍚堝苟锛屾墿澶т簡鏍锋湰瀹归噺锛堝鍔犱簡璇...
  • 铏氭嫙鍙橀噺妯″瀷妯″瀷涓寮曞叆铏氭嫙鍙橀噺鐨勪綔鐢╗2]
    绛旓細鏈鍚庯紝寮曞叆铏氭嫙鍙橀噺鏈夊姪浜庢彁楂樻ā鍨嬬殑棰勬祴绮惧害銆傚畠鐩稿綋浜庡湪妯″瀷涓悎骞朵簡涓嶅悓灞炴х殑鏍锋湰锛屽疄璐ㄤ笂澧炲姞浜嗘暟鎹殑澶氭牱鎬э紝浠庤屾彁鍗囦簡妯″瀷鐨勪及璁$簿搴︺傝繖绉嶅仛娉曠浉褰撲簬鎵╁ぇ浜嗘牱鏈閲忥紝鍑忓皯浜嗙敱浜庢牱鏈噺涓嶈冻瀵艰嚧鐨勮宸紝闄嶄綆浜嗚宸柟宸紝浣垮緱妯″瀷鐨勭粨鏋滄洿鍏蜂唬琛ㄦс傛荤殑鏉ヨ锛岃櫄鎷熷彉閲忓湪妯″瀷涓殑杩愮敤锛屼笉浠呰兘澶熸帶鍒...
  • 涓轰粈涔堣寮曞叆铏氭嫙鍙橀噺?
    绛旓細铏氭嫙鍙橀噺寮曞叆鐨勫師鍒欏涓嬶細鍦ㄦā鍨嬩腑寮曞叆澶氫釜铏氭嫙鍙橀噺鏃讹紝铏氭嫙鍙橀噺鐨勪釜鏁板簲鎸変笅鍒楀師鍒欑‘瀹氾細锛1锛夊鏋滃洖褰掓ā鍨嬫湁鎴窛椤广傛湁m绉嶄簰鏂ョ殑灞炴х被鍨嬶紝鍦ㄦā鍨嬩腑寮曞叆锛坢-1锛変釜铏氭嫙鍙橀噺銆傦紙2锛夊鏋滃洖褰掓ā鍨嬫棤鎴窛椤癸紝鏈塵涓壒寰侊紝璁剧疆m涓櫄鎷熷彉閲忋傝櫄鎷熷彉閲忕畝浠嬶細铏氭嫙鍙橀噺 ( Dummy Variables) 鍙堢О铏氳鍙橀噺銆佸悕涔夊彉...
  • 妯″瀷涓寮曞叆铏氭嫙鍙橀噺鏈浠涔浣滅敤?
    绛旓細铏氭嫙鍙橀噺绉拌櫄璁惧彉閲忋佸悕涔夊彉閲忔垨鍝戝彉閲忥紝鐢ㄤ互鍙嶆槧璐ㄧ殑灞炴х殑涓涓汉宸ュ彉閲,鏄噺鍖栦簡鐨勮川鍙橀噺锛岄氬父鍙栧间负0鎴1銆傚紩鍏ュ搼鍙橀噺鍙娇绾垮舰鍥炲綊妯″瀷鍙樺緱鏇村鏉傦紝浣嗗闂鎻忚堪鏇寸畝鏄庯紝涓涓柟绋嬭兘杈惧埌淇╀釜鏂圭▼鐨勪綔鐢紝鑰屼笖鎺ヨ繎鐜板疄銆傝櫄鎷熷彉閲忚缃殑鍘熷垯锛氬湪妯″瀷涓紩鍏ュ涓櫄鎷熷彉閲忔椂锛岃櫄鎷熷彉閲忕殑涓暟搴旀寜涓嬪垪鍘熷垯纭畾...
  • 铏氭嫙鍙橀噺鍚嶈瘝瑙i噴
    绛旓細閫氳繃杩欑鏂瑰紡锛屽彲浠ュ湪妯″瀷涓冭檻鎬у埆鐨勫奖鍝嶃傝櫄鎷熷彉閲忕殑浣滅敤涓昏浣撶幇鍦ㄤ互涓嬪嚑涓柟闈細1. 绠鍖栨ā鍨嬶細閫氳繃寮曞叆铏氭嫙鍙橀噺锛屽彲浠ュ皢澶嶆潅鐨勫垎绫绘暟鎹畝鍖栦负浜岃繘鍒跺舰寮忥紝浠庤岀畝鍖栫粺璁℃ā鍨嬬殑鏋勫缓鍜屽垎鏋愯繃绋嬨2. 鎻愰珮妯″瀷鐨勮В閲婃э細铏氭嫙鍙橀噺鍙互鐩磋鍦拌〃绀烘煇涓垎绫荤殑褰卞搷锛屼娇寰楁ā鍨嬬殑瑙i噴鏇村姞鐩磋鍜屾槗浜庣悊瑙c3. 閫傚簲闈...
  • 铏氭嫙鍙橀噺鐨寮曞叆闅愬惈浜浠涔鍋囪
    绛旓細瀵瑰師濮嬫暟鎹殑鏀硅繘锛屼粠鑰屽舰鎴愪簡鏇村鏂扮殑鍋囪銆傛牴鎹煡璇㈢浉鍏冲叕寮淇℃伅鏄剧ず锛寮曞叆铏氭嫙鏁版嵁鍚庯紝鍘熷鏁版嵁鏄笉浼氭敼鍙樼殑銆铏氭嫙鍙橀噺鏄鍘熷鏁版嵁鐨勬敼杩涳紝鐢变簬鍚勮櫄鎷熷彉閲忎箣闂村瓨鍦ㄧ浉浜掑奖鍝嶅叧绯伙紝浠庤屽舰鎴愪簡鏇村鏂扮殑鍋囪銆.铏氭嫙鍙橀噺鏄互鐪熷疄鍙橀噺涓哄弬鐓с傝櫄鎷熷彉閲忕殑寮曞叆涓嶆敼鍙樺師鏈夌殑鍙橀噺褰㈠紡銆
  • 铏氭嫙鍙橀噺寮曞叆鐨勬柟寮忓強姣忕鏂瑰紡鐨勪綔鐢ㄦ槸浠涔?
    绛旓細杩欑鍙橀噺寮曞叆鐨勬柟寮忓強瀵瑰簲鐨勪綔鐢ㄥ涓嬶細1銆佸鎵鏈夊垎绫诲彉閲寮曞叆铏氭嫙鍙橀噺锛氳繖绉嶆柟寮忓彲浠ヨ鎵鏈夌殑鍒嗙被鍙橀噺閮借兘澶熻妯″瀷鎺ュ彈骞跺弬涓庡埌妯″瀷鐨勬嫙鍚堣繃绋嬩腑锛屽噺灏戞暟鎹繘琛岄澶勭悊鐨勫鏉傚害銆2銆佸閮ㄥ垎鍒嗙被鍙橀噺寮曞叆铏氭嫙鍙橀噺锛氳繖绉嶆柟寮忓彲浠ョ敤鏉ヨВ鍐冲垎绫诲艰緝澶氱殑鍙橀噺鎵甯︽潵鐨勬ā鍨嬪鏉傚害闂锛屽悓鏃惰繕鍙互鍓旈櫎鏌愪簺鏃犲叧鎴栦笉鏄捐憲鐨...
  • 铏氭嫙鍙橀噺濡備綍瑙i噴
    绛旓細- 妯″瀷瑙i噴鎬ф彁鍗囷細铏氭嫙鍙橀噺鐩磋鍦板睍绀轰簡鍒嗙被鍥犵礌鐨勪綔鐢紝浣垮緱妯″瀷鏇存槗浜庣悊瑙e拰瑙i噴銆- 閫傚簲闈炵嚎鎬у叧绯伙細寮曞叆澶氫釜铏氭嫙鍙橀噺鍚庯紝妯″瀷鑳藉鏇村ソ鍦伴傚簲鍥犲彉閲忎笌鑷彉閲忛棿鐨勯潪绾挎у叧绯伙紝杩涜屾彁楂樻ā鍨嬬殑鎷熷悎浼樺害銆4. 涓轰簡婕旂ず铏氭嫙鍙橀噺鐨勮繍鐢紝鍋囪鎴戜滑杩涜涓椤圭爺绌讹紝鎺㈣鏁欒偛姘村钩濡備綍褰卞搷鏀跺叆銆傛暀鑲叉按骞冲彲浠ョ粏鍒嗕负鍑犱釜...
  • 铏氭嫙鍙橀噺鐨勪綔鐢ㄦ槸浠涔
    绛旓細铏氭嫙鍙橀噺鐨勪綔鐢ㄥ涓嬶細1.鍙互鎻忚堪鍜屾祴閲忓畾鎬у洜绱犵殑褰卞搷锛2.鑳藉姝g‘鍙嶆槧缁忔祹鍙橀噺涔嬮棿鐨勫叧绯伙紝鎻愰珮妯″瀷鐨勭簿搴锛3.渚夸簬澶勭悊寮傚父鏁版嵁 铏氭嫙鍙橀噺璁剧疆鐨勫師鍒欏涓嬶細鍦ㄦā鍨嬩腑寮曞叆澶氫釜铏氭嫙鍙橀噺鏃讹紝铏氭嫙鍙橀噺鐨勪釜鏁板簲璇ユ寜鐓т笅鍒楀師鍒欑‘瀹 1.濡傛灉鍥炲綊妯″瀷鏈夋埅璺濋」锛屾湁m绉嶄簰鏂ョ殑灞炴х被鍨嬶紝鍦ㄦā鍨嬩腑寮曞叆锛坢-1锛変釜铏氭嫙鍙橀噺 ...
  • 扩展阅读:虚拟变量可以取2 3吗 ... 多变量虚拟变量陷阱 ... 乘法引入虚拟变量陷阱 ... 为什么要设置虚拟变量 ... 什么时候用虚拟变量 ... 虚拟变量的引入方式 ... 虚拟变量为什么少一个 ... 回归分析引入虚拟变量 ... 如何避免落入虚拟变量陷阱 ...

    本站交流只代表网友个人观点,与本站立场无关
    欢迎反馈与建议,请联系电邮
    2024© 车视网