虚拟变量

虚拟变量 ( Dummy Variables) 又称虚设变量、名义变量或 哑变量 ,用以反映质的属性的一个 人工 变量,是量化了的自变量,通常取值为0或1。引入哑变量可使线形回归模型变得更复杂,但对问题描述更简明,一个方程能达到两个方程的作用,而且 接近现实 。

例如,反映文化程度的虚拟变量可取为:1:本科学历;0:非本科学历

一般地,在虚拟变量的设置中:基础类型、肯定类型取值为1;比较类型,否定类型取值为0。

在进一步解释虚拟变量的含义之前,我们需要先了解一下“参照”的含义。分类结果的解释一般是要有参照类别的。比如我们说男性肺癌发生率高,暗含了“相对女性”这样的参照;50岁以上人群冠心病发生率更高,暗含了“相对50岁以下人群”的参照。没有参照,就没法说高或低。比如我们单独说80%这个数字,它是高还是低呢?相对70%就是高的,相对90%就是低的。所以分类变量的结果需要结合参照来解释。

当我们把k个类别的多分类变量转化为k-1个二分变量后,每一个二分类变量表示相对参照类的大小。例如,多分类变量x用1、2、3、4表示,我们设定以1作为参照,那么生成的3个虚拟变量分别表示:2和1相比的大小、3和1相比的大小、4和1相比的大小。

通过生成虚拟变量,就把原来的一个系数变成了多个系数,这多个系数更详细地显示了自变量与因变量之间的关系,尤其在非线性关系的时候,尤其重要。因为当你在用线性回归、logistic回归这些方法的时候,已经默认了是线性关系了,你是不可能找出非线性关系的。

模型中引入虚拟变量的作用

1、分离异常因素的影响,例如分析我国GDP的时间序列,必须考虑“**”因素对国民经济的破坏性影响,剔除不可比的“**”因素。

2、检验不同属性类型对因变量的作用,例如工资模型中的文化程度、季节对销售额的影响。

3、提高模型的精度,相当于将不同属性的样本合并,扩大了样本容量(增加了误差自由度,从而降低了误差方差)

在模型中引入多个虚拟变量时,虚拟变量的个数应按下列原则确定:

(1)如果回归模型有截距项

有m种互斥的属性类型,在模型中引入(m-1)个虚拟变量。

(2)如果回归模型无截距项,有m个特征,设置m个虚拟变量

  • 浠涔堟槸铏氭嫙鍙橀噺
    绛旓細铏氭嫙鍙橀噺绉拌櫄璁惧彉閲忋佸悕涔夊彉閲忔垨鍝戝彉閲锛岀敤浠ュ弽鏄犺川鐨勫睘鎬х殑涓涓汉宸ュ彉閲,鏄噺鍖栦簡鐨勮川鍙橀噺锛岄氬父鍙栧间负0鎴1銆傚紩鍏ュ搼鍙橀噺鍙娇绾垮舰鍥炲綊妯″瀷鍙樺緱鏇村鏉傦紝浣嗗闂鎻忚堪鏇寸畝鏄庯紝涓涓柟绋嬭兘杈惧埌淇╀釜鏂圭▼鐨勪綔鐢紝鑰屼笖鎺ヨ繎鐜板疄銆傝櫄鎷熷彉閲忚缃殑鍘熷垯锛氬湪妯″瀷涓紩鍏ュ涓櫄鎷熷彉閲忔椂锛岃櫄鎷熷彉閲忕殑涓暟搴旀寜涓嬪垪鍘熷垯纭畾...
  • 浠涔堟槸铏氭嫙鍙橀噺
    绛旓細铏氭嫙鍙橀噺鍙堢О铏氳鍙橀噺銆佸悕涔夊彉閲忔垨鍝戝彉閲锛岀敤浠ュ弽鏄犺川鐨勫睘鎬х殑涓涓汉宸ュ彉閲,鏄噺鍖栦簡鐨勮川鍙橀噺锛岄氬父鍙栧间负0鎴1銆傚紩鍏ュ搼鍙橀噺鍙娇绾垮舰鍥炲綊妯″瀷鍙樺緱鏇村鏉傦紝浣嗗闂鎻忚堪鏇寸畝鏄庯紝涓涓柟绋嬭兘杈惧埌淇╀釜鏂圭▼鐨勪綔鐢紝鑰屼笖鎺ヨ繎鐜板疄銆備緥濡傦紝鍙嶆槧鏂囩▼搴︾殑铏氭嫙鍙橀噺鍙彇涓猴細1:鏈瀛﹀巻锛0锛氶潪鏈瀛﹀巻 涓鑸湴锛屽湪铏...
  • 浠涔堟槸铏氭嫙鍙橀噺
    绛旓細鎮ㄥソ锛岃櫄鎷熷彉閲忥紙Dummy Variable锛夛紝涔熺О涓烘寚绀哄彉閲忥紙Indicator Variable锛夛紝鏄竴绉嶇敤浜庤〃绀哄垎绫诲彉閲忕殑鏁板煎彉閲銆傝櫄鎷熷彉閲忛氬父鍙栧间负0鎴1锛岀敤鏉ヨ〃绀烘煇涓垎绫诲彉閲忔槸鍚﹀瓨鍦ㄦ垨鍙戠敓銆傝櫄鎷熷彉閲忛氬父鐢ㄤ簬鍥炲綊鍒嗘瀽涓紝鐢ㄦ潵琛ㄧず鍒嗙被鍙橀噺瀵瑰洜鍙橀噺鐨勫奖鍝嶃備緥濡傦紝鍦ㄤ竴椤圭爺绌朵腑锛屾垜浠兂瑕佹帰绌舵у埆瀵规敹鍏ョ殑褰卞搷锛屽彲浠ュ垱寤轰竴涓櫄...
  • 浠涔堟槸铏氭嫙鍙橀噺?
    绛旓細1.鍙互鎻忚堪鍜屾祴閲忓畾鎬у洜绱犵殑褰卞搷锛2.鑳藉姝g‘鍙嶆槧缁忔祹鍙橀噺涔嬮棿鐨勫叧绯伙紝鎻愰珮妯″瀷鐨勭簿搴锛3.渚夸簬澶勭悊寮傚父鏁版嵁 铏氭嫙鍙橀噺璁剧疆鐨勫師鍒欏涓嬶細鍦ㄦā鍨嬩腑寮曞叆澶氫釜铏氭嫙鍙橀噺鏃讹紝铏氭嫙鍙橀噺鐨勪釜鏁板簲璇ユ寜鐓т笅鍒楀師鍒欑‘瀹 1.濡傛灉鍥炲綊妯″瀷鏈夋埅璺濋」锛屾湁m绉嶄簰鏂ョ殑灞炴х被鍨嬶紝鍦ㄦā鍨嬩腑寮曞叆锛坢-1锛変釜铏氭嫙鍙橀噺 2.濡傛灉鍥炲綊妯″瀷鏃犳埅璺...
  • 铏氭嫙鍙橀噺鍚嶈瘝瑙i噴
    绛旓細铏氭嫙鍙橀噺锛圖ummy Variable锛夛紝鍙堢О铏氳鍙橀噺銆佸悕涔夊彉閲忔垨鍝戝彉閲忥紝鏄竴绉嶇敤浜庡洖褰掑垎鏋愪腑鐨勪簩杩涘埗鍙橀噺锛岄氬父鐢ㄤ簬琛ㄧず鍒嗙被鏁版嵁銆傚湪缁熻瀛﹀拰鏁版嵁鍒嗘瀽涓紝铏氭嫙鍙橀噺鏄竴绉嶉噸瑕佺殑宸ュ叿锛岀敤浜庡皢鍒嗙被鏁版嵁锛堝鎬у埆銆佸濮荤姸鍐点佹暀鑲叉按骞崇瓑锛夊紩鍏ュ洖褰掑垎鏋愮瓑缁熻妯″瀷銆傝櫄鎷熷彉閲忕殑鍙栧奸氬父鏄0鎴1锛岀敤浜庤〃绀烘煇涓壒瀹氬垎绫荤殑瀛樺湪...
  • 璁¢噺缁忔祹瀛:铏氭嫙鍙橀噺妯″瀷
    绛旓細铏氭嫙鍙橀噺閫氬父鏄竴绉嶄簩鍏冩垨鍒嗙被鍙橀噺锛屽彇鍊煎彧鏈0鎴1锛屽畠浠互闈炴暟鍊煎舰寮忓憟鐜帮紝浠呬綔涓鸿В閲婂彉閲忋備緥濡傦紝鏁欒偛绋嬪害鐨勮櫄鎷熷彉閲忓彲鑳藉畾涔変负锛欴=1浠h〃鏈瀛﹀巻锛孌=0鍒欎唬琛ㄩ潪鏈瀛﹀巻锛岃繖鏍疯兘娓呮櫚鍦板弽鏄犲嚭涓嶅悓灞傛鐨勬暀鑲叉按骞炽傚垱寤鸿櫄鎷熷彉閲忔槸涓熀纭浣嗗叧閿殑姝ラ銆傞鍏堬紝鎴戜滑鍙互涓烘暟鍊煎彉閲忎娇鐢╣en銆乺eplace鎴杛ecode鍛戒护銆
  • Stata濡備綍鐢熸垚铏氭嫙鍙橀噺?
    绛旓細鍦⊿tata涓敓鎴铏氭嫙鍙橀噺锛堝張绉版寚绀哄彉閲忔垨鍝戝彉閲锛夊彲浠ラ氳繃澶氱鏂瑰紡瀹屾垚锛岃繖浜涘彉閲忛氬父鐢ㄤ簬琛ㄧず鍒嗙被鏁版嵁鐨勪簩杩涘埗缂栫爜锛屽叾涓1鈥濊〃绀烘煇涓被鍒殑瀛樺湪锛屸0鈥濊〃绀轰笉瀛樺湪銆備互涓嬫槸鍑犵甯歌鐨勬柟娉曟潵鍦⊿tata涓敓鎴愯櫄鎷熷彉閲忥細1. 浣跨敤generate鍜宺eplace鍛戒护 濡傛灉鍒嗙被鍙橀噺鐨勭被鍒暟閲忚緝灏戯紝鍙互鎵嬪姩涓烘瘡涓被鍒垱寤轰竴涓櫄鎷...
  • 铏氭嫙鍙橀噺鏄畾鎬у洜绱犲瑙i噴鍙橀噺杩樻槸瀵硅
    绛旓細鍘熼:铏氭嫙鍙橀噺鏄畾鎬у洜绱犲瑙i噴鍙橀噺杩樻槸瀵硅瑙i噴鍙橀噺鐨勫奖鍝 铏氭嫙鍙橀噺鍙槸涓绉嶈涓哄畾涔夊畾鎬у彉閲忕殑鏂规硶锛屽疄璐ㄤ笂铏氭嫙鍙橀噺涓嶄竴瀹氬彧鑳界敤浜庡畾鎬у彉閲忥紝涔熷彲浠ョ敤浜庢暟鍊煎瀷鍙橀噺銆傝櫄鎷熷彉閲忔棦鍙互浣滀负瑙i噴鍙橀噺涔熷彲浠ヤ綔涓鸿瑙i噴鍙橀噺锛屽鏋滆櫄鎷熷彉閲忎綔涓鸿瑙i噴鍙橀噺锛屽氨鏄墍璋撲簩鍏冮夋嫨妯″瀷鎴栦簩鍒嗙被鍙橀噺妯″瀷銆
  • 3涓兼庝箞璁铏氭嫙鍙橀噺spss21
    绛旓細1銆侀鍏堟墦寮鏁版嵁闆嗙‘淇濆凡缁忔墦寮浜嗗寘鍚璁剧疆铏氭嫙鍙橀噺鐨勬暟鎹泦锛屽垱寤烘柊鍙橀噺鐐瑰嚮鑿滃崟鏍忎腑鐨勮浆鎹㈤夐」锛屽湪涓嬫媺鑿滃崟涓夋嫨璁$畻鍙橀噺锛屽畾涔夎櫄鎷熷彉閲忓湪寮瑰嚭鐨勮绠楀彉閲忓璇濇涓紝浼氱湅鍒颁竴涓〃鏍硷紝鍦ㄨ繖涓〃鏍间腑鍙互瀹氫箟鏂扮殑铏氭嫙鍙橀噺銆2銆佸叾娆¤緭鍏ヨ〃杈惧紡妫鏌ヤ竴涓嬭緭鍏ョ殑淇℃伅鏄惁姝g‘锛屽寘鎷彉閲忓悕鍜岃〃杈惧紡锛岀偣鍑荤户缁寜閽紝...
  • 铏氭嫙鍙橀噺缁忔祹鎰忎箟濡備綍鎻忚堪
    绛旓細绠鍗曟潵璇翠互铏氭嫙鍙橀噺绛変簬0涓烘瘮杈冨熀纭鐨勮秴棰濆闀块噺铏氭嫙鍙橀噺鍙堝彨浜屽煎彉閲(binaryvariable)鎴鍝戝彉閲(dummyvariable),鍙橀噺鍙彇涓や釜鍊,涓鑸槸0鎴1,瀹冪敤鏉ヨ〃绀轰竴涓彧鍏锋湁涓ょ鐘舵佺殑鍥犵礌銆備緥濡,X琛ㄧず鎬у埆,鎬у埆涓虹敺瀵瑰簲X=1,鎬у埆涓哄コ瀵瑰簲X=0銆傚湪鍥炲綊鍒嗘瀽閲岄潰,渚嬪璁綜琛ㄧず娑堣垂,Y琛ㄧず鏀跺叆,鍒欐柟绋嬧淐=a1+a2*Y+a3*X+鎵板姩...
  • 扩展阅读:虚拟变量名词解释 ... 工具变量法 ... 虚拟变量陷阱 ... 控制变量 ... 什么是虚拟变量 ... 年份虚拟变量 ... 哑变量 ... 虚拟变量回归模型 ... 虚拟变量可以直接回归吗 ...

    本站交流只代表网友个人观点,与本站立场无关
    欢迎反馈与建议,请联系电邮
    2024© 车视网