固定效应

固定效应是一种控制变量,可以影响解释变量,也可以影响被解释变量。

1、固定效应是什么?

首先,固定效应是一种控制变量,可以影响解释变量,也可以影响被解释变量。其次,固定效应是有固定不变特征的影响因素(控制变量),包括可观测的和不可观测的。最后,固定效应有两个维度,一个是空间,一个是时间。

数据:首先是一个固定效应就是一个控制变量或者是一种综合的影响因素(包括了很多控制变量(产生的效果)),其次根据独一无二的固定不变的特征来分组,再次每组组内的取值相同,最后产生对组内个体同质性的影响。

固定效应有几个类型:个体固定效应、时间固定效应、省份固定效应、行业固定效应以及交叉固定效应等等,这是因为根据独一无二的固定不变的特征来分组造成的,比如个体固定效应就是每个个体不随时间变化的独特特征对被解释变量的影响,省份固定效应就是每个省份不随时间变化的独特特征对被解释变量的影响,不同的分组可以形成不同的固定效应。

模型:Yit=bXit+di+uit,个体固定效应就是di,类似于每个个体有一个单独的截距项,或者类似于常数项但是不同组有不同的取值,组内取值相同。或者Yit=bXit+求和diDi+uit,个体固定效应di就是虚拟变量Di的系数。

图形:每个组分别画图,放在一个图内,不同的组有不同的截距项,但是所有组有相同的斜率。

2、为什么要引入固定效应?

因为固定效应是一种控制变量,控制变量的目的就是防止遗漏变量带来的内生性问题,遗漏变量会影响解释变量,也会影响被解释变量,导致解释变量的估计系数不准确或者不纯,所以要多增加控制变量。

控制变量一般有可观测的随时间变化的变量、有可观测的不随时间变化的变量,有不可观测不随时间变化的变量等等,固定效应主要控制不可观测不随时间变化的变量,比如个体固定效应,两个公司A和B绩效有大的不同,那么其背后有很多原因,比如公司文化、所处省份、所处行业等等,公司文化难衡量且不随时间变化,所以可以用个体固定效应来控制。

当然也不一定是不随时间变化,比如年份固定效应就是衡量每个年份不随个体变化的影响因素,每年都有独特的特征,如宏观经济波动导致企业A在不同年份的绩效不一样。

3、举例

个体固定效应:个体固定效应就是个体层面不随时间变化的影响因素,每个个体都独特的个体特征,其目的是为了控制个体层面独一无二的不随时间变化的特征,比如企业A之所以绩效比企业B好,其中就有企业文化在起作用,若是想要控制,就需要加入个体固定效应。

写成模型就是Yit=b*Xit+di+uit,这里的di就是个体固定效应,每个个体都有独特的部分,每个个体都不一样,不随时间变化。

时间固定效应:时间固定效应就是时间层面不随个体变化的影响因素,每个年份都有独特的年份特征,其目的是为了控制时间层面独一无二的不随个体变化的特征,比如每年的宏观经济。写成模型就是Yit=b*Xit+Tt+uit,这里的Tt就是年份固定效应,每个年份都有独特的部分,每个年份都不一样,不随个体变化。

一个具体的例子:我们想要研究税法改革与企业绩效之间的关系,企业1在A省2014年后发生了税法改革,企业2在B省一直都没有税法改革。我们如果仅仅看税法改革后企业1的绩效大于企业2的绩效,就说税法改革是有效的,显然不合理,其忽略了影响企业绩效的其他因素。

比如企业1和企业2本身都有独特的个体固定特征,导致企业1本身就绩效高,这时候就需要控制个体固定效应,将原本就有的每个企业的特色或者两企业之间的差异给估计出来控制住,这样才能进一步比较,这就是个体固定效应。

又比如在2014年宏观经济因素发生了变化,但是与税法改革无关,导致企业1和企业2绩效都提升,那么还需要剥离宏观经济的影响,这时候就需要控制年份固定效应,将每年的特色给控制住。

所以,2014年后A企业平均绩效=税改+2014年后宏观经济+A个体本身特色,2014年后B企业平均绩效=2014年后宏观经济+B个体本身特色,那么若想知道2014年后两个企业绩效的差距是否来自于税改,那么就需要控制住年份固定效应和个体固定效应。

另外,前面企业个体固定效应是控制了企业本身独特的不随时间变化的特征,比如企业的文化、企业所在的省份和行业等等,企业所属的省份和行业也是影响企业绩效的关键因素,企业A和B之间绩效的不同也可能是因为省份的独特的不随时间变化的特征和行业的独特的不随时间变化的特征,按理说也应该一起控制,即省份固定效应和行业固定效应。那么到底要不要控制?

4、怎么估计固定效应?

介绍两种方法:一种是虚拟变量法,另一种是组内离差法。

假设模型是Yit=b*Xit+di+uit,i是个体如企业,t是年份,这里的di就是个体固定效应——企业独一无二的不随时间变化的影响解释变量和被解释变量的因素。可以说,我们要么就把di个体固定效应给估计出来,要么就把di个体固定效应给去掉后再估计。

4.1、虚拟变量法——直接估计出来

个体固定效应是每个企业独一无二的不随时间变化的影响因素,那么可以放入虚拟变量来估计,在没有常数项时,一个企业就放入一个虚拟变量,如果个体是i,那么虚拟变量Di=1,如果是其他个体,那么虚拟变量Di=0。通过估计出虚拟变量的系数,就可以得到个体固定效应。

一个特点:当每个个体都有一个虚拟变量的时候,个体层面可以观测的不随时间变化的虚拟变量,如性别变量,就会与个体固定效应虚拟变量共线性,这时候性别变量会omitted被剔除,个体固定效应实际上是可以观测和不可观测的不随时间变化的影响因素。

代码:4个企业个体:

tab id,gen(id_dum)/根据id生成虚拟变量

reg y x id_dum1-id_dum4,noconstant

4.2、组内离差法——先剔除后估计

我们知道每个个体都有不随时间变化的个体固定效应,一个个体有很多时间维度,就形成一个组,解释变量、被解释变量和控制变量对时间求均值,形成一个组内均值,但是个体固定效应由于不随时间变化,还是等于个体固定效应,那么变量的每个值都减去自己的组均值,就形成一个新变量,这时候新变量里就没有个体固定效应了。

原来模型:Yit=bXit+di+uit,每组求均值后:Yi=bXi+di+ui,相减后:Yit-Yi=b(Xit-Xi)+uit-ui。直接用ols就可以估计出来b。

一个特点:不仅去除了个体固定效应(不可观测的不随时间变化的变量),也去除了可观测的不随时间变化的变量。

如性别变量,假设有两个个体,有3个年份,个体1是男,个体2是女,男取值为1,女取值为0,那么个体1求均值后为1,个体2求均值后为0,那么个体1的取值减去均值都变成了0,个体2的取值减去均值都变成了0,此时性别虚拟变量全部都成了0,不存在个体内变化信息,无法估计。

代码:

egen m_y=mean(y),by(id)/按id生成变量y均值

egen m_x=mean(x),by(id)/按id生成变量x均值

gen winthin_y=y-m_y/对y进行去均值转换

gen within_x=x-m_x/.....

gen winthin_ywithin_x,noconstant

以上是手动原理,以下是自动:

xtset id year

xtreg y x,fe

5、一些关于固定效应的问题

一种是固定效应之间的关系,另一种是固定效应与控制变量之间的关系。

5.1、有了个体固定效应还需不需要控制省份固定效应和行业固定效应?

看企业是否在年份变化里变动省份和行业。

重新假设一个数据,企业1和企业2在A省,企业3和企业4在B省,放入企业固定效应就是放入4个虚拟变量,放入省份固定效应就是放入1个虚拟变量,企业1和企业2的虚拟变量就可以表出省份虚拟变量,或者企业3和企业4的虚拟变量就可以表出省份虚拟变量,那么在放入回归的时候,省份虚拟变量会被(omitted)掉。

或者按照组内离差的方法,要对每个个体变量(解释变量、被解释变量和控制变量)先根据个体取求均值,然后每个个体变量减去均值,然后跑回归。那么省份虚拟变量在取均值的时候还是等于一般的取值,所以一减就全是零了,不存在个体内变化信息,无法估计。那么什么时候可以同时放入省份和企业固定效应?

企业虚拟变量表出不了省份虚拟变量的时候,也就是此时省份固定效应无法被代替了,此时个体变量减去组内均值还是存在的,可以回归。比如企业1在2015年之前在A省,2015年之后在B省,这时候企业1的虚拟变量就没办法表出,控制的个体固定效应是个体不随时间变化的,省份变化了,所以就没控制。

可以加入省份固定效应,因为之前个体固定效应所控制的省份固定效应不是真实的,或者就没控制省份固定效应,因为省份固定效应的控制需要整个省份整个年份的企业,但是由于企业的变化导致省份内企业数量的变化。

5.2、固定效应与控制变量之间的关系是什么?

其实无论个体固定效应、时间固定效应、省份、行业、省份-行业、省份-年份等等,都是将个体分成不同的组,固定效应就是要控制每个组内独一无二且固定不变的特征,当加入时间维度,就不一定是不随时间变化了,它变成了在那一个分组内固定不变,比如省份-年份的话,控制了浙江省2012年的独特的固定特征对。

那么当加入个体固定效应时,个体层面的虚拟变量就会被剔除。当加入行业-年份固定效应时,行业层面随时间变化的控制变量就会被剔除。当加入省份-年份固定效应时,省份层面随时间变化的控制变量就会被剔除,如果你的核心解释变量是省份层面的,那么就不能加入省份-年份固定效应,因为解释变量会被剔除。

5.3、交互固定效应如何设定?

两个变量交互,比如行业和年份,文献中的表示方法一般是行业-年份或者行业×年份。基本来说有两种方法:第一种方法先生成交乘变量,其实就是两个变量的进一步分组,比如行业与时间交互,有3个行业和10个年份,交互后就进一步分成30个组,同一个行业同一个年份的企业分成一组!也可以这么理解,将企业分到3个行业里面,一个行业又再按年份分成10组,那么就是30组。

但是也不一定就是3*3=9,比如有三个行业和三个城市,先将企业分成3个城市,第一个城市有3个行业,但是第二个和第三个城市只有1个行业,且相同,那么所有的企业一共只能分成5组。

那么代码是这样的:egen year_industry=group(year industry),其次在reghdfe的absorb中写成absorb(year_industry);第二种方法就是直接在reghdfe的absorb中写成absorb(year#industry)。

其实本质上来说就是分组或者变换维度,形成一个新的类别变量或者维度,而且是更加细化的维度,那么最普遍的做法就是先形成一个新的变量即egen的做法,然后就把他当成普通的变量进行回归,如果要固定就固定,如果要聚类就聚类。

5.4、省份-年份固定效应与省份和年份固定效应之间的关系是什么?

其实,省份-年份就是用省份和年份一起来分组的,无论企业变动与否,都能完全分组,那么省份-年份可以以表出省份,也可以表出年份,所以控制了省份-年份就不用控制省份和年份了。在stata中,放入省份-年份虚拟变量后再放入年份虚拟变量会被剔除,放入省份虚拟变量也会被剔除。

一句话总结固定效应:有固定不变特征的控制变量,其目的是为了控制每个分组内独一无二的固定不变的特征。

6、控制几个固定效应?

控制变量有两个维度,一个是时间,另一个是空间,空间又分省份、行业和企业个体。

在个体层面,分为随时间变化的控制变量和不随时间变化的控制变量,随时间变化的控制变量可以用可观测的控制变量来衡量,不随时间变化的控制变量可以用个体固定效应来衡量。那么个体层面控制变量=个体可观测控制变量+个体固定效应。

在省份层面,分随时间变化的控制变量和不随时间变化的控制变量,随时间变化的控制变量可以用可观测的控制变量来衡量,不随时间变化的控制变量可以用省份固定效应来衡量。那么省份层面控制变量=省份可观测控制变量+省份固定效应。

在行业层面,分随时间变化的控制变量和不随时间变化的控制变量,随时间变化的控制变量可以用可观测的控制变量来衡量,不随时间变化的控制变量可以用行业固定效应来衡量。那么行业层面控制变量=行业可观测控制变量+行业固定效应。

在时间层面,如果想要控制不随个体变化、不随省份变化、不随行业变化的控制变量,可以时间固定效应。

那么第一种加入控制变量的方式就是:个体层面控制变量+省份层面控制变量+行业层面控制变量+时间层面控制变量=个体可观测控制变量+省份可观测控制变量+行业可观测控制变量+个体固定效应+省份固定效应+行业固定效应+时间固定效应。

如果省份可观测控制变量不太够,那么可以换成省份-年份固定效应,此时第二种加入控制变量的方式就是:个体可观测控制变量+行业可观测控制变量+个体固定效应+行业固定效应+省份-年份固定效应。此时如果解释变量是省份层面的,那么不能加入省份-年份固定效应,因为解释变量会被剔除。

如果行业可观测控制变量不太够,那么可以换成行业-年份固定效应,此时第三种加入控制变量的方式就是:个体可观测控制变量+省份可观测控制变量+个体固定效应+省份固定效应+行业-年份固定效应。此时如果解释变量是行业层面的,那么不能加入行业-年份固定效应,因为解释变量会被剔除。



  • meta鍒嗘瀽 2. 鍥哄畾鏁堝簲鍜岄殢鏈烘晥搴
    绛旓細鍥哄畾鏁堝簲妯″瀷鍋囪鎵鏈夋晥搴旈噺閮芥潵鑷竴涓崟涓鐨勭浉鍚屾讳綋銆傚畠鎸囧嚭鎵鏈夌爺绌堕兘鍏锋湁 鐩稿悓鐨 鐪熷疄鏁堝簲閲忋傝繖涓湡瀹炵殑鏁堟灉鏄垜浠兂瑕佸湪meta鍒嗘瀽涓绠楃殑鏁翠綋鏁堟灉澶у皬锛岃〃绀轰负 \theta銆傛垜浠彲浠ヨ繖鏍锋弿杩拌繖绉嶅叧绯伙細铏界劧涓嶇煡閬撶爺绌剁殑鐪熷疄鎬讳綋鏁堝簲澶у皬锛屼絾鍙互鍒╃敤杩欑鍏崇郴鏉ュ鐪熷疄鎬讳綋鏁堝簲杩涜鏈浣充及璁 \hat\theta_k锛 ...
  • 浠涔堟槸璋冭妭鏁堝簲鍥哄畾鏁堝簲
    绛旓細1.璋冭妭鏁堝簲锛氭湰璐ㄦ槸涓绉嶅紓璐ㄦф晥搴旓紝閫氫織鏉ヨ鏄疿褰卞搷Y鏃跺洜M鑰屼笉鍚岋紝渚嬪鍛樺伐鍩硅锛圶锛変細褰卞搷鍛樺伐宸ヨ祫锛圷锛夛紝浣嗗憳宸ュ伐璧勶紙X锛変細鍙楀埌鎬у埆鐨勫奖鍝嶏紙M锛夈傜敺鍛樺伐鐨勫煿璁晥鏋滄洿濂斤紝宸ヨ祫瓒婇珮銆傝繖绫昏皟鑺傛晥搴斿彲浠ョ敤鍒嗙粍鍥炲綊鐨勬柟寮忚В鍐筹紝灏嗙敺鎬у垎涓轰竴缁勶紝濂虫у垎涓轰竴缁勩2.鍥哄畾鏁堝簲(fixed effect)鏄瘯楠岃璁$殑...
  • 浠涔堟槸鍥哄畾鏁堝簲?
    绛旓細鍦ㄦ帰绱㈠唴鐢熸ч棶棰樼殑鍏抽敭瑙e喅鏂规涓紝鍥哄畾鏁堝簲妯″瀷fixed effects model绌剁珶鎵紨鐫鎬庢牱鐨勮鑹诧紵 瀹冪殑鏍稿績鍦ㄤ簬閽堝姣忎釜鏍锋湰涓浐鏈夌殑銆佷笉闅忔椂闂村彉杩佺殑鍐呯敓鎬ч棶棰樻彁渚涚瓥鐣ャ倀ime fixed effects锛堟椂闂村浐瀹氭晥搴旓級浣滀负褰卞搷鍥犵礌鐨勪竴閮ㄥ垎锛屽畠浠彲鑳藉奖鍝嶇潃鎴戜滑鍏虫敞鐨勪富瑕佸彉閲忎箣闂寸殑鍏宠仈銆傚疄闄呬笂锛屽浐瀹氭晥搴旀ā鍨嬬殑瀛樺湪骞堕潪寮哄埗...
  • 鍥藉鍥哄畾鏁堝簲鏄粈涔堟剰鎬
    绛旓細鍋囧畾鍏ㄩ儴鐮旂┒缁撴灉鐨勬柟鍚戜笌鏁堝簲澶у皬鍩烘湰鐩稿悓锛屽嵆鍚勭嫭绔嬬爺绌剁殑缁撴灉瓒嬩簬涓鑷达紝涓鑷存ф楠屽樊寮傛棤鏄捐憲鎬с傚浗瀹鍥哄畾鏁堝簲鏄亣瀹氬叏閮ㄧ爺绌剁粨鏋滅殑鏂瑰悜涓庢晥搴斿ぇ灏忓熀鏈浉鍚岋紝鍗冲悇鐙珛鐮旂┒鐨勭粨鏋滆秼浜庝竴鑷达紝涓鑷存ф楠屽樊寮傛棤鏄捐憲鎬х殑鎰忔濄傚浗瀹舵槸鏀挎不鍦扮悊瀛﹀悕璇嶃備粠骞夸箟鐨勮搴︼紝鍥藉鏄寚鎷ユ湁鍏卞悓鐨勮瑷銆佹枃鍖栥佺鏃忋侀鍦熴佹斂搴...
  • Stata鍥哄畾鏁堝簲鏈変粈涔堜綔鐢ㄥ悧?
    绛旓細娣卞叆瑙f瀽Stata涓殑涓綋銆佹椂闂村拰鍙屽悜鍥哄畾鏁堝簲锛氬簲鐢ㄤ笌瀹炰緥鍥哄畾鏁堝簲妯″瀷鍦ㄩ潰鏉挎暟鎹垎鏋愪腑鎵紨鐫鑷冲叧閲嶈鐨勮鑹诧紝瀹冧互鐙壒鐨勬柟寮忓鐞嗕釜浣撲笌鏃堕棿鐨勫紓璐ㄦс傞鍏堬紝璁╂垜浠簡瑙d竴涓嬭繖浜涙蹇:1. 鍥哄畾鏁堝簲鐨勫唴娑</鍥哄畾鏁堝簲妯″瀷鐨勬牳蹇冪悊蹇靛湪浜庯紝瀹冨尯鍒嗕簡涓綋闂寸殑鍥烘湁宸紓锛團E锛夊拰闅忔椂闂村彉鍖栫殑鏁堝簲锛圱E锛夈侳E鐢ㄦ潵鎺у埗...
  • Hausman妫楠鍥哄畾鏁堝簲鍜岄殢鏈烘晥搴旀湁浠涔堝尯鍒?
    绛旓細Hausman妫楠屾槸涓绉嶇敤浜庣‘瀹氶潰鏉挎暟鎹ā鍨嬩腑搴旇浣跨敤鍥哄畾鏁堝簲杩樻槸闅忔満鏁堝簲鐨勬柟娉曘傚畠鍩轰簬浠ヤ笅涓や釜鍋囪锛1.涓綋鏁堝簲涓庤В閲婂彉閲忕浉鍏筹紝鍗冲瓨鍦ㄥ浐瀹氭晥搴旓紱2.涓綋鏁堝簲涓庤В閲婂彉閲忎笉鐩稿叧锛屽嵆瀛樺湪闅忔満鏁堝簲銆傚鏋淗ausman妫楠岀殑p鍊煎皬浜庢樉钁楁ф按骞筹紙閫氬父涓0.05锛夛紝鍒欐嫆缁濆師鍋囪锛岃涓哄瓨鍦ㄥ浐瀹氭晥搴旓紝搴旇浣跨敤鍥哄畾鏁堝簲妯″瀷銆傚弽涔...
  • 浠涔堟槸鍥哄畾鏁堝簲妯″瀷鍜岄殢鏈烘晥搴旀ā鍨?
    绛旓細鍥哄畾鏁堝簲妯″瀷锛團ixed Effects Model锛夊拰闅忔満鏁堝簲妯″瀷锛圧andom Effects Model锛夋槸鍦ㄧ粺璁″垎鏋愪腑甯哥敤鐨勪袱绉嶇嚎鎬ф贩鍚堟晥搴旀ā鍨嬨傚畠浠兘鍙互鐢ㄤ簬瑙e喅闈㈡澘鏁版嵁鎴栧绾ф暟鎹垎鏋愪腑鐨勯棶棰橈紝浣嗕簩鑰呯殑妯″瀷缁撴瀯鍜屽亣璁惧墠鎻愮暐鏈変笉鍚岋紝涓嬮潰灏嗕粠涓変釜鏂归潰浠嬬粛鍥哄畾鏁堝簲妯″瀷鍜岄殢鏈烘晥搴旀ā鍨嬩箣闂寸殑鍖哄埆锛氭ā鍨嬪亣璁 鍥哄畾鏁堝簲妯″瀷鍩轰簬涓涓...
  • 鍥哄畾鏁堝簲涓庨殢鏈烘晥搴旂殑鍖哄埆,鍥哄畾鏁堝簲涓庨殢鏈烘晥搴
    绛旓細1.鍥哄畾鏁堝簲妯″瀷鍜岄殢鏈烘晥搴旀ā鍨嬩箣闂存渶澶х殑涓嶅悓灏卞湪浜庡叾鍩烘湰鍋囪锛屽嵆涓綋涓嶉殢鏃堕棿鏀瑰彉鐨勫彉閲忔槸鍚﹀拰鎵棰勬祴鐨勬垨鑷彉閲忕浉鍏炽2.鍥哄畾鏁堝簲鏇撮傚悎鐮旂┒鏍锋湰涔嬮棿鐨勫尯鍒紝鑰岄殢鏈烘晥搴旈傚悎鐢辨牱鏈潵鎺ㄦ柇鎬讳綋鐗瑰緛銆
  • 鍥哄畾鏁堝簲鍦ㄥ叕寮忎腑鐢ㄤ粈涔堣〃绀
    绛旓細FEexpr銆鍥哄畾鏁堝簲鍦ㄥ叕寮忎腑鐢‵Eexpr琛ㄧず锛屽浐瀹氭晥搴(fixed effect)鏄瘯楠岃璁$殑鍩烘湰姒傚康涔嬩竴锛屽湪绾挎х粺璁′腑锛岀敱鍥哄畾鍥犵礌鎵寮曡捣鐨勩傞潰鏉挎暟鎹拰妯埅闈㈡暟鎹殑鍖哄埆鍦ㄤ簬闈㈡澘澶氫簡涓涓椂闂寸淮搴︼紝鍗充竴涓汉澶勭悊鑳芥í鍚戝湴鍜屽悓鏃堕棿鐨勫叾浣欎汉姣旇緝銆
  • 浠涔堝彨鍥哄畾鏁堝簲妯″瀷?
    绛旓細fe鏄鍥哄畾鏁堝簲妯″瀷 ,re鏄殢鏈烘晥搴旀ā鍨 銆傞潰鏉挎暟鎹ā鍨嬬畝浠嬶紝鍖呮嫭锛欶E锛孯E锛屼簩缁村浐瀹氭晥搴旀ā鍨 锛岃仛绫昏皟鏁村悗鐨勬爣鍑嗚锛屽姩鎬侀潰鏉垮拰闈㈡澘闂ㄦ妯″瀷绛夈傚埄鐢ㄦ柟宸拰鍗忔柟宸煩闃靛鍘熸湁妯″瀷鐨勭瓑鍙蜂袱杈瑰悓鏃惰繘琛岀嚎鎬ц浆鍖栵紝浣垮緱杞寲鍚庢弧瓒砄LS鐨勮姹傦紝浠庤屽緱鍒版棤鍋忎及璁°傚彲浠ュ鐞嗘畫宸殑鑷洖褰掋佹í鍚戠浉鍏炽佸紓鏂瑰樊闂銆俽e鍜宖e...
  • 扩展阅读:固定效应和随机效应 ... 固定效应模型stata命令 ... 什么是双向固定效应 ... 双向固定效应简单理解 ... 著名的十大效应 ... 年份固定效应 ... 什么叫个体固定效应 ... 双重固定效应 ... 混合ols还是固定效应 ...

    本站交流只代表网友个人观点,与本站立场无关
    欢迎反馈与建议,请联系电邮
    2024© 车视网