为什么要虚拟自变量?

1. 在应用logistic回归之前,需要分析资料是否适合该模型。自变量与因变量之间的关系是关键,logistic回归要求自变量与logit(y)线性相关,即与ln(P/1-P)相关。
2. 对于二分类因变量,虚拟变量可帮助揭示更多信息。例如,一个二分类自变量x(四分类:1,2,3,4)与二分类因变量y的关系,若直接分析,p值为0.07,无统计学意义。但转换为虚拟变量后(x2, x3, x4),p值分别为0.08,0.05和0.03,显示了不同分类的统计学意义。
3. 当自变量与y的关系不明确时,使用虚拟变量可减少误差。如果虚拟变量间的比值(OR)显示线性关系,原始的分类可以直接用于分析。
4. 虚拟变量在logistic回归中非常有用,可以帮助发现隐藏的信息。
5. 样本量的估计在研究中非常重要,尤其是在统计学要求高的场合。简单的研究有成熟的公式来估算样本量,但对于复杂的研究,如logistic回归,通常采用经验法。
6. Logistic回归需要较大的样本量以保证结果的可靠性,通常每个结局至少需要10例样本。如果研究因素之间存在多重共线性或其他问题,可能需要更多样本。
7. 尽管没有权威的logistic回归样本量估计方法,但可以通过经验、分析过程细节或专家建议来确定样本量。

  • 铏氭嫙鍙橀噺鍙互鐢ㄦ潵澶勭悊寮傚父鏁版嵁
    绛旓細浣犲ソ锛屼綘鏄棶铏氭嫙鍙橀噺鍙互鐢ㄦ潵瑙i噴寮傚父鏁版嵁鍚锛熻櫄鎷鍙橀噺鍙互鐢ㄤ簬瑙i噴鏁版嵁涓殑寮傚父鍊笺傝櫄鎷熷彉閲忎笉浼氬拷鐣ュ紓甯稿,鑰屾槸娑堥櫎鍏跺奖鍝嶏紝鐒跺悗瀵瑰叾杩涜瑙i噴锛屾墍浠ヨ櫄鎷熷彉閲忓彲浠ョ敤鏉ヨВ閲婂紓甯告暟鎹傝櫄鎷熷彉閲忓張绉拌櫄璁惧彉閲忋佸悕涔夊彉閲忔垨鍝戝彉閲忥紝鐢ㄤ互鍙嶆槧璐ㄧ殑灞炴х殑涓涓汉宸ュ彉閲忥紝鏄噺鍖栦簡鐨鑷彉閲锛岄氬父鍙栧间负0鎴1銆傚紩鍏ュ搼鍙橀噺...
  • 铏氭嫙鍙橀噺鍥炲綊鍒嗘瀽鐨勪紭缂虹偣鏈夊摢浜
    绛旓細铏氭嫙鍙橀噺鍥炲綊鍒嗘瀽鐨勪紭鐐癸細鏄撲簬鐞嗚В鍜岃В閲婏細铏氭嫙鍙橀噺鍥炲綊鍒嗘瀽鏄竴绉嶇畝鍗曟槗鎳傜殑缁熻鍒嗘瀽鏂规硶锛屽彲浠ュ府鍔╂垜浠悊瑙e摢浜涘彉閲忓鐩爣鍙橀噺鏈夋樉钁楀奖鍝嶃傞傜敤浜庡鍏冩暟鎹細铏氭嫙鍙橀噺鍥炲綊鍒嗘瀽鍙互鐢ㄦ潵鍒嗘瀽澶氫釜鑷彉閲瀵圭洰鏍囧彉閲忕殑褰卞搷锛屽彲浠ュ府鍔╂垜浠壘鍒伴噸瑕佺殑棰勬祴鍙橀噺銆傞傜敤浜庡垎绫诲彉閲忥細铏氭嫙鍙橀噺鍥炲綊鍒嗘瀽閫傜敤浜庡垎绫诲彉閲忥紝鍙互鐢ㄦ潵...
  • 浣跨敤绁炵粡缃戠粶鏃,鑷彉閲瑕佽缃铏氭嫙鍙橀噺鍚
    绛旓細瑕併傛牴鎹煡璇SDN瀹樼綉鏄剧ず锛岀缁忕綉缁闇瑕瀵规暟鎹繘琛屾瀬鍊兼爣鍑嗗寲銆傞渶瑕佸杩炵画鍙橀噺杩涜鏋佸兼爣鍑嗗寲锛屽垎绫诲彉閲忥紙鑷彉閲鐨勪竴绉嶏級闇瑕佽浆鍙樹负铏氭嫙鍙橀噺銆
  • 鑷彉閲鏄铏氭嫙鍙橀噺鐢浠涔妯″瀷
    绛旓細鑷彉閲鏄铏氭嫙鍙橀噺鐢ㄤ互涓嬪嚑绉嶆ā鍨:绾挎у洖褰掓ā鍨嬶細閫傜敤浜庤В閲婂洜鍙橀噺涓庝竴涓垨澶氫釜杩炵画鍨嬭嚜鍙橀噺涔嬮棿鐨勫叧绯汇傝櫄鎷熷彉閲忓彲浠ヤ綔涓洪澶栫殑鑷彉閲忥紝鐢ㄤ簬琛ㄧず鍒嗙被鎴栧垎缁勶紝寮曞叆浜嗛澶栫殑鎴窛鍜屾枩鐜囥傞昏緫鍥炲綊妯″瀷锛氶傜敤浜庤В閲婂洜鍙橀噺涓轰簩鍏冨垎绫诲彉閲忕殑鎯呭喌锛屾瘮濡傛槸涓庡惁銆佹垚鍔熶笌澶辫触绛夈傝櫄鎷熷彉閲忓彲浠ヤ綔涓虹嫭鐑紪鐮佽緭鍏ワ紝琛ㄧず涓嶅悓鐨...
  • mplus鎬庝箞璁剧疆铏氭嫙鍙橀噺
    绛旓細灏嗘暟鍒嗗埆鏀惧叆鏀惧叆璋冭妭鍙橀噺妗嗐鑷彉閲妗嗗拰鍥犲彉閲忔涓紝瀵硅皟鑺傚彉閲忚繘琛铏氭嫙鍖栫殑璁剧疆锛岀偣鍑荤户缁紝鏈鍚庣偣纭畾銆傛牴鎹腑鍥藉畨鍏ㄤ俊鎭綉鏌ヨ鏄剧ず锛屽皢鏁板垎鍒斁鍏ユ斁鍏ヨ皟鑺傚彉閲忔銆佽嚜鍙橀噺妗嗗拰鍥犲彉閲忔涓紝瀵硅皟鑺傚彉閲忚繘琛岃櫄鎷熷寲鐨勮缃紝鐐瑰嚮缁х画锛屾渶鍚庣偣纭畾銆傝櫄鎷熷彉閲忓張绉拌櫄璁惧彉閲忋佸悕涔夊彉閲忔垨鍝戝彉閲忥紝鐢ㄤ互鍙嶆槧璐ㄧ殑灞炴х殑...
  • 澶氬厓绾挎у洖褰掓ā鍨嬩腑鐨勮櫄鍙橀噺鍜屽亸鍥炲綊绯绘暟鐨勫悇鑷惈涔夋槸浠涔?_鐧惧害...
    绛旓細铏氬彉閲忓張绉拌櫄璁惧彉閲忋佸悕涔夊彉閲忔垨鍝戝彉閲忥紝鐢ㄤ互鍙嶆槧璐ㄧ殑灞炴х殑涓涓汉宸ュ彉閲忥紝鏄噺鍖栦簡鐨鑷彉閲锛岄氬父鍙栧间负0鎴1銆傚亸鍥炲綊绯绘暟鏄寚鏄鍏冨洖褰掗棶棰樺嚭鐜扮殑涓涓壒娈婃ц川锛屽綋鍏朵粬鐨勫悇鑷彉閲忛兘淇濇寔涓瀹氭椂锛屾寚瀹氱殑鏌愪竴鑷彉閲忔瘡鍙樺姩涓涓崟浣嶏紝鍥犲彉閲弝澧炲姞鎴栧噺灏戠殑鏁板笺铏氭嫙鍙橀噺鏄閲忕粡娴庡涓殑姒傚康锛屼緥濡傦紝鍙嶆槧鏂囧寲...
  • 铏氭嫙鍙橀噺鍥炲綊鍒嗘瀽鐨勪紭缂虹偣鏈夊摢浜
    绛旓細鏄捐憲鍏崇郴锛屽奖鍝嶅己搴︺傜畝鍗曘備紭鐐癸細1銆佽〃鏄鑷彉閲鍜屽洜鍙橀噺涔嬮棿鐨勬樉钁楀叧绯汇2銆佽〃鏄庡涓嚜鍙橀噺瀵逛竴涓洜鍙橀噺鐨勫奖鍝嶅己搴︺傜己鐐癸細绠楁硶鐩稿绠鍗曘
  • 灞傛鍥炲綊鐨勮皟鑺備綔鐢,鑷彉閲鏄垎绫诲彉閲,瑕佽缃负铏氭嫙鍙橀噺鍚
    绛旓細涓闇瑕璁剧疆鑷彉閲鏄簩鍒嗙被涓嶅奖鍝嶄綘浠讳綍鎿嶄綔锛岀洿鎺ユ妸浜屽垎绫昏嚜鍙橀噺涔熺Щ鍏ヨ嚜鍙橀噺妗嗗氨鍙互浜嗐傚彧鏈夊綋鑷彉閲忕殑绫诲埆瓒呰繃涓ょ被鏃舵墠闇瑕侀鍏堣铏氭嫙鍙橀噺
  • 澶氬洜绱犻昏緫鍥炲綊鐨勬帶鍒鍙橀噺闇瑕佽櫄鎷熷彉閲鍚?
    绛旓細澶氬洜绱犻昏緫鍥炲綊鐨勬帶鍒跺彉閲闇瑕佽櫄鎷鍙橀噺銆傚皢鍥犲彉閲忓拰鑷彉閲鏀惧叆鏍煎瓙鐨勫垪琛ㄩ噷锛屼笂闈㈢殑鏄洜鍙橀噺锛屼笅闈㈢殑鏄嚜鍙橀噺锛堝崟鍙橀噺鎷夊叆涓涓紝澶氬洜绱犳媺鍏ュ涓級銆傝缃洖褰掓柟娉曪紝鏄皢鎵鏈夌殑鍙橀噺涓娆$撼鍏ュ埌鏂圭▼銆傜瓑绾ц祫鏂欙紝杩炵画璧勬枡涓嶉渶瑕佽缃櫄鎷熷彉閲忋傚鍥犵礌閫昏緫鍥炲綊鐨勬帶鍒跺彉閲忛渶瑕佽缃櫄鎷熷彉閲忋
  • 闈㈡澘鏁版嵁涓瀹瑕佽櫄鎷熷彉閲鍚
    绛旓細涓嶆槸銆備笉鏄墍鏈夐潰鏉挎暟鎹彉閲忛兘闇瑕杞崲涓铏氭嫙鍙橀噺锛屽彲浠ユ牴鎹洖褰掓ā鍨嬬殑闇瑕佽繘琛屽彉閲忚浆鎹紝濡傛灉鑷彉閲涓殑鍒嗙被鍙橀噺瀵瑰洜鍙橀噺鏈夋樉钁楀奖鍝嶏紝鍒欏彲浠ュ皢鍏惰浆鎹负铏氭嫙鍙橀噺銆傞潰鏉挎暟鎹紝鍗砅anelData锛屼篃鍙滃钩琛屾暟鎹濓紝鏄寚鍦ㄦ椂闂村簭鍒椾笂鍙栧涓埅闈紝鍦ㄨ繖浜涙埅闈笂鍚屾椂閫夊彇鏍锋湰瑙傛祴鍊兼墍鏋勬垚鐨勬牱鏈暟鎹
  • 扩展阅读:什么时候用虚拟变量 ... 虚拟变量有哪些举例 ... 虚拟变量可以取2 3吗 ... 多变量虚拟变量陷阱 ... 举一个虚拟变量数据的例子 ... 虚拟变量不去0和1会怎样 ... 如何避免落入虚拟变量陷阱 ... 自变量是x还是y ... 虚拟变量为什么要去掉一个 ...

    本站交流只代表网友个人观点,与本站立场无关
    欢迎反馈与建议,请联系电邮
    2024© 车视网