机器之心编译的文章“线性回归的局限性”如何?

原文链接:http://tecdat.cn/?p=20882 

 

1导言

这篇文章探讨了为什么使用广义相加模型 是一个不错的选择。为此,我们首先需要看一下线性回归,看看为什么在某些情况下它可能不是最佳选择。


2回归模型

假设我们有一些带有两个属性Y和X的数据。如果它们是线性相关的,则它们可能看起来像这样:

a<-ggplot(my_data, aes(x=X,y=Y))+geom_point()+

 

为了检查这种关系,我们可以使用回归模型。线性回归是一种使用X来预测变量Y的方法。将其应用于我们的数据将预测成红线的一组值:

a+geom_smooth(col="red", method="lm")+

 

这就是“直线方程式”。根据此等式,我们可以从直线在y轴上开始的位置(“截距”或α)开始描述,并且每个单位的x都增加了多少y(“斜率”),我们将它称为x的系数,或称为β)。还有一点自然的波动,如果没有的话,所有的点都将是完美的。我们将此称为“残差”(ϵ)。数学上是:

或者,如果我们用实际数字代替,则会得到以下结果:

 

 

这篇文章通过考虑每个数据点和线之间的差异(“残差)然后最小化这种差异来估算模型。我们在线的上方和下方都有正误差和负误差,因此,通过对它们进行平方并最小化“平方和”,使它们对于估计都为正。这称为“普通最小二乘法”或OLS。


3非线性关系如何?

因此,如果我们的数据看起来像这样,我们该怎么办:

 

我们刚刚看到的模型的关键假设之一是y和x线性相关。如果我们的y不是正态分布的,则使用广义线性模型 (Nelder&Wedderburn,1972),其中y通过链接函数进行变换,但再次假设f(y)和x线性相关。如果不是这种情况,并且关系在x的范围内变化,则可能不是最合适的。我们在这里有一些选择:



  • 绾挎у洖褰鍏紡渭=伪+尾x涓殑伪鍜屛蹭袱涓郴鏁扮殑鎰忎箟鏄粈涔?
    绛旓細渭=伪+尾x涓紝伪绉板洖褰掔洿绾跨殑锛堟埅璺濓級锛屛茬О鍥炲綊鐩寸嚎鐨勶紙鏂滅巼锛夈傛埅璺濆氨鏄洖褰掔洿绾垮悜y鏂瑰悜骞崇Щ绂诲師鐐圭殑璺濈锛屾枩鐜囧氨鏄洖褰掔洿绾跨殑鍊炬枩鐨勭▼搴︺偽,尾绯绘暟鐨勫疄闄呮剰涔変笌瀹為獙鏁版嵁鏈夊叧锛屾瘮濡傚尰瀛﹀疄楠屾暟鎹笌宸ョ▼瀹為獙鏁版嵁寰楀嚭鐨勫洖褰掔洿绾课,尾绯绘暟瀹為檯鎰忎箟鍙兘灏变笉鍚屼簡銆绾挎у洖褰涔熷彲鐢‥XCEL銆
  • 绾挎妯″瀷鐨勭被鍨嬪拰鐗圭偣鏈夊摢浜?
    绛旓細涓銆佸熀鐭充箣绾挎у洖褰</ 绾挎у洖褰掞紝浣滀负瀹舵棌涓殑鍩虹煶锛屽畠鐨勭洰鏍囨槸绮惧噯鎹曟崏杈撳叆涓庤緭鍑虹殑鐩寸嚎鑱旂郴銆傛渶灏忎簩涔樻硶鐨勫鐢紝浣垮緱妯″瀷鍦ㄦ嫙鍚堣繃绋嬩腑杩芥眰璇樊鏈灏忓寲锛岀‘淇濅簡鍏跺湪棰勬祴棰嗗煙鐨勭簿纭у拰骞挎硾閫傜敤鎬э紝濡傚ぉ姘旈娴嬨佽偂甯傛尝鍔紝鐢氳嚦鏄晢涓氱瓥鐣ョ殑鍒跺畾銆傜壒鐐瑰涓嬶細褰㈠紡绠娲</ - 绾挎у洖褰掔殑鏁板琛ㄨ揪鐩磋锛屾槗浜庣悊瑙...
  • 绾挎у洖褰鏂圭▼姹俠鍏紡鏄粈涔堟椂鍊欏鐨
    绛旓細浣垮緱杩欎釜璺濈涔嬪拰鏈灏忋傞氳繃姹傚鍙互寰楀埌鏈灏忓寲璺濈涔嬪拰鐨勮В鏋愯В锛屼粠鑰岃В鍑 b 鍏紡銆傛讳箣锛绾挎у洖褰鏂圭▼涓殑 b 鍏紡鏄湪楂樹腑鏁板涓涔犵殑锛屽畠鏄熀浜庢渶灏忎簩涔樻硶鎺ㄥ鍑烘潵鐨勩傜悊瑙g嚎鎬у洖褰掓柟绋嬬殑鍩虹鐭ヨ瘑瀵逛簬鏈潵鐨鏈哄櫒瀛︿範鍜屾暟鎹垎鏋愬伐浣滈潪甯搁噸瑕侊紝鍥犳鎴戜滑搴旇璁ょ湡瀵瑰緟瀛︿範杩欎釜姒傚康銆
  • 鏈哄櫒瀛︿範鐨勪紭缂虹偣
    绛旓細鏈哄櫒瀛︿範鐨勪紭缂虹偣鍒嗕负绾挎у洖褰銆侀昏緫鍥炲綊鍜孠NN涓夋柟闈㈡潵璇淬備竴銆佺嚎鎬у洖褰 鍘熺悊锛氶氳繃灞炴х殑绾挎х粍鍚堟潵杩涜棰勬祴鐨勭嚎鎬фā鍨嬶紝鍏剁洰鐨勬槸鎵惧埌涓鏉$洿绾挎垨鑰呬竴涓钩闈㈡垨鑰呬竴涓秴骞抽潰锛屼娇寰楅娴嬪间笌鐪熷疄鍊间箣闂寸殑璇樊鏈灏忓寲銆備紭鐐癸細1銆佹濇兂绠鍗曪紝瀹规槗瀹炵幇銆傚缓妯¤繀閫燂紝瀵逛簬灏忔暟鎹噺銆佺畝鍗曠殑鍏崇郴寰堟湁鏁堛2銆佹槸璁稿寮哄ぇ鐨...
  • 澶氬厓绾挎у洖褰掔殑涓句緥
    绛旓細澶氬厓绾挎у洖褰掔殑鍩烘湰鍘熺悊鍜屽熀鏈绠楄繃绋嬩笌涓鍏冪嚎鎬у洖褰掔浉鍚岋紝浣嗙敱浜庤嚜鍙橀噺涓暟澶氾紝璁$畻鐩稿綋楹荤儲锛屼竴鑸湪瀹為檯涓簲鐢ㄦ椂閮借鍊熷姪缁熻杞欢銆傝繖閲屽彧浠嬬粛澶氬厓绾挎у洖褰掔殑涓浜涘熀鏈棶棰樸備絾鐢变簬鍚勪釜鑷彉閲忕殑鍗曚綅鍙兘涓嶄竴鏍凤紝姣斿璇翠竴涓秷璐规按骞崇殑鍏崇郴寮忎腑锛屽伐璧勬按骞炽佸彈鏁欒偛绋嬪害銆佽亴涓氥佸湴鍖恒佸搴礋鎷呯瓑绛夊洜绱犻兘浼氬奖鍝嶅埌...
  • 鍏充簬绾挎у洖褰,浠ヤ笅璇存硶閿欒鐨勬槸( ) A.鑷彉閲忓彇鍊间竴瀹氭椂,鍥犲彉閲忕殑鍙栧煎甫...
    绛旓細D 渚濇嵁涓や釜鍙橀噺鍏锋湁鐩稿叧鍏崇郴鐨勬剰涔夊彲鐭,A姝g‘;鏍规嵁鏁g偣鍥剧殑瀹氫箟寰桞姝g‘;鏍规嵁鏈灏忎簩涔樻硶鐨勬濇兂,鎵姹傚緱鐨勫洖褰掔洿绾,婊¤冻涓缁勬暟鎹搴旂偣鍒拌鐩寸嚎鐨勮窛绂绘渶灏,鍗绾挎у洖褰鐩寸嚎鏂圭▼鏈鑳戒唬琛ㄨ娴嬪紉,y涔嬮棿鐨勫叧绯,鏁匔姝g‘;D涓嶆纭,鐢辩浉鍏崇郴鏁皉 xy 鎰忎箟鍙煡鐩稿叧绯绘暟r xy 瓒婃帴杩戜簬1,鍒欑嚎鎬х浉鍏虫ц秺寮.
  • 闄嶇淮(鐧鹃潰鏈哄櫒瀛︿範)
    绛旓細淇濈暀涓昏淇℃伅锛夈傜劧鑰岋紝PCA涔熸湁鍏跺眬闄愭э紝闈㈠澶嶆潅鐨勬暟鎹粨鏋勶紝鍏舵晥鏋滃彲鑳戒笉灏藉浜烘剰銆傝繖鏃讹紝鎴戜滑鍙互杞岃冭檻闈炵嚎鎬ч檷缁存柟娉曪紝浠ラ傚簲鏇翠赴瀵岀殑鏁版嵁鐗规с傚湪PCA鐨勫熀纭涓婏紝鏈灏忓钩鏂硅宸悊璁轰负闄嶇淮杩囩▼鎻愪緵浜嗗彟涓绉嶈瑙掞紙绾挎у洖褰掔殑寤朵几锛屾渶灏忓寲璇樊鐨勪紭鍖栵級銆傚畠瀵绘壘鏈浣虫姇褰辨柟鍚戯紝灏嗘暟鎹偣鎷熷悎鍒颁竴涓秴骞抽潰涓...
  • 鏄庡勾涓鏈堣偂绁ㄤ环鏍煎睘浜庨昏緫鍥炲綊闂鍚
    绛旓細鏈鏂板彂甯 銆愬ぇ閬撹嚦绠銆鏈哄櫒瀛︿範绠楁硶涔嬮昏緫鍥炲綊(Logistic Regression)璇﹁В(闄勪唬鐮)---闈炲父閫氫織鏄撴噦!閫昏緫鍥炲綊璇︾粏鎺ㄥ,闄刧ithub浠g爜缁х画璁块棶绗簩閲嶈鏋侀檺鍏紡鎺ㄥ杩囩▼_鏈哄櫒瀛︿範鈥斺斾竴鏂囪瑙i昏緫鍥炲綊銆岄檮璇︾粏鎺ㄥ鍜屼唬鐮併...鍦ㄤ箣鍓鐨勬枃绔褰撲腑,鎴戜滑鎺ㄥ浜绾挎у洖褰掔殑鍏紡,绾挎у洖褰掓湰璐ㄦ槸绾挎у嚱鏁,妯″瀷鐨勫師鐞嗕笉闅,鏍稿績鏄眰瑙...
  • 鏈灏忎簩涔樻硶姹绾挎у洖褰鏂圭▼涓殑绯绘暟a,b鎬庝箞姹
    绛旓細鐢ㄦ渶灏忎簩涔樻硶姹鍥炲綊鐩寸嚎鏂圭▼涓殑a,b鏈変笅闈㈢殑鍏紡锛氭渶灏忎簩涔樻硶锛氭荤宸笉鑳界敤n涓宸箣鍜屾潵琛ㄧず锛岄氬父鏄敤绂诲樊鐨勫钩鏂瑰拰锛屽嵆浣滀负鎬荤宸紝骞朵娇涔嬭揪鍒版渶灏忥紝杩欐牱鍥炲綊鐩寸嚎灏辨槸鎵鏈夌洿绾夸腑Q鍙栨渶灏忓肩殑閭d竴鏉★紝杩欑浣库滅宸钩鏂瑰拰鏈灏忊濈殑鏂规硶锛屽彨鍋氭渶灏忎簩涔樻硶锛氱敱浜庣粷瀵瑰间娇寰楄绠椾笉鍙橈紝鍦ㄥ疄闄呭簲鐢ㄤ腑...
  • 鍦‥xcel鍜宻pss涓繘琛屽鍏绾挎у洖褰鍒嗘瀽,濡備綍璁$畻姣忎釜鑷彉閲忓垎鍒鍥犲彉閲...
    绛旓細鍦‥xcel鍜宻pss涓繘琛屽鍏绾挎у洖褰鍒嗘瀽,璁$畻姣忎釜鑷彉閲忓垎鍒鍥犲彉閲忕殑瑙i噴閲忕殑鐩稿叧鍐呭濡備笅:鐢⊿PSS杩涜澶氬厓鍥炲綊浠ュ悗,绯荤粺浼氳嚜鍔ㄧ粰鍑簒1銆亁2鍜寈3(浠庡ぇ鍒板皬)鐨凴鐨勫钩鏂瑰拰,鐩稿噺灏辨槸瑙i噴鐜囥 鏈洖绛旂敱鐢佃剳缃戠粶鍒嗙被杈句汉 閮己鎺ㄨ崘 涓炬姤| 绛旀绾犻敊 | 璇勮 0 1 GoddenSave 閲囩撼鐜:82% 鏉ヨ嚜鍥㈤槦:鍔炲叕杞欢瀹炶返 鎿呴暱: 鍏跺畠...
  • 扩展阅读:智能写作 ... 美国《女机器人》 ... 机器人指令对照表 ... visual studio ... 《机器人女友》 ... 《机器人伴侣》 ... 电影名《机器人之恋》 ... 《机器人诺比》 ... 科幻片《机器人亚当》 ...

    本站交流只代表网友个人观点,与本站立场无关
    欢迎反馈与建议,请联系电邮
    2024© 车视网