如何计算相关系数?
相关系数r2的计算公式是:R2=1-(SSE/SST)。
1、相关系数是研究变量之间线性相关程度的量。相关系数最早由统计学家卡尔·皮尔逊设计,按积差方法计算,以两变量与各自平均值的离差为基础,通过两个离差相乘来反映两变量之间的线性相关程度。
2、相关系数种类较多,较为常用的有皮尔逊相关系数等。相关表和相关图可反映两个变量之间的相互关系及其相关方向,但无法确切地表明两个变量之间相关的程度,相关系数则可以弥补这一不足。
3、相关系数的绝对值越接近于1,表示两个变量的线性相关性越强;相关系数的绝对值越接近于0,表示两个变量之间几乎不存在线性相关。例如,如果相关系数为0.8,这意味着大约80%的观测值变化可以通过模型进行解释,只有约20%的观测值变化无法通过模型进行解释。
4、需要注意的是,相关系数只能用于衡量两个变量之间的线性关系,对于非线性关系或者多个变量之间的关系,需要使用其他的统计指标或者方法。除了皮尔逊相关系数,还有其他几种常用的相关系数,例如斯皮尔曼等级相关系数和肯德尔等级相关系数。
5、斯皮尔曼等级相关系数主要用于对有序变量之间的等级相关程度的度量,其计算方法是将所有观测值按照大小排序,然后对每一个观测值计算其秩次与平均秩次之差,最后对这些差值进行相关系数的计算。
6、肯德尔等级相关系数则主要用于对有序变量之间的等级相关程度的度量,其计算方法是将所有观测值按照大小排序,然后对每一个观测值计算其秩次与平均秩次之差,最后对这些差值进行等级相关系数的计算。
相关系数用于度量两个变量之间的线性关系的强度和方向。最常用的是皮尔逊相关系数。以下是计算皮尔逊相关系数的步骤:
假设有两个变量X和Y,有n个数据点。
计算每个变量的均值:\bar{X} = \frac{\sum_{i=1}^{n} X_i}{n}Xˉ=n∑i=1nXi\bar{Y} = \frac{\sum_{i=1}^{n} Y_i}{n}Yˉ=n∑i=1nYi
计算每个数据点与均值的差:\Delta X_i = X_i - \bar{X}ΔXi=Xi−Xˉ\Delta Y_i = Y_i - \bar{Y}ΔYi=Yi−Yˉ
计算差的乘积:\Sigma (\Delta X_i \cdot \Delta Y_i)Σ(ΔXi⋅ΔYi)
计算每个差的平方:\Sigma (\Delta X_i^2)Σ(ΔXi2)\Sigma (\Delta Y_i^2)Σ(ΔYi2)
计算相关系数:r = \frac{\Sigma (\Delta X_i \cdot \Delta Y_i)}{\sqrt{\Sigma (\Delta X_i^2) \cdot \Sigma (\Delta Y_i^2)}}r=Σ(ΔXi2)⋅Σ(ΔYi2)Σ(ΔXi⋅ΔYi)
其中,\SigmaΣ 表示对所有数据点求和。这样计算得到的 r 的值介于 -1 和 1 之间,分别表示负相关和正相关的强度,0 表示无线性关系。
除了皮尔逊相关系数外,还有其他相关系数,如斯皮尔曼相关系数和肯德尔相关系数,适用于非线性关系或秩次数据。计算方法略有不同,具体取决于所选的相关系数类型。
绛旓細鐨皵閫婄浉鍏崇郴鏁锛圥earson correlation coefficient锛夛細鍏紡锛歳 = (危((X - X̄) * (Y - Ȳ))) / (鈭(危(X - X̄)²) * 鈭(危(Y - Ȳ)²))鍏朵腑锛孹鍜孻鍒嗗埆浠h〃涓や釜鍙橀噺鐨勫彇鍊硷紝X̄鍜Ȳ鍒嗗埆浠h〃涓や釜鍙橀噺鐨勫钩鍧囧笺傛柉鐨皵鏇肩瓑绾х浉鍏崇郴鏁帮紙...
绛旓細鏂规硶涓锛氱毊灏旈婄浉鍏崇郴鏁鐨皵閫婄浉鍏崇郴鏁版槸涓绉嶅父鐢ㄧ殑璁$畻鐩稿叧绯绘暟鐨勬柟娉曘傚畠鍙互琛¢噺涓や釜鍙橀噺涔嬮棿鐨勭嚎鎬у叧绯诲己搴︼紝骞朵笖鍙栧艰寖鍥村湪[-1锛1]涔嬮棿銆傜毊灏旈婄浉鍏崇郴鏁扮殑璁$畻鍏紡濡備笅锛r=cov锛圶锛孻锛/锛坰td锛圶锛*std锛Y锛夛級鍏朵腑锛宑ov锛圶锛孻锛夎〃绀篨鍜孻鐨勫崗鏂瑰樊锛宻td锛圶锛夊拰std锛圷锛夊垎鍒〃绀篨鍜孻鐨勬爣鍑嗗樊銆...
绛旓細鍒楃淮鍧︾浉鍏崇郴鏁板叕寮忥細鐢ㄤ簬璁$畻涓や釜鍒嗙被鍨嬪彉閲忎箣闂寸殑鐩稿叧绋嬪害銆 鍏跺叕寮忎负锛歳 = (鈭慜 - E) / 鈭 (鈭慜 - u) (鈭慐 - u)锛屽叾涓璻涓虹浉鍏崇郴鏁帮紝O涓鸿娴嬮鏁帮紝E涓烘湡鏈涢鏁帮紝u涓烘湡鏈涢鏁扮殑鎬诲拰銆鐨皵閫婄浉鍏崇郴鏁鍏紡锛氱敤浜庤绠椾袱涓繛缁瀷鍙橀噺涔嬮棿鐨勭浉鍏崇▼搴︺ 鍏跺叕寮忎负锛歳 = 鈭 (Xi - X̄)...
绛旓細鐩稿叧绯绘暟鐨勮绠楀叕寮忔槸r = cov / 銆傝В閲婂涓嬶細鐩稿叧绯绘暟鐨勫畾涔 鐩稿叧绯绘暟鏄敤鏉ラ噺鍖栦袱涓彉閲忎箣闂寸嚎鎬у叧绯荤殑寮哄害鍜屾柟鍚戠殑缁熻閲忋傚畠閫氳繃灞曠ず涓や釜鍙橀噺涔嬮棿鐨勫崗鏂瑰樊涓庡畠浠悇鑷殑鏍囧噯宸殑姣斿硷紝涓烘垜浠彁渚涗簡浜岃呭叧鑱旂▼搴︾殑鏁板煎寲琛ㄨ揪銆傚叾涓紝X鍜孻浠h〃涓や釜鍙橀噺锛宑ov琛ㄧずX鍜孻鐨勫崗鏂瑰樊锛屜儀鍜屜儁鍒嗗埆浠h〃X鍜孻鐨...
绛旓細鐩稿叧绯绘暟鍏紡鏄乆Y=Cov(X锛孻)/鈭氾蓟D(X)]鈭氾蓟D(Y)]銆傚叕寮忎腑Cov(X锛孻)涓篨锛孻鐨勫崗鏂瑰樊锛孌(X)銆丏(Y)鍒嗗埆涓篨銆乊鐨勬柟宸傚叕寮忋傝嫢Y=a+bX锛屽垯鏈夛細浠(X) =渭锛孌(X) =蟽銆傚垯E(Y) = b渭锛媋锛孌(Y) = b蟽銆E(XY) = E(aX + bX) = a渭锛媌(蟽锛嬑硷級銆侰ov(X锛孻) =...
绛旓細鍏充簬鐩稿叧绯绘暟璁$畻鍏紡涓猴細蟻XY=Cov(X锛孻)/鈭氾蓟D(X)]鈭氾蓟D(Y)]锛屽叕寮忎腑Cov(X锛孻)涓篨锛孻鐨勫崗鏂瑰樊锛孌(X)銆丏(Y)鍒嗗埆涓篨銆乊鐨勬柟宸
绛旓細鍏朵腑-1琛ㄧず瀹屽叏璐熺浉鍏筹紝1琛ㄧず瀹屽叏姝g浉鍏筹紝0琛ㄧず鏃犵浉鍏虫с鐩稿叧绯绘暟鐨璁$畻鍏紡濡備笅锛歳 = 危[(xi-x̄)(yi-ȳ)] / 鈭歔危(xi-x̄)² 危(yi-ȳ)²]鍏朵腑锛寈i鍜寉i鍒嗗埆琛ㄧず涓や釜鍙橀噺涓瘡涓瀵熷硷紝x̄鍜ȳ琛ㄧず鍚勮嚜鍙橀噺鐨勫钩鍧囧硷紝危琛ㄧず姹傚拰銆
绛旓細鐩稿叧绯绘暟r鐨勮绠楀叕寮忔槸蟻XY=Cov(X锛孻)/鈭氾蓟D(X)]鈭氾蓟D(Y)]銆傚叕寮忔弿杩帮細鍏紡涓瑿ov(X锛孻)涓篨锛孻鐨勫崗鏂瑰樊锛孌(X)銆丏(Y)鍒嗗埆涓篨銆乊鐨勬柟宸傝嫢Y=a+bX锛屽垯鏈夛細浠(X) =渭锛孌(X) =蟽銆傚垯E(Y) = b渭锛媋锛孌(Y) = b蟽銆E(XY) = E(aX + bX) = a渭锛媌(蟽锛嬑硷級銆侰ov...
绛旓細1. 鐨皵閫婄浉鍏崇郴鏁锛圥earson correlation coefficient锛夛細鐨皵閫婄浉鍏崇郴鏁拌 閲忕殑鏄袱涓彉閲忎箣闂寸殑绾挎у叧绯诲己搴︼紝鍙栧艰寖鍥翠负-1鍒1銆傚叕寮忓涓嬶細r = (危((X - X̄)(Y - Ȳ))) / (n * 蟽X * 蟽Y)鍏朵腑锛宺涓虹毊灏旈婄浉鍏崇郴鏁帮紝X鍜孻鍒嗗埆涓轰袱涓彉閲忕殑鍙栧硷紝X̄鍜Ȳ鍒嗗埆涓轰袱涓...
绛旓細璁$畻涓や釜鍙橀噺涔嬮棿鐨勭浉鍏崇郴鏁伴氬父浣跨敤鐨皵閫婄浉鍏崇郴鏁锛圥earson correlation coefficient锛夛紝杩欐槸琛¢噺涓や釜杩炵画鍙橀噺涔嬮棿绾挎у叧绯诲己搴﹀拰鏂瑰悜鐨勪竴绉嶇粺璁℃柟娉曘備互涓嬫槸璁$畻鐨皵閫婄浉鍏崇郴鏁扮殑鍩烘湰姝ラ锛1. **鏁版嵁鍑嗗**锛氱‘淇濅綘鏈変袱涓暟鍊煎瀷鍙橀噺鐨勬暟鎹泦锛屼笖杩欎袱涓彉閲忛兘鏄嫭绔嬭娴嬪硷紝鍗虫瘡涓娴嬪煎搴斾竴瀵规暟鎹偣銆2....