求问统计学里的P值是什么含义?请用通俗易懂的语言解释,谢谢! 统计学中t值p值是什么意思?怎么计算?

\u6025\u8bf7\u95ee\u7edf\u8ba1\u5b66P\u503c\u7684\u610f\u4e49\uff0c\u8c22\u8c22


1\u3001t\u6307\u7684\u662fT\u68c0\u9a8c\uff0c\u4ea6\u79f0student t\u68c0\u9a8c\uff08Student's t test\uff09\uff0c\u4e3b\u8981\u7528\u4e8e\u6837\u672c\u542b\u91cf\u8f83\u5c0f\uff08n<30\uff09\uff0c\u603b\u4f53\u6807\u51c6\u5dee\u03c3\u672a\u77e5\u7684\u6b63\u6001\u5206\u5e03\u8d44\u6599\u3002
\u8ba1\u7b97\uff1at\u7684\u68c0\u9a8c\u662f\u53cc\u4fa7\u68c0\u9a8c\uff0c\u53ea\u8981T\u503c\u7684\u7edd\u5bf9\u503c\u5927\u4e8e\u4e34\u754c\u503c\u5c31\u662f\u4e0d\u62d2\u7edd\u539f\u5047\u8bbe\u3002
2\u3001P\u503c\uff08P value\uff09\u5c31\u662f\u5f53\u539f\u5047\u8bbe\u4e3a\u771f\u65f6\u6240\u5f97\u5230\u7684\u6837\u672c\u89c2\u5bdf\u7ed3\u679c\u6216\u66f4\u6781\u7aef\u7ed3\u679c\u51fa\u73b0\u7684\u6982\u7387\u3002\u5982\u679cP\u503c\u5f88\u5c0f\uff0c\u8bf4\u660e\u539f\u5047\u8bbe\u60c5\u51b5\u7684\u53d1\u751f\u7684\u6982\u7387\u5f88\u5c0f\uff0c\u800c\u5982\u679c\u51fa\u73b0\u4e86\uff0c\u6839\u636e\u5c0f\u6982\u7387\u539f\u7406\uff0c\u6211\u4eec\u5c31\u6709\u7406\u7531\u62d2\u7edd\u539f\u5047\u8bbe\uff0cP\u503c\u8d8a\u5c0f\uff0c\u6211\u4eec\u62d2\u7edd\u539f\u5047\u8bbe\u7684\u7406\u7531\u8d8a\u5145\u5206\u3002
\u8ba1\u7b97\uff1a\u6982\u7387\u5b9a\u4e49\u4e3a\uff1aP(A)=m/n\uff0c\u5176\u4e2dn\u8868\u793a\u8be5\u8bd5\u9a8c\u4e2d\u6240\u6709\u53ef\u80fd\u51fa\u73b0\u7684\u57fa\u672c\u7ed3\u679c\u7684\u603b\u6570\u76ee\u3002m\u8868\u793a\u4e8b\u4ef6A\u5305\u542b\u7684\u8bd5\u9a8c\u57fa\u672c\u7ed3\u679c\u6570\u3002

\u62d3\u5c55\u8d44\u6599\u7edf\u8ba1\u5b66\u662f\u5173\u4e8e\u8ba4\u8bc6\u5ba2\u89c2\u73b0\u8c61\u603b\u4f53\u6570\u91cf\u7279\u5f81\u548c\u6570\u91cf\u5173\u7cfb\u7684\u79d1\u5b66\u3002\u5b83\u662f\u901a\u8fc7\u641c\u96c6\u3001\u6574\u7406\u3001\u5206\u6790\u7edf\u8ba1\u8d44\u6599\uff0c\u8ba4\u8bc6\u5ba2\u89c2\u73b0\u8c61\u6570\u91cf\u89c4\u5f8b\u6027\u7684\u65b9\u6cd5\u8bba\u79d1\u5b66\u3002\u7531\u4e8e\u7edf\u8ba1\u5b66\u7684\u5b9a\u91cf\u7814\u7a76\u5177\u6709\u5ba2\u89c2\u3001\u51c6\u786e\u548c\u53ef\u68c0\u9a8c\u7684\u7279\u70b9\uff0c\u6240\u4ee5\u7edf\u8ba1\u65b9\u6cd5\u5c31\u6210\u4e3a\u5b9e\u8bc1\u7814\u7a76\u7684\u6700\u91cd\u8981\u7684\u65b9\u6cd5\uff0c\u5e7f\u6cdb\u9002\u7528\u4e8e\u81ea\u7136\u3001\u793e\u4f1a\u3001\u7ecf\u6d4e\u3001\u79d1\u5b66\u6280\u672f\u5404\u4e2a\u9886\u57df\u7684\u5206\u6790\u7814\u7a76\u3002
\u53c2\u8003\u8d44\u6599\uff1a\u767e\u5ea6\u767e\u79d1-\u7edf\u8ba1\u5b66

专业上,p值为结果可信程度的一个递减指标,p值越大,我们越不能认为样本中变量的关联是总体中各变量关联的可靠指标。p值是将观察结果认为有效即具有总体代表性的犯错概率。如p=0.05提示样本中变量关联有5%的可能是由于偶然性造成的。即

假设总体中任意变量间均无关联,我们重复类似实验,会发现约20个实验中有一个实验,我们所研究的变量关联将等于或强于我们的实验结果。(这并不是说如果变量间存在关联,我们可得到5%或95%次数的相同结果。

当总体中的变量存在关联,重复研究和发现关联的可能性与设计的统计学效力有关。)在许多研究领域,0.05的p值通常被认为是可接受错误的边界水平。

扩展资料

所分析变量在总体中呈正态分布,即满足所谓的正态假设。许多观察变量的确是呈正态分布的,这也是正态分布是现实世界的基本特征的原因。

当人们用在正态分布基础上建立的检验分析非正态分布变量的数据时问题就产生了,。这种条件下有两种方法:一是用替代的非参数检验(即无分布性检验),但这种方法不方便,因为从它所提供的结论形式看,这种方法统计效率低下、不灵活。

另一种方法是:当确定样本量足够大的情况下,通常还是可以使用基于正态分布前提下的检验。后一种方法是基于一个相当重要的原则产生的,该原则对正态方程基础上的总体检验有极其重要的作用。即,随着样本量的增加,样本分布形状趋于正态,即使所研究的变量分布并不呈正态。

参考资料来源:百度百科-P值



你需要的可能是一个故事。


从前,你有个朋友,他每月开一辆小货车去市场里采购东西,然后再把所有这些东西转卖出去。月复一月,年复一年。


但是,因为市场行情变动,每一个月他卖东西得到的毛爷爷数目并不一样,差不多有个5000块钱左右吧。你呢能看到他每个月的收入统计。


时间长了,有一次,无聊的你准备戏耍一下这个无辜的小伙伴,你偷偷在他的小货车上装了一小瓶尿。既然他肯定会在集市上卖掉所有东西,那么这一小瓶尿他一定也会卖出去,只不过这瓶尿的价格可能也就是零吧。


这一次他赚了5400块,这可比以往的平均数5000块钱还多。那问题就来了:为什么这个月他赚的比平常多呢?


有两种情况:其一,你那瓶尿很值钱,他自然会多赚;其二,你那瓶尿根本不值钱,他多赚了只是因为这个月市场上行情不错。


那到底是哪种情况呢?这个问题的实质是,你那瓶尿到底值不值钱。如果这瓶尿根本不值钱,那他卖东西和以前卖东西的情况没什么两样,只不过是市场行情影响而已。于是,你翻了他以前卖东西的纪录,算了算所有他的个人月收入超过5400块的概率,大概是0.1。也就是说在你这瓶尿没有任何价值的情况下,只靠市场行情,他只有0.1的概率卖到5400块。


所以你得出的结论是,你的那瓶尿有价值,你这个结论的p值就是0.1。


===================

故事讲完了,来分析一下。


为什么要用p值?换句话说,为什么要做推断统计?我想,p值到底是啥并不重要,我知道你做研究时多半只是负责看看p到底有没有比0.05小的。而这个问题,才是我最想告诉你的。

推断统计,之所以要“推断”,是因为我们没有办法正面验证某种情况。在这个故事中,你以前没干过偷偷把一瓶尿放在车上的事儿,他以前也没卖过你的尿,所以尽管你有的是他的销售数据,但那些旧账本没办法正面告诉你你的尿到底值不值钱。


这就是“没办法正面验证”,在这样的情况下,你就没办法了么?非也,我们可以换个角度考虑这个问题,假设“你那瓶尿毫无价值”是成立的,他卖了这瓶尿跟没卖时候没什么两样,那这一次和以往自然也没什么两样。既然这次卖东西和以往一样,那旧账本中的记录就能帮到你了。你可以算算旧账本,他在没卖过你那瓶尿的情况下,赚到5400块及以上的可能性(概率),这个概率就是“你那瓶尿毫无价值”的概率,这里也就是0.1.


这样,“你那瓶尿有价值”的概率,当然就是这个假设的相反情况,也就是0.9,这也是你的假设成立的可能性。


那这个p值到底显著与否呢?那得看市场行情。这里市场行情是随机的,所以“显著”与否简单点就是在说你那瓶尿能不能跑赢市场。业内经常以两个标准差作为衡量“显著”的标准。绝大多数情况下,作为随机变量的市场行情服从正态分布。而正态分布中,超过两个标准差的概率是0.05,这也就是为什么大家要拿0.05作为“公认”的显著性水平尺度了。


统计推断,核心就是反证法。你那瓶尿没价值的可能性越小,反而越能证明你那瓶尿有价值。


“在原假设成立的情况下抽到的统计量与原假设之间的距离至少等于样本计算值与原假设之间的距离”

这是你的书上写的定义,但是很明显,你把结尾最重要的“的概率”三个字漏掉了。正常情况下,这个定义应该是

“在原假设成立的情况下抽到的统计量与原假设之间的距离至少等于样本计算值与原假设之间的距离的概率”

不信你可以再看看你的书。


但是,怎么可以容忍这么反人类的定义?我们来用这个故事做个转换吧:

“在原假设成立的情况下” -> 在你那瓶尿不值钱情况下

“抽到的统计量与原假设之间的距离” -> 他旧账本里的销售记录

“至少等于” -> 大于或等于

"样本计算值与原假设之间的距离" -> 他这一次的销售记录(5400块)

“的概率” -> 的概率


连起来读读,p值的定义就变成:

“在你那瓶尿不值钱的情况下,他旧账本里的销售记录大于或等于他这一次的销售记录(5400块钱)(这个事件发生)的概率。”


这一次,好懂了点吗?



最后要说明,说得通俗易懂是要承担风险的,因为通俗很可能意味着不严谨,易懂很可能意味着不周全。以上有很多有失严谨之处,希望题主还要多多看书哇。


最后的最后,为什么我要用“一瓶尿”这样一个非常粗俗不雅的故事?因为所谓的p value,不就是用来证明你的pee value的么?


个人观点,仅供参考!



  • 姹傞棶缁熻瀛﹂噷鐨凱鍊兼槸浠涔堝惈涔?璇风敤閫氫織鏄撴噦鐨勮瑷瑙i噴,璋㈣阿!_鐧惧害鐭...
    绛旓細涓撲笟涓婏紝p鍊间负缁撴灉鍙俊绋嬪害鐨勪竴涓掑噺鎸囨爣锛宲鍊艰秺澶э紝鎴戜滑瓒婁笉鑳借涓烘牱鏈腑鍙橀噺鐨勫叧鑱旀槸鎬讳綋涓悇鍙橀噺鍏宠仈鐨勫彲闈犳寚鏍囥俻鍊兼槸灏嗚瀵熺粨鏋滆涓烘湁鏁堝嵆鍏锋湁鎬讳綋浠h〃鎬х殑鐘敊姒傜巼銆傚p=0.05鎻愮ず鏍锋湰涓彉閲忓叧鑱旀湁5%鐨勫彲鑳芥槸鐢变簬鍋剁劧鎬ч犳垚鐨勩傚嵆 鍋囪鎬讳綋涓换鎰忓彉閲忛棿鍧囨棤鍏宠仈锛屾垜浠噸澶嶇被浼煎疄楠岋紝浼氬彂鐜扮害20涓...
  • 缁熻瀛︿腑鐨刾鍊兼槸浠涔堟剰鎬?
    绛旓細缁熻瀛︿腑鐨刾鍊间唬琛ㄤ簡缁熻鏄捐憲鎬銆備竴銆乸鍊肩殑瀹氫箟 p鍊兼槸鎸囧湪鍋囪妫楠屼腑锛鏍规嵁瑙傚療鍒扮殑鏁版嵁璁$畻鍑烘潵鐨勪竴涓鐜囧銆傚畠琛ㄧず浜嗗湪闆跺亣璁炬垚绔嬬殑鏉′欢涓嬶紝瑙傚療鍒扮殑缁熻閲忔垨鏇存瀬绔儏鍐靛嚭鐜扮殑姒傜巼銆俻鍊艰秺灏忥紝璇存槑瑙傚療鍒扮殑鏁版嵁涓庨浂鍋囪鐩哥煕鐩剧殑鍙兘鎬ц秺澶э紝鍥犳鍙互寰楀嚭瀵归浂鍋囪鐨勬嫆缁濄傞氬父锛屽綋p鍊煎皬浜庨鍏堣瀹...
  • 缁熻瀛鍊兼槸浠涔堟剰鎬?
    绛旓細p鍊兼槸缁熻瀛︿腑鐢ㄦ潵琛¢噺鍋囪妫楠岀粨鏋滅殑涓涓寚鏍銆傚叿浣撴潵璇达紝p鍊间唬琛ㄤ簡鍦ㄩ浂鍋囪涓虹湡鐨勬儏鍐典笅锛岃瀵熷埌鐨勬暟鎹垨鏇存瀬绔暟鎹嚭鐜扮殑姒傜巼銆傚鏋減鍊煎皬浜庢垨绛変簬0.05锛岄氬父璁や负杩欎釜缁撴灉鏄粺璁℃樉钁楃殑锛屾剰鍛崇潃瑙傚療鍒扮殑鏁版嵁鍑虹幇鐨勬鐜囬潪甯镐綆锛屽鏋滀笉鏄洜涓洪浂鍋囪鏄湡瀹炵殑锛岄偅涔堣繖绉嶆暟鎹嚭鐜扮殑鍙兘鎬у緢灏忋俻鍊间笌缁撴灉鐪...
  • 缁熻瀛鍊间唬琛ㄤ粈涔堟剰鎬?
    绛旓細p鍊肩粺璁″鎰忎箟鏄細缁熻瀛鍊煎嵆姒傜巼锛屽弽鏄犳煇涓浜嬩欢鍙戠敓鐨勫彲鑳芥уぇ灏銆備笉鍚岀殑P鏁板兼墍琛ㄨ揪鐨勫惈涔変篃鏄笉涓鏍风殑銆傜粺璁″鏍规嵁鏄捐憲鎬ф楠屾柟娉曟墍寰楀埌鐨凱 鍊硷紝涓鑸互P < 0.05 涓烘湁缁熻瀛﹀樊寮傦紝 P<0.01 涓烘湁鏄捐憲缁熻瀛﹀樊寮傦紝P<0.001涓烘湁鏋佸叾鏄捐憲鐨勭粺璁″宸紓銆鍏跺惈涔夋槸鏍锋湰闂寸殑宸紓鐢辨娊鏍疯宸墍鑷寸殑姒...
  • 缁熻瀛鍊兼槸浠涔堟剰鎬
    绛旓細缁熻瀛︿腑鐨刾鍊兼槸浠涔堬紵p鍊硷紝鍗虫樉钁楁ф按骞筹紝鏄 閲忓亣璁炬楠屼腑璇佹嵁寮哄害鐨勪竴涓噸瑕佹寚鏍銆傚畠浠h〃浜嗗湪闆跺亣璁句负鐪熺殑鎯呭喌涓嬶紝瑙傚療鍒扮殑鏁版嵁鎴栨洿鏋佺鏁版嵁鍑虹幇鐨勬鐜囥俻鍊肩殑鍙栧艰寖鍥翠粠0鍒1锛岄氬父鎴戜滑璁や负p鍊艰秺灏忥紝鎷掔粷闆跺亣璁剧殑璇佹嵁灏辫秺寮恒傚浣曡В璇籶鍊硷紵瑙hp鍊兼椂锛屼竴鑸細鍙傜収棰勫厛璁惧畾鐨勬樉钁楁ф按骞筹紙閫氬父鏄...
  • 缁熻瀛︿腑p鍊肩殑鎰忎箟鏄粈涔?
    绛旓細p鍊锛屼篃绉版樉钁楁у兼垨鑰匰ig.鍊硷紝鐢ㄤ簬鎻忚堪鏌愪欢浜嬫儏鍙戠敓鐨勬鐜囨儏鍐碉紝鍏跺彇鍊艰寖鍥存槸0~1锛屼笉鍖呮嫭0鍜1锛岄氬父鎯呭喌涓嬶紝涓鑸湁涓変釜鍒ゆ柇鏍囧噯涓涓槸0.01銆0.05浠ュ強0.1銆傚湪缁濆ぇ澶氭暟鎯呭喌涓嬶紝濡傛灉p鍊煎皬浜0.01锛屽垯璇存槑鑷冲皯鏈99锛呯殑鎶婃彙锛屽鏋減鍊煎皬浜0.05锛堜笖澶т簬鎴栫瓑浜0.01锛夛紝鍒欒鏄庤嚦灏戞湁95锛呯殑鎶婃彙锛屽鏋...
  • 缁熻瀛鍊肩殑鍚箟鏄粈涔?
    绛旓細瀹氫箟 p鍊兼槸鎸囧湪涓涓鐜囨ā鍨嬩腑锛缁熻鎽樿锛堝涓ょ粍鏍锋湰鍧囧煎樊锛変笌瀹為檯瑙傛祴鏁版嵁鐩稿悓锛屾垨鐢氳嚦鏇村ぇ杩欎竴浜嬩欢鍙戠敓鐨勬鐜囥傛崲瑷涔嬶紝鏄楠屽亣璁鹃浂鍋囪鎴愮珛鎴栬〃鐜版洿涓ラ噸鐨勫彲鑳芥с俻鍊艰嫢涓庨夊畾鏄捐憲鎬ф按骞筹紙0.05鎴0.01锛夌浉姣旀洿灏忥紝鍒欓浂鍋囪浼氳鍚﹀畾鑰屼笉鍙帴鍙椼傜劧鑰岃繖骞朵笉鐩存帴琛ㄦ槑鍘熷亣璁炬纭俻鍊兼槸涓涓湇浠...
  • 缁熻瀛︿腑鐨刾鍊间唬琛ㄤ粈涔?
    绛旓細缁熻瀛︿腑鐨凱鍊锛氭槸鐢ㄦ潵鍒ゅ畾鍋囪妫楠岀粨鏋滅殑涓涓弬鏁帮紝涔熷彲浠ユ牴鎹笉鍚岀殑鍒嗗竷浣跨敤鍒嗗竷鐨勬嫆缁濆煙杩涜姣旇緝 p鍊兼槸鎸囧湪涓涓鐜囨ā鍨嬩腑锛岀粺璁℃憳瑕侊紙濡備袱缁勬牱鏈潎鍊煎樊锛変笌瀹為檯瑙傛祴鏁版嵁鐩稿悓锛屾垨鐢氳嚦鏇村ぇ杩欎竴浜嬩欢鍙戠敓鐨勬鐜囥傛崲瑷涔嬶紝鏄楠屽亣璁鹃浂鍋囪鎴愮珛鎴栬〃鐜版洿涓ラ噸鐨勫彲鑳芥с俻鍊艰嫢涓庨夊畾鏄捐憲鎬ф按骞筹紙0.05鎴0....
  • 缁熻瀛鍊间唬琛ㄤ粈涔
    绛旓細缁熻瀛︿腑鐨凱鍊兼槸鍋囪妫楠屼腑鐨勪竴涓叧閿弬鏁帮紝鐢ㄤ簬姣旇緝瑙傚療鏁版嵁涓庡亣璁炬ā鍨嬬殑鍚诲悎绋嬪害銆傚叿浣撹岃█锛孭鍊艰〃绀哄湪闆跺亣璁句负鐪熺殑鎯呭喌涓嬶紝瑙傚療鍒扮殑鏁版嵁鎴栨洿鏋佺鏁版嵁鍑虹幇鐨勬鐜囥傚鏋淧鍊煎皬浜庝簨鍏堣瀹氱殑鏄捐憲鎬ф按骞筹紙閫氬父鏄0.05鎴0.01锛夛紝鍒欐垜浠涓洪浂鍋囪涓嶅お鍙兘鎴愮珛锛屽洜姝ゆ嫆缁濋浂鍋囪銆傜劧鑰岋紝P鍊兼湰韬苟涓嶇洿鎺ヨ瘉鏄...
  • 缁熻瀛︿腑p鍊肩殑鍚箟鏄粈涔?
    绛旓細p鍊兼槸鎸囧湪涓涓鐜囨ā鍨嬩腑锛缁熻鎽樿锛堝涓ょ粍鏍锋湰鍧囧煎樊锛変笌瀹為檯瑙傛祴鏁版嵁鐩稿悓锛屾垨鐢氳嚦鏇村ぇ杩欎竴浜嬩欢鍙戠敓鐨勬鐜囥傛崲瑷涔嬶紝鏄楠屽亣璁鹃浂鍋囪鎴愮珛鎴栬〃鐜版洿涓ラ噸鐨勫彲鑳芥с俻鍊艰嫢涓庨夊畾鏄捐憲鎬ф按骞筹紙0.05鎴0.01锛夌浉姣旀洿灏忥紝鍒欓浂鍋囪浼氳鍚﹀畾鑰屼笉鍙帴鍙椼傜劧鑰岃繖骞朵笉鐩存帴琛ㄦ槑鍘熷亣璁炬纭俻鍊兼槸涓涓湇浠庢鎬...
  • 扩展阅读:p值对照表全图 ... 为什么不建议学统计学 ... p值大于0.05说明什么 ... 医学统计学中p值含义 ... p值小于0.05统计学意义 ... t检验的p值对照表 ... p值越小越显著吗 ... p值多少有统计学差异 ... 统计学上的p值的含义通俗 ...

    本站交流只代表网友个人观点,与本站立场无关
    欢迎反馈与建议,请联系电邮
    2024© 车视网