什么是正态分布? 正态分布的含义是什么?

\u4ec0\u4e48\u662f\u6b63\u6001\u5206\u5e03

\u6b63\u6001\u5206\u5e03\u7684\u5b9a\u4e49\u662f\u4ec0\u4e48\u5462

\u6b63\u6001\u5206\u5e03\u7684\u5b9a\u4e49\u662f\u4ec0\u4e48\u5462

目录 1正态分布 目录 1正态分布 收起 编辑本段正态分布   normal distribution
  一种概率分布。正态分布是具有两个参数μ和σ2的连续型随机变量的分布,第一参数μ是服从正态分布的随机变量的均值,第二个参数σ2是此随机变量的方差,所以正态分布记作N(μ,σ2 )。 服从正态分布的随机变量的概率规律为取与μ邻近的值的概率大 ,而取离μ越远的值的概率越小;σ越小,分布越集中在μ附近,σ越大,分布越分散。正态分布的密度函数的特点是:关于μ对称,在μ处达到最大值,在正(负)无穷远处取值为0,在μ±σ处有拐点。它的形状是中间高两边低 ,图像是一条位于x轴上方的钟形曲线。当μ=0,σ2 =1时,称为标准正态分布,记为N(0,1)。μ维随机向量具有类似的概率规律时,称此随机向量遵从多维正态分布。多元正态分布有很好的性质,例如,多元正态分布的边缘分布仍为正态分布,它经任何线性变换得到的随机向量仍为多维正态分布,特别它的线性组合为一元正态分布。
  正态分布最早由A.棣莫弗在求二项分布的渐近公式中得到。C.F.高斯在研究测量误差时从另一个角度导出了它。P.S.拉普拉斯和高斯研究了它的性质。
  生产与科学实验中很多随机变量的概率分布都可以近似地用正态分布来描述。例如,在生产条件不变的情况下,产品的强力、抗压强度、口径、长度等指标;同一种生物体的身长、体重等指标;同一种种子的重量;测量同一物体的误差;弹着点沿某一方向的偏差;某个地区的年降水量;以及理想气体分子的速度分量,等等。一般来说,如果一个量是由许多微小的独立随机因素影响的结果,那么就可以认为这个量具有正态分布(见中心极限定理)。从理论上看,正态分布具有很多良好的性质 ,许多概率分布可以用它来近似;还有一些常用的概率分布是由它直接导出的,例如对数正态分布、t分布、F分布等。
  正态分布应用最广泛的连续概率分布,其特征是“钟”形曲线。
   正态分布
  1.正态分布
  若已知的密度函数(频率曲线)为正态函数(曲线)则称已知曲线服从正态分布,记号 ~ 。其中μ、σ2 是两个不确定常数,是正态分布的参数,不同的 、不同的 对应不同的正态分布。
  正态曲线呈钟型,两头低,中间高,左右对称,曲线与横轴间的面积总等于1。
  2.正态分布的特征
  服从正态分布的变量的频数分布由 、 完全决定。
  (1) 是正态分布的位置参数,描述正态分布的集中趋势位置。正态分布以 为对称轴,左右完全对称。正态分布的均数、中位数、众数相同,均等于 。
  (2) 描述正态分布资料数据分布的离散程度, 越大,数据分布越分散, 越小,数据分布越集中。 也称为是正态分布的形状参数, 越大,曲线越扁平,反之, 越小,曲线越瘦高。
   标准正态分布standard normal distribution
  1.标准正态分布是一种特殊的正态分布,标准正态分布的μ和σ2为0和1,通常用 (或Z)表示服从标准正态分布的变量,记为 Z~N(0,1)。
  2.标准化变换:此变换有特性:若原分布服从正态分布 ,则Z=(x-μ)/σ ~ N(0,1) 就服从标准正态分布,通过查标准正态分布表就可以直接计算出原正态分布的概率值。故该变换被称为标准化变换。
  3. 标准正态分布表
  标准正态分布表中列出了标准正态曲线下从-∞到X(当前值)范围内的面积比例 。
   正态曲线下面积分布
  1.实际工作中,正态曲线下横轴上一定区间的面积反映该区间的例数占总例数的百分比,或变量值落在该区间的概率(概率分布)。不同 范围内正态曲线下的面积可用公式计算。
  2.几个重要的面积比例
  轴与正态曲线之间的面积恒等于1。正态曲线下,横轴区间(μ-σ,μ+σ)内的面积为68.27%,横轴区间(μ-1.96σ,μ+1.96σ)内的面积为95.00%,横轴区间(μ-2.58σ,μ+2.58σ)内的面积为99.00%。
   正态分布的应用
  某些医学现象,如同质群体的身高、红细胞数、血红蛋白量,以及实验中的随机误差,呈现为正态或近似正态分布;有些指标(变量)虽服从偏态分布,但经数据转换后的新变量可服从正态或近似正态分布,可按正态分布规律处理。其中经对数转换后服从正态分布的指标,被称为服从对数正态分布。
  1. 估计频数分布 一个服从正态分布的变量只要知道其均数与标准差就可根据公式即可估计任意取值范围内频数比例。
  2. 制定参考值范围
  (1)正态分布法 适用于服从正态(或近似正态)分布指标以及可以通过转换后服从正态分布的指标。
  (2)百分位数法 常用于偏态分布的指标。表3-1中两种方法的单双侧界值都应熟练掌握。
  3. 质量控制:为了控制实验中的测量(或实验)误差,常以 作为上、下警戒值,以 作为上、下控制值。这样做的依据是:正常情况下测量(或实验)误差服从正态分布。
  4. 正态分布是许多统计方法的理论基础。 检验、方差分析、相关和回归分析等多种统计方法均要求分析的指标服从正态分布。许多统计方法虽然不要求分析指标服从正态分布,但相应的统计量在大样本时近似正态分布,因而大样本时这些统计推断方法也是以正态分布为理论基础的。
   研究过程
  正态分布的概念和特征一、正态分布的概念
  由一般分布的频数表资料所绘制的直方图,图(1)可以看出,高峰位于中部,左右两侧大致对称。我们设想,如果观察例数逐渐增多,组段不断分细,直方图顶端的连线就会逐渐形成一条高峰位于中央(均数所在处),两侧逐渐降低且左右对称,不与横轴相交的光滑曲线图(3)。这条曲线称为频数曲线或频率曲线,近似于数学上的正态分布(normal distribution)。由于频率的总和为100%或1,故该曲线下横轴上的面积为100%或1。
  为了应用方便,常对正态分布变量X作变量变换。

  该变换使原来的正态分布转化为标准正态分布 (standard normal distribution),亦称u分布。u被称为标准正态变量或标准正态离差(standard normal deviate)。
  二、正态分布的特征:
  1.正态曲线(normal curve)在横轴上方均数处最高。
  2.正态分布以均数为中心,左右对称。
  3.正态分布有两个参数,即均数μ和标准差σ。μ是位置参数,当σ固定不变时,μ越大,曲线沿横轴越向右移动;反之,μ越小,则曲线沿横轴越向左移动。σ是形状参数,当μ固定不变时,σ越大,曲线越平阔;σ越小,曲线越尖峭。通常用N~(μ,σ2)表示均数为μ,方差为σ2的正态分布。用N(0,1)表示标准正态分布。
  4.正态曲线下面积的分布有一定规律。
  实际工作中,常需要了解正态曲线下横轴上某一区间的面积占总面积的百分数,以便估计该区间的例数占总例数的百分数(频数分布)或观察值落在该区间的概率。正态曲线下一定区间的面积可以通过附表1求得。对于正态或近似正态分布的资料,已知均数和标准差,就可对其频数分布作出概约估计。
  查附表1应注意:①表中曲线下面积为-∞到u的左侧累计面积;②当已知μ、σ和X时先按式u=(X-μ)/σ求得u值,再查表,当μ、σ未知且样本含量n足够大时,可用样本均数X1和标准差S分别代替μ和σ,按u=(X-X1)/S式求得u值,再查表;③曲线下对称于0的区间面积相等,如区间(-∞,-1.96)与区间(1.96,∞)的面积相等,④曲线下横轴上的总面积为100%或1。
  
  图2 正态曲线与标准正态曲线的面积分布
  第二节 正态分布的应用某些医学现象,如同质群体的身高、红细胞数、血红蛋白量、胆固醇等,以及实验中的随机误差,呈现为正态或近似正态分布;有些资料虽为偏态分布,但经数据变换后可成为正态或近似正态分布,故可按正态分布规律处理。
  1.估计正态分布资料的频数分布
  例1.10 某地1993年抽样调查了100名18岁男大学生身高(cm),其均数=172.70cm,标准差s=4.01cm,①估计该地18岁男大学生身高在168cm以下者占该地18岁男大学生总数的百分数;②分别求X+-1s、X+-1.96s、X+-2.58s范围内18岁男大学生占该地18岁男大学生总数的实际百分数,并与理论百分数比较。
  本例,μ、σ未知但样本含量n较大,按式(3.1)用样本均数X和标准差S分别代替μ和σ,求得u值,u=(168-172.70)/4.01=-1.17。查附表标准正态曲线下的面积,在表的左侧找到-1.1,表的上方找到0.07,两者相交处为0.1210=12.10%。该地18岁男大学生身高在168cm以下者,约占总数12.10%。其它计算结果见表3。
  表3 100名18岁男大学生身高的实际分布与理论分布
   分布
  x+-s
  身高范围(cm)
  实际分布
  人数
  实际分布
  百分数(%)
  理论分布(%)
  X+-1s
  168.69~176.71
  6767.0068.27
  X +-1.96s164.84~180.56
  9595.0095.00
  X+-2.58s162.35~183.05
  9999.0099.00
  2.制定医学参考值范围:亦称医学正常值范围。它是指所谓“正常人”的解剖、生理、生化等指标的波动范围。制定正常值范围时,首先要确定一批样本含量足够大的“正常人”,所谓“正常人”不是指“健康人”,而是指排除了影响所研究指标的疾病和有关因素的同质人群;其次需根据研究目的和使用要求选定适当的百分界值,如80%,90%,95%和99%,常用95%;根据指标的实际用途确定单侧或双侧界值,如白细胞计数过高过低皆属不正常须确定双侧界值,又如肝功中转氨酶过高属不正常须确定单侧上界,肺活量过低属不正常须确定单侧下界。另外,还要根据资料的分布特点,选用恰当的计算方法。常用方法有:
  (1)正态分布法:适用于正态或近似正态分布的资料。
  双侧界值:X+-u(u)^S单侧上界:X+u(u)^S,或单侧下界:X-u(u)^S
  (2)对数正态分布法:适用于对数正态分布资料。
  双侧界值:lg-1[X(lgx)+-u(u)S(lgx)];单侧上界:lg-1[X(lgx)+u(u)S(lgx)],或单侧下界:lg-1[X(lgx)-u(u)S(lgx)]。
  常用u值可根据要求由表4查出。
  (3)百分位数法:常用于偏态分布资料以及资料中一端或两端无确切数值的资料。
  双侧界值:P2.5和P97.5;单侧上界:P95,或单侧下界:P5。
  表4常用u值表
   参考值范围(%)单侧双侧800.842
  1.282
  901.282
  1.645951.6451.960992.3262.576
  3.正态分布是许多统计方法的理论基础:如t分布、F分布、x2分布都是在正态分布的基础上推导出来的,u检验也是以正态分布为基础的。此外,t分布、二项分布、Poisson分布的极限为正态分布,在一定条件下,可以按正态分布原理来处理。

正态分布的定义是什么呢







  • 浠涔堟槸姝f佸垎甯
    绛旓細姝f佸垎甯冪殑姒傚康锛氭鎬佸垎甯冿紙Normal distribution)鏄竴绉嶆鐜囧垎甯銆傛鎬佸垎甯冩槸鍏锋湁涓や釜鍙傛暟渭鍜屜僞2鐨杩炵画鍨嬮殢鏈哄彉閲忕殑鍒嗗竷锛岀涓鍙傛暟渭鏄伒浠庢鎬佸垎甯冪殑闅忔満鍙橀噺鐨勫潎鍊硷紝绗簩涓弬鏁跋僞2鏄闅忔満鍙橀噺鐨勬柟宸紝鎵浠ユ鎬佸垎甯冭浣淣(渭锛屜僞2 )銆傞伒浠庢鎬佸垎甯冪殑闅忔満鍙橀噺鐨勬鐜囪寰嬩负鍙 渭閭昏繎鐨勫肩殑姒傜巼...
  • 浠涔堟槸姝f佸垎甯?
    绛旓細姝f佸垎甯冨氨鏄ぇ閮ㄥ垎灞炰簬涓棿鍊硷紝鍙湁涓灏忛儴鍒嗗睘浜庤繃澶у拰杩囧皬鐨勫硷紝瀹冧滑鍒嗗竷鍦ㄨ寖鍥寸殑涓ょ銆傛鎬佸垎甯冿紙Normal distribution锛夛紝涔熺О鈥滃父鎬佸垎甯冣濓紝鍙堝悕楂樻柉鍒嗗竷锛圙aussian distribution锛夛紝鏈鏃╃敱A.妫h帿寮楀湪姹備簩椤瑰垎甯冪殑娓愯繎鍏紡涓緱鍒帮紝C.F.楂樻柉鍦ㄧ爺绌舵祴閲忚宸椂浠庡彟涓涓搴﹀鍑轰簡瀹冦傛鎬佹洸绾垮憟閽熷瀷锛...
  • 浠涔堟槸姝f佸垎甯
    绛旓細姝f佸垎甯冩槸涓绉嶇粺璁″涓婄殑姒傜巼鍒嗗竷锛屼篃琚О涓洪珮鏂垎甯冩垨閽熷舰鏇茬嚎銆1銆佹鎬佸垎甯冪殑瀹氫箟鍜岀壒鐐 姝f佸垎甯冩槸鎸囧湪鏁扮悊缁熻涓紝褰撻殢鏈哄彉閲忔湇浠庢鎬佸垎甯鏃讹紝鍏舵鐜囧瘑搴﹀嚱鏁板憟鐜板嚭閽熷舰鏇茬嚎鐘銆傚畠鍏锋湁浠ヤ笅鐗圭偣锛氬绉般佸崟宄般佸钩鍧囧肩瓑浜庝腑浣嶆暟绛夈傛鎬佸垎甯冩槸鍏锋湁涓や釜鍙傛暟渭鍜屜2鐨勮繛缁瀷闅忔満鍙橀噺鐨勫垎甯,绗竴鍙...
  • 姝f佸垎甯鏄浠涔鎰忔
    绛旓細姝f佸垎甯冿紙Normal Distribution锛夛紝涔熺О涓洪珮鏂垎甯冿紙Gaussian Dis tribution锛夛紝鏄粺璁″涓渶閲嶈鐨勮繛缁鐜囧垎甯冧箣涓銆傚畠鍏锋湁浠ヤ笅鐨勫熀鏈蹇碉細1. 鍧囧硷紙Mean锛夛細姝f佸垎甯冪殑鍧囧艰〃绀哄垎甯冪殑涓績浣嶇疆锛岄氬父鐢ㄎ硷紙mu锛夎〃绀恒傛鎬佸垎甯冪殑鍧囧煎喅瀹氫簡鍒嗗竷鐨勫绉颁腑蹇冦2. 鏍囧噯宸紙Standard Deviation锛夛細姝f佸垎甯冪殑鏍...
  • 浠涔堟槸姝f佸垎甯?
    绛旓細姝f佸垎甯冩槸涓绉嶆鐜囧垎甯冿紝涓鑸敤绗﹀彿渭鍜屜冭〃绀哄潎鍊煎拰鏍囧噯宸銆傚叾姒傜巼瀵嗗害鍑芥暟涓猴細f(x) = (1/蟽鈭2蟺)exp(-(x-渭)²/2蟽²)鍏朵腑锛屛兼槸姝f佸垎甯冪殑鍧囧硷紝蟽鏄鎬佸垎甯冪殑鏍囧噯宸紝e涓鸿嚜鐒跺父鏁般傛鎬佸垎甯冪殑鏍囧噯鍖栧叕寮忎负锛歒=(X-渭)/蟽~N(0,1)鍏朵腑锛孹鏄師濮嬫暟鎹紝Y鏄爣鍑嗗寲鍚庣殑...
  • 姝f佸垎甯鏄浠涔鎰忔?
    绛旓細姝f佸垎甯锛堜篃绉颁负楂樻柉鍒嗗竷鎴閽熷舰鏇茬嚎锛夋槸缁熻瀛︿腑鏈閲嶈鐨勫垎甯冧箣涓锛屽叿鏈変互涓嬬壒寰侊細瀵圭О鎬с佸崟宄版с佸畾涔夋槑纭殑鍧囧煎拰鏍囧噯宸佹墍鏈夋鎬佸垎甯冪殑涓や釜鐗规畩鍙傛暟銆佷腑蹇冩瀬闄愬畾鐞嗐佺煡鍚嶇壒鎬с1銆佸绉版э細姝f佸垎甯冩槸鍏充簬鍏跺潎鍊肩殑瀵圭О鍒嗗竷锛屽憟鐜板嚭宸﹀彸瀵圭О鐨勭壒寰併傚潎鍊笺佷腑浣嶆暟鍜屼紬鏁伴兘浣嶄簬鍒嗗竷鐨勪腑蹇冦2銆佸崟宄版...
  • 浠涔堟槸姝f佸垎甯
    绛旓細姝f佸垎甯鍙堝悕楂樻柉鍒嗗竷锛屾槸涓涓湪鏁板銆佺墿鐞嗗強宸ョ▼绛夐鍩熼兘闈炲父閲嶈鐨勬鐜囧垎甯冿紝鍦ㄧ粺璁″鐨勮澶氭柟闈㈡湁鐫閲嶅ぇ鐨勫奖鍝嶅姏銆傝嫢闅忔満鍙橀噺X鏈嶄粠涓涓暟瀛︽湡鏈涗负渭銆佹柟宸负蟽^2鐨勯珮鏂垎甯冿紝璁颁负N(渭锛屜僞2)銆傚叾姒傜巼瀵嗗害鍑芥暟涓烘鎬佸垎甯冪殑鏈熸湜鍊嘉煎喅瀹氫簡鍏朵綅缃紝鍏舵爣鍑嗗樊蟽鍐冲畾浜嗗垎甯冪殑骞呭害銆傚洜鍏舵洸绾垮憟閽熷舰锛...
  • 姝f佸垎甯鏄浠涔?
    绛旓細鈥滄鎬佸垎甯冣濈殑鎰忎箟鏄 鏄竴涓湪鏁板銆佺墿鐞嗗強宸ョ▼绛夐鍩熼兘闈炲父閲嶈鐨勬鐜囧垎甯冿紝鍦ㄧ粺璁″鐨勮澶氭柟闈㈡湁鐫閲嶅ぇ鐨勫奖鍝嶅姏銆傝嫢闅忔満鍙橀噺鏈嶄粠涓涓綅缃弬鏁般佸昂搴﹀弬鏁颁负鐨勬鐜囧垎甯冦傛鎬佸垎甯冿紙Normal distribution)鏄竴绉嶆鐜囧垎甯銆傛鎬佸垎甯冩槸鍏锋湁涓や釜鍙傛暟渭鍜屜僞2鐨杩炵画鍨嬮殢鏈哄彉閲忕殑鍒嗗竷锛岀涓鍙傛暟渭鏄伒浠庢鎬...
  • 浠涔堟槸姝f佸垎甯?
    绛旓細姝f佸垎甯涔熻绉颁负楂樻柉鍒嗗竷鎴閽熷舰鏇茬嚎锛堝洜涓哄畠鐪嬭捣鏉ュ儚涓涓挓锛夛紝杩欐槸缁熻瀛︿腑鏈閲嶈鐨勬鐜囧垎甯冿紝灏卞儚鎴戜滑鍦ㄥぇ鑷劧涓粡甯哥湅鍒扮殑閭f牱锛屽畠鏈夌偣绁炲銆備緥濡傦紝韬珮銆佷綋閲嶃佽鍘嬨佹祴閲忚宸佹櫤鍟嗗緱鍒嗙瓑閮芥湇浠庢鎬佸垎甯冦傛牴鎹腑蹇冩瀬闄愬畾鐞嗭紝濡傛灉涓涓簨鐗╁彈鍒板绉嶅洜绱犵殑褰卞搷锛屼笉绠℃瘡涓洜绱犳湰韬槸浠涔堝垎甯锛屽畠浠姞鎬...
  • 浠涔堟槸姝f佸垎甯?
    绛旓細姝f佸垎甯冧互X=渭涓哄绉拌酱锛屽乏鍙冲畬鍏ㄥ绉般傛鎬佸垎甯冪殑鏈熸湜銆佸潎鏁般佷腑浣嶆暟銆佷紬鏁扮浉鍚岋紝鍧囩瓑浜幬笺傁冩弿杩版鎬佸垎甯冭祫鏂欐暟鎹垎甯冪殑绂绘暎绋嬪害锛屜冭秺澶э紝鏁版嵁鍒嗗竷瓒婂垎鏁o紝蟽瓒婂皬锛屾暟鎹垎甯冭秺闆嗕腑銆備篃绉颁负鏄鎬佸垎甯鐨勫舰鐘跺弬鏁帮紝蟽瓒婂ぇ锛屾洸绾胯秺鎵佸钩锛屽弽涔嬶紝蟽瓒婂皬锛屾洸绾胯秺鐦﹂珮銆
  • 扩展阅读:正态分布u与σ的关系 ... 正态分布的三个公式 ... σ怎么读 ... 高中正态分布基本知识 ... 正态分布对照表 ... 正态分布3σ原则 ... 正态分布三个特殊值 ... 正态分布nσ2含义 ... 正态分布概率1σ2σ3σ ...

    本站交流只代表网友个人观点,与本站立场无关
    欢迎反馈与建议,请联系电邮
    2024© 车视网