3 - BLUP的基本特性及求解方法

回顾上一次的一个OLS, GLS,SI, MME的发展示意图:

MME是Henderson将混合模型的转换得到

Henderson提出,其想法是结合OLS与SI,得到了MME。
过程:
首先我们知道:OLS解出的u往往比SI的大。
这样需要在求u时,除以一个更大的值,这是加入一个正矩阵Z‘Z,假设用D代表:

即对原来的解释器进行了惩罚
使用前面求公牛的女儿产奶量的平均值的例子:采用每个奶牛的女儿数进行了一定修改, 或其可以加上一个假设值D

第二个结论:

解释:u和y的协方差,在SI中是AZ’,直观来看,D 必须与 A -1 成正比,因为整个块 ZZ' + D 是倒置.
但是真正的证明以下公式,是20年后,由Searle教授完成(书籍 《Variance components》有详细证明):

所以最佳线性无偏估计(β,固定效应)和最佳线性无偏预测(u,随机效应)是由以下组成:

Henderson对上述式子从新编写为:

其中 R = Var(e); G = Var(u), 并且认为已知。
相当于SI(β已知):

会有多性状模型: 其有利于具有缺少值的样本加入, 也有利于多性状的相关性分析
一样的矩阵公式:

但是两者没有非常明确的区分

固定效应:各水平的平均值: E(y) = Xβ
随机效应:随机因子的方差协方差矩阵: Var(y) = ZGZ' + R

最佳线性无偏估计=BLUE(β,固定效应)和最佳线性无偏预测=BLUP(u,随机效应)

BLUE与BLUP的区别是由SI传承得到
但是:SI中只是BLP, 缺少u, 即不是无偏

可以采用不同方法得到:

(2) 再使用SI得到u:

每个u都有预测误差,对u的评价使用Acurracy or reliability有两种方法:

X与Z往往不是全矩阵(即,内部有很多0)
X i 和Z i 与 观察者i相关联,所以:

如一个固定模型:

需要分开写:

最后求和到一起:

Integration(微积分) R -1 , R -1 是等于R对角线取倒数(如果没有协方差)

多性状时, X‘X等元素都Kronecker product(直积)R-1

对上述的拓展到MME,随机效应的最小二乘 (LS) 部分与固定效应相同,对C加入G -1 :

进一步简化公式:

刚才看到建立MME是基于一个个记录数*性状

所以对大数据时,加速办法:

从历史来看,SI是非常成功,目前也在综合育种中使用
但是SI在估计单个性状EBV时,会出现偏差,因为其实基于已知的偏差经验求取,但是已知的偏差经验具有偏差。
从当时来看,同代群体的基因水平可能不同
SI在奶牛中称为: contemporary comparison(CC) 1950-1960使用在奶牛育种中,用于区分好和坏的公牛,并且很快获得了成功。

CC模型: y = Xt + Za + e

但是对于已经开始育种的牛,这个表型deviation(偏差)会随着时间累积,越来越难估计,甚至会出现有的估计不到。

这就需要我们对其进行修改

第一种:偏差和 EBV 的联合计算,所以没有误差
第二种: modefied CC(MCC),迭代计算:
(1) 从偏差处计算EBV
(2) 调整当代EBV的偏差
(3) return to (1)
(4) 直到结果稳定(即收敛),收敛的结果与BLUP的相同
怎么实现:
当计算t时,对y的部分进行校正:

迭代,直到收敛:

总图:

今天无意看到一个不错的文章,介绍BLUP,这里给出网址,可以查看
https://zhuanlan.zhihu.com/p/43395772



扩展阅读:怀孕sd值正常值参照表 ... vue3面试题 ... 护肝最好的三种行为 ... 最伤肝的几种行为 ... vuex ... 3d十位走势图图表 ... 3d十位振幅走势图带连线 ... 三电平(+ 0 -)波形 ... 3d百位振幅走势图彩经网 ...

本站交流只代表网友个人观点,与本站立场无关
欢迎反馈与建议,请联系电邮
2024© 车视网