一个树种在其遗传改良的初期,以混合选择为主,这时可用单株遗传力来估算遗传增益。随着改良水平的提高,特别是在高世代改良中,育种资源转变为有系谱的材料为主,选择方式包括家系选择、家系内选择和配合选择。通常正向选择以配合选择为主。在估算遗传增益时,家系选择需要家系平均遗传力,家系内选择需要家系内遗传力(Namkoong et al.,1966;Shelbourne,1969;Falconer,1989),而配合选择需要利用一系列的方差成分进行矩阵的运算,或采用家系及家系内遗传力与相应的选择差构成的方程式进行估算(Falconer,1989;Hodge et al.,1992)。
本研究以涉及2个地点的半同胞子代测定为材料,估算火炬松生长性状的3种遗传力,包括家系内遗传力,同时就配合选择遗传增益的估算,介绍具有可靠性和实用性的计算公式,供开展火炬松和其他树种遗传改良时参考。
2个试验点分别为广东英德火炬松种子园(24°15′N,113°45′E)和中国林业科学研究院亚林所──浙江富阳(30°15′N,119°58′E),参试的共同家系有24个,均来自广东英德市火炬松初级种子园。
采用随机完全区组(RCB)设计,英德试点6次重复,6株行式小区,富阳试点8次重复,4株行式小区。6年生时测量单株树高、胸径,并计算单株材积,公式 V =0.375 HD 2 /10000。
采用Dieters等(1995)的方法进行数据的标准化处理,以消除规模效应的影响。方法是将单株观测值除以所在试验林的小区内标准差,即
,式中:
y
和
MS
E
分别为各地点的单株观测值和方差分析的误差方差。用标准化数据估算的误差方差成分等于1。
子代测定林中单株观测值的线性模型:
式中:
y
ijkl
为第
i
地点内第
j
区组第
k
家系第
l
个体的表型值,
i
=1,2,…,
s
,
j
=1,2,…,
b
,
k
=1,2,…,
f
,
l
=1,2,…,
n
;
μ
为所有个体观测值的总平均,固定效应;
S
i
为第
i
地点的固定效应;
B
ij
为第
i
地点内第
j
区组的固定效应;
F
k
为第
k
家系的随机效应,数学期望
E
(
F
k
)=0,方差
;
FS
ik
为第
k
家系与第
i
地点的随机互作效应,
E
(
FS
ik
)=0,
;
FB
ijk
为第
ijk
小区的随机效应,
E
(
FB
ijk
)=0,
var
(
FB
ijk
)=
;
ε
ijkl
为第
ijk
小区第
l
个体的随机误差,
E
(
ε
ijkl
)=0,
。
,
和
分别为家系、家系×地点、小区(家系×区组)和误差方差成分。
单株遗传力的计算公式(Wright,1976):
家系内遗传力的计算公式(Namkoong et al.,1966;Shelbourne,1969;Falconer,1989):
家系平均遗传力的计算公式(Wright,1976):
式中:
为加性遗传方差。
配合选择的遗传增益计算公式(Hodge et al.,1992):
式中:
y
ijkl
含义同上,
为第
k
家系的平均值,
g
ijkl
为第
ijkl
个体的育种值,可用下式表达:
式中:
F
k
含义同上;
W
ijkl
为第
ijkl
个体的随机加性遗传效应,
E
(
W
ijkl
)=0,
var
(
W
ijkl
)=(3/4)
,
W
ijkl
包含在上述线性模型的
ε
ijkl
之中。可见,由家系间变异所产生的方差成分只占加性遗传方差的1/4,而由家系内个体间变异产生的方差成分占3/4,后3/4又包含在
中。
公式(1-11)是基于以单株观测值与总平均值的离差作为家系内选择差的计算公式。公式(1-12)中,元素
,当数据平衡时,
,该元素简化为
,即公式(1-12)是基于以单株观测值与所在家系平均值的离差作为家系内选择差的计算公式,其计算结果与公式(1-11)是一样的。但在数据不平衡时,由于各家系权重的不同将使
,两式的估算结果有差异。
上述矩阵或向量中各元素与线性模型中各随机效应的方差成分的关系如下:
经过矩阵运算,
变成一个行向量。公式1-12又可作如下简化:
该列向量的第1个元素
随着
s
、
b
和
n
的增大,第1个元素趋近于
,而第2个元素趋近于
。
若区组间存在显著差异,则首先在每个地点内分别对观测值进行校正(Cotterill et al.,1990),校正后的单株表型值为
式中
y
jkl
为单株观察值,
为地点内第
jkl
单株所在区组的平均值。通常只需在家系内个体的排序以及在向量[
y
-
E
(
y
)]中的
yijkl
采用校正的值,因为在计算家系平均值及总体平均值时区组间的差异可以互相抵消。
因缺株而导致数据不平衡时,上述有关表达式中的小区株数
n
用小区调和平均株数
n
h
代替,
,
n
ijk
为第
ijk
小区的株数(黄少伟 等,1998)。同理,当出现缺区时,区组数
b
用调和平均区组数
b
h
代替,
,
pik
为第
i
地点第
k
家系分布的小区数。数据分析用SAS软件进行(SAS Institute Inc.,1990)。
已有研究表明,REML方法对于不平衡数据(Huber et al.,1994),以及林木遗传测定可能存在的各种数据结构(分布)(Banks et al.,1985;Westfall,1987),均有理想的估算结果。用SAS/STAT统计软件的Varcomp过程,选择REML法估算方差成分(SAS Institute Inc.,1990)。REML方差成分估算的3种遗传力如表1-12,其大小排列为家系平均遗传力>单株遗传力>家系内遗传力。用标准化数据估算的遗传力,总体上与未采用标准化数据估算的结果有差异,就单株材积的结果而言,标准化数据估算的家系遗传力明显大于非标准化数据估算的结果(黄少伟 等,2001)。
表1-12 生长性状3种遗传力估算
依公式(1-11)和公式(1-12)分别计算的行向量
c
′
v
-1
的2个元素,以及公式(1-13)中的
和
,分别是家系选择(元素2或
)和家系内选择(元素1或
)的系数(表1-13)。据此进行配合选择的遗传增益估算。由于本试验存在着显著的遗传型×环境互作,在逆向选择中有4个广谱型优系和8个局地型优系入选(黄少伟 等,2001),本文在此基础上开展正向的配合选择,若从4个广谱型优系中各选择2个优良单株,从8个局地型优系中各选择1个优良单株,采用校正的单株表型值,遗传增益估算结果如表1-14。
表1-14显示,3个公式的估算结果相差不大,而以公式(1-12)估算的遗传增益最大。差异显著性( t )检验表明,对于公式(1-11)与公式(1-12),公式(1-11)与公式(1-13)和公式(1-12)与公式(1-13)的估算结果的差异,接受零假设的概率分别为0.8565,0.9741和0.8821,即3个公式的估算结果都非常接近。
表1-13 家系和家系内选择的系数
表1-14 配合选择的遗传增益
子代测定中3种遗传力分别应用于不同层次的选择,家系内遗传力的估算,为配合选择遗传增益的估算提供了比较简便的方法。
3个估算配合选择遗传增益的公式所得结果非常接近,即使在只有2个试验点,且数据严重不平衡的情况下也是如此。本试验两片子代林保存率分别为74.5%和86.5%,考虑到两试点的重复数和小区株数都不相等,实际上数据不平衡的情况还更严重,而3个公式尚能得到非常接近的估算结果,说明近似计算公式(1-13)是可靠的。该法避免了相对复杂的矩阵运算,有较强的实用性,对多种交配设计均适用(Falconer,1989)。
遗传力的正确估算是准确估算遗传增益的基础。从本文及国内外以往对火炬松遗传力的估算结果看,半同胞家系生长性状遗传力的估算结果比较一致,而单株遗传力的结果差异较大,就4~6龄的生长性状而言,变化范围0.033~0.50(钟伟华 等,1994;1997;2001a;姜景民 等,1996;阮少宁 等,2003;孙小霞 等,2004;Atwood et al.,2002;Roberds et al.,2003)。本文估算的火炬松生长性状遗传力在国内同类研究的结果中属于较低水平,低于Roberds等(2003)单点试验估算的结果,接近并略高于Atwood等(2002)多点试验估算的结果,单株遗传力和家系内遗传力均与国外较早前的研究结果非常接近(Li et al.,1996)。单株遗传力和家系内遗传力估算结果差异大,主要是由于数据结构和统计模型的差异引起的。单点试验数据,小区平均值和(或)单因素方差分析模型的应用,都可能使单株遗传力和家系内遗传力的估算结果出现较大的偏差。半同胞家系子代测定,有3/4的加性遗传方差包含在机误方差中,无法单独计算。这部分加性遗传方差是由小区内个体间的差异产生的,若采用小区平均值估算方差成分,则忽略了这部分方差,
的值仅为按单株数据估算的机误方差的1/
n
或1/
n
h
,人为减少了表型方差的值,使单株遗传力和家系内遗传力的估算结果显著偏高。因此遗传力的估算应采用单株数据进行,或采用小区平均值并单独估算机误方差(黄少伟 等,1998),同时尽量采用非偏态的数据。