서언
재료 및 방법
자원 선발 및 처리
NIRS를 이용한 아밀로스 및 단백질 함량 측정
자원들의 다양성 지수 계산
확률밀도함수와 정규분포
분산분석(ANOVA)
Duncan의 다중검정(Duncan’s multiple range test: DMRT)
결과 및 고찰
벼 유전자원의 집단분석
국가별 품종 육성 방향
벼 육성품종의 국가별 특성
적요
서언
쌀(Oryza sativa L.)은 세계 3대 곡물중의 하나이며 우리나라를 포함한 아시아 지역에서 전 세계 쌀 생산량의 90% 이상이 생산되는 중요한 식량원이다(Juliano, 2003; Kim et al., 2012). 쌀의 주요성분은 아밀로스와 단백질로 구성되며 품종에 따라 성분 함량이 다르다. 쌀을 주식으로 하는 나라에서는 이들 성분의 특정 함량을 가진 쌀 품종을 선호하는 경향이 있으며, 따라서 품종육성연구의 경우 아밀로스 성분이 중요 지표 자료로 활용되기도 한다(Kim, 2004). 아밀로스와 단백질은 쌀의 미질을 결정하는 중요한 이화학적 특성이고 품질관련변수이며 취반특성 뿐만 아니라 물리적 특성에도 영향을 준다(Son et al., 2002; Champagne et al., 1997).
Near-Infrared Reflectance Spectroscopy (NIRS)는 시료에 근적외선이 조사될 때 특정 작용기가 특정 파장의 빛을 흡수한 결과 분자진동을 일으키게 되는데 이러한 흡광현상은 시료 내 존재하는 작용기들의 농도에 비례한다는 램버트 비어 법칙에 근거한 정량분석방법이다. 농산품의 경우 주요구성 성분인 지방(C-H), 수분(O-H) 및 단백질(N-H, S-H)이 근적외선을 흡수하므로 근적외선 분광 분석법을 이용해 이들 성분의 동시 분석이 가능하다(Williams et al., 1987). 근적외선 영역에서의 스펙트럼은 측정하는 시료내의 다양한 성분들 간의 흡수파장대가 서로 중첩되거나 시료 입자 크기와 밀도 등과 같은 물리적 요인들에 의해 스펙트럼 바탕선의 변화가 일어나는데, 이러한 오차를 줄이고 겹쳐있는 파장들을 분리하기 위해 전용 프로그램을 사용하여 스펙트럼을 보정하고 수학적 전처리를 수행하게 된다(Ahn and Kim, 2012). 이후 습식분석결과와 근적외선 스펙트럼간의 상관관계를 회귀분석을 통해 NIRS 예측모델을 개발한다.
개발된 모델이 적용된 NIRS를 이용하여 벼 자원의 아밀로스와 단백질 함량을 측정하고, 그 결과로 얻어진 성분함량 data는 통계 처리 과정을 거쳐 특성경향 분석에 활용된다. 농업분야에서 많이 사용되는 통계처리방법에는 분산분석(ANOVA)과 덩컨다중검정(DMRT)이 있다. 분산분석은 두 개 이상 집단들 간의 평균 차이를 비교하기 위하여 집단 간 분산과 집단 내 분산을 계산하고 이들 상호간의 비를 이용하는 방법이다. 세 개 이상의 표본평균들이 같은 모집단에서 나온 것인지를 검정하며, 실험에 관련된 요인들 가운데 가장 큰 영향을 끼치는 것을 찾아내는 분석법이다(Kim, 2016; Pak and Oh, 2010; Park et al., 2016). ANOVA를 통해 집단들 간의 평균들이 유의미하게 차이가 있다는 결과를 얻게 되면 이후 DMRT를 사용하여 각 집단들 간의 평균차이를 상호 비교하여 구체적으로 어느 집단 간에 차이가 있는지를 검정한다. 이러한 통계처리는 연구 결과의 신뢰도를 높일 수 있으므로 다양한 연구 분야에 적용되고 있다. 특정 식물에 존재하는 항산화, 항염증, 항혈전 물질 함량과 활성간의 유의성 검정(Kim and Cha, 2017; Sim et al., 2017; Oh et al., 2002), 작물의 생장과 환경요인 상호간 영향 평가(Lee et al., 2017; Nam et al., 2015; Sung et al., 2014; Kim et al., 2010; Yang et al., 2001), 작물 생장환경의 인위적 변화 또는 화학물질 처리가 작물 생장에 미치는 영향 평가(Choi and Jung, 2017; Lim et al., 2015; Song, 2015; Lee et al., 2010), 작물의 잔류 농약 함량 변화 조사(Son et al., 2013; Jang et al., 2011) 등의 연구가 보고되었다.
본 연구에서는 농업유전자원센터에 보존되어있는 벼 육성품종 유전자원의 아밀로스 및 단백질 함량에 관한 NIRS 성분 분석 자료를 근거로하여 Normal Distribution, Variability Index Value (VIV), ANOVA, 그리고 DMRT를 수행하였다. 보존자원의 다양성과 성분함량에 따른 자원 집단을 구분하였고, 육성품종의 국가별 기준점에 대하여 통계분석을 통해 차이점을 확인하였다. 따라서 국가별 벼 육성품종 자원의 품종개발 방향과 다양성에 대한 통계적 유의성을 검정하고자 이 연구를 수행하였다.
재료 및 방법
자원 선발 및 처리
본 실험에 사용한 국내외 육성품종 벼 유전자원은 농업유전자원센터 GMS 프로그램을 이용하여 한・중・일 등 80개국에서 수집된 자원을 대상으로 IT Number 기준으로 정렬하여 총 6,157자원을 선발하였다(Table 1). 선발자원 각각의 종자 50립을 실험실용 현미기로 탈영시킨 후 사미, 피해립을 제거하여 현미립을 준비하였다. 이 후 분쇄기로 약 2분간 분쇄하여 균일한 현미가루 상태로 만든 후 NIRS를 이용하여 현미시료의 아밀로스함량과 단백질함량을 측정하였다. 종자와 준비된 현미시료들은 13℃ 저온저장고에 보관하여 수분함량 14% 이하 상태를 유지하였다. 수분함량 분석은 곡류 및 곡류제품-수분함량측정(산업통상자원부 국가기술표준원, 표준번호: KS H ISO 712)을 참조하여 수분측정기(Shimadzu, Japan)를 사용하여 130℃ 온도조건에서 측정하였다.
Table 1. Origin distribution of rice variety germplasm used in this study
Origin | Number of accessions | Ratio of accessions (%) |
China | 1,542 | 25.04 |
Japan | 1,409 | 22.88 |
Korea | 413 | 6.71 |
India | 287 | 4.66 |
Bangladesh | 256 | 4.16 |
Philippines | 246 | 4.00 |
Taiwan | 122 | 1.98 |
Unknown | 404 | 6.56 |
The others | 1,478 | 24.01 |
Total | 6,157 | 100 |
NIRS를 이용한 아밀로스 및 단백질 함량 측정
현미가루 시료 약 600 ㎎을 micro insert ring을 끼운 mini sample cup에 채운 후 sample cup backs를 이용하여 시료 내 공극을 없애준 후 실온조건 가시광선 및 근적외선 대역(400-2500 ㎚)에서 한 자원 당 2반복하여 스펙트럼을 측정하였다. 스펙트럼 측정은 NIRS (FOSS, XRD near-infrared)를 사용하였고, 아밀로스 및 단백질 함량 계산은 개발된 NIRS 예측모델이 입력된 NIRS 구동 전용프로그램인 ISI scan (FOSS, ver. 4.2.0)을 사용하였다.
자원들의 다양성 지수 계산
다양성 지수는 자원들 간의 차이를 나타내기 위한 수단이지만, 수치화된 지표가 없으므로 분자생물학분야에서 사용되는 계산식을 적용하여 이를 다양성지수로 표시하고자 하였다. 아밀로스와 단백질 함량구간을 2% 함량단위로 나누고 각 함량구간에 속하는 자원수(ni)를 전체 자원수(6,157)로 나누어 다양성 확률값을 계산했다. 다양성지수가 1에 가까울수록 집단의 다양성은 커진다. 각 확률값을 제곱하고 모두 합산 후 1에서 뺀 값으로 다양성지수 VIV (Variability Index Value)를 구하였다.
확률밀도함수와 정규분포
육성품종 총 6,157(N) 자원에 대하여 NIRS 측정결과로 얻어진 아밀로스 및 단백질 함량 자료를 도수분포표로 정리하였다. 이 분포 표를 근거로 하여 확률밀도함수를 만들었으며, 정규분포와 비교하여 함량별 자원분포 특성을 확인하였다. 정규분포곡선은 육성품종 전체 자원에 대한 아밀로스와 단백질 함량 각각의 평균값과 분산값을 구한 후 엑셀프로그램의 정규분포함수(NORM.DIST)에 이들 값들을 입력하여 구했다. 계급은 아밀로스는 0.5 함량구간, 단백질은 0.25 함량구간으로, 계급폭(n, class width)은 아밀로스는 0.5, 단백질은 0.25, 계급값(xi, class midpoint)은 각 계급의 중간값으로 정하여 도수분포표를 작성하였고, 이를 바탕으로 엑셀프로그램(Excel 2010)을 이용하여 히스토그램을 그렸다. 아밀로스 및 단백질 함량의 확률밀도함수를 나타내기 위해 히스토그램의 y축 값은 확률밀도를 나타내는 Pi (확률)/n (계급폭)값으로, x축 값은 계급값들을 연속확률변수형태(contents range)로 표시하였다. 단백질 함량 도수분포표(Table 2)로부터 엑셀프로그램을 이용하여 확률밀도함수 그래프를 그렸다(Fig. 1). 아밀로스 자원에 대해서는 동일한 방법으로 작성되기 때문에 Table과 Figure를 생략하였다.
Table 2. Frequency distribution table for probability density function on protein contents of rice germplasm
분산분석(ANOVA)
육성품종 중 높은 자원비율을 차지한 중국 원산지 자원 1,542자원, 일본 원산지 자원 1,409자원, 한국 원산지 자원 413자원, 인도 원산지 자원 287자원들을 대상으로 분산분석을 이용하여 평균함량들 간의 유의성을 평가하였다. 독립변수는 국가별 자원 집단(t)으로, 종속변수는 아밀로스와 단백질 함량(X)으로 설정하였다. 분산분석에 관한 이론적 배경과 관련 통계량에 대하여, 귀무가설(H0)은 ‘모든 평균은 다 같다’이고, 대립가설(H1)은 ‘평균들이 모두 같지는 않다’이다. 가설검정 과정에서 H0이 맞지만 기각하게 되는 제I종 오류가 발생할 확률의 최대 허용한계를 유의수준(α)이라고 한다. α=0.01은 제I종 오류의 최대 크기가 0.01 즉, 잘못된 판단을 할 확률이 0.01라는 것이며 ‘1%유의수준’이라고 말한다. SST (총제곱합)는 으로 표현되며, SSB (군간제곱합)는 , SSW (군내제곱합)은 으로 정의되어있다. 이들 간의 관계는 SST=SSB+SSW와 같다. n은 전체 집단(그룹)의 수, ni는 한 집단 내 관찰값의 총 개수(집단의 크기)를, N은 전체 집단 내 관찰 값의 총 개수를 의미하며, 또한 N은 n과 ni의 곱의 값과 동일하다. 육성품종 중 자원비중이 높은 중국, 일본, 한국, 인도에서 수집된 자원들의 아밀로스와 단백질 함량 분포가 정규분포를 이루고, SSB 값이 SSW 값보다 전체적으로 크게 되면 각 그룹간의 차별성이 인정되어 결과적으로 각 그룹들은 서로 다른 아밀로스 함량 평균값을 가진다고 판단할 수 있게 된다. 편차제곱 합들(SST, SSB, SSW)은 각각의 자유도를 가진다. 전체 집단의 수를 K, 전체 집단의 크기(전체 집단의 확률변수 총 개수)가 N일 경우에 SST 자유도는 N-1, SSB는 K-1, SSW는 N-K이다. SST 자유도는 SSB 자유도와 SSW 자유도의 합이다. 편차제곱합을 자유도로 나눈 것을 편차제곱합의 평균(MSS)이라 하며, 이는 MSSB와 MSSW로 구분된다. 군간편차제곱합의 평균(MSSB)은 , 군내편차제곱합의 평균(MSSW)은 로 표현된다. 검정통계량(Fs)은 군간편차제곱합의 평균을 군내편차제곱합의 평균으로 나눈 값으로 정의된다.
위의 편차제곱합의 정의를 근거로하여 분산분석표 작성에 필요한 통계량 SST, SSB, SSW를 계산하였다. 실제 분산분석을 위한 각 편차제곱합들의 계산에서 항이 SST와 SSB에 동일하게 나타나 계산 과정이 간단해지기 때문에 SST와 SSB를 먼저 구한 후 SST=SSB+SSW 관계를 이용하여 SSW를 구했다. 계산에 필요한 항목은 Xi의 합(), 의 합(), ni 값, 단 세 가지뿐이며 각 통계량의 정의식과 계산식은 아래와 같이 표현된다.
전체 집단의 수(K)는 전체 원산지 수인 4, 전체 집단의 크기(N)는 각 원산지 자원수의 총 합이므로 3,651이었다. 따라서 SST 자유도는 N-1인 3,650, SSB 자유도는 K-1인 3, SSW 자유도는 N-K인 3,647이었다. 아밀로스 함량의 편차제곱합의 평균(MSS)은 편차제곱합을 자유도로 나눈 값이므로 MSSB()는 , MSSW()는 로 처리하였다. 검정통계량(Fs)은 MSSB를 MSSW로 나눈 값이므로 였다. 단백질 함량의 편차제곱합의 평균(MSS)은 편차제곱합을 자유도로 나눈 값이므로 MSSB는 , MSSW는 로 처리하였다. 검정통계량(Fs)은 MSSB를 MSSW로 나눈 값이므로 였다. 기각값은 통계교과서에 수록된 F-분포표를 참조하여 구했다. 분자의 자유도(SSB 자유도)는 3, 분모의 자유도(SSW 자유도)는 3,647이므로 유의수준 0.01의 경우 기각값은 3.78이었고, F0.01(3,3647)=3.78과 같이 표시하였다. 모든 통계량이 결정되어 분산분석표(Table 6, Table 7)를 작성하고 이를 바탕으로 검정 결과를 해석하였다.
Duncan의 다중검정(Duncan’s multiple range test: DMRT)
분산분석과정에서 귀무가설이 기각되어 각 집단 간 ‘평균들이 모두 같지는 않다’는 가설이 성립되면 이는 두 개 이상의 평균이 같지 않다는 뜻이며, 어느 집단 간의 평균들이 차이가 있는지는 알 수 없다. 이 같은 경우 평균의 다중비교 방법을 사용하여 각 집단들 간 평균 비교를 할 수 있다. 다중범위검정의 이론적 배경은 여러 개의 평균들을 상호 짝을 지어 반복 비교하더라도 제1종 오류(평균간 차이가 없음에도 평균간 유의차가 있는 것으로 판단하는 오류)가 일정 유의수준(0.01 또는 0.05)을 넘지 않는 구간(유의범위)을 정하여 평균간 차이와 비교하는 방법이다. 평균 간 차이가 유의하다고 판단할 수 있는 ‘최소유의차(LSD)’ 또는 ‘최소유의범위(LSR)’를 구하여 두 평균 간 차이를 비교하여 두 평균간 차이가 최소유의차 또는 최소유의범위보다 크면 두 평균은 유의하게 다른 것이고 작으면 유의차가 없는 것이다. LSD는 t 검정이며, 이는 두 집단 간 비교에 이용된다. 따라서 다중검정에 적용할 경우 제1종 오류를 범할 위험성이 있다. 이를 보완한 방법이 덩컨방법(Duncan)이며, 비교하는 평균들 간의 거리에 따라 서로 다른 유의범위를 적용한다. 농학 연구 분야에서는 주로 최소유의차(LSD)와 덩컨방법(Duncan)이 많이 적용되며 본 연구에서는 덩컨방법을 사용하였다. 덩컨의 다중범위검정은 평균을 크기순으로 정렬하고 가장 큰 평균부터 시작하여 가장 작은 평균까지 순차적으로 비교하게 되는데 이때 기준이 되는 값이 필요하다. 이 값을 최소유의범위(LSR)라고 하며, 전체 평균수(전체 집단수, K) 보다 1개 적은 LSR 값이 필요하다. 덩컨검정에 필요한 통계량은 아래 식과 같이 정의된다. 는 표준오차이며, 군내편차제곱합의 평균(MSSW)을 집단의 크기(n)로 나눈 수치의 양의 제곱근 값으로 구한다. 각 집단의 크기(n)가 서로 다를 경우는 n대신 nh값을 적용한다. SSR 값은 오차자유도, 전체 평균수, 유의수준(α)을 정한 후 ‘다중검정을 위한 스튜던트화한 범위표’를 참조하여 구한다.
육성품종 중 높은 자원비율을 차지한 중국, 일본, 한국, 인도 자원을 대상으로 분산분석결과 자원의 평균함량들 간의 유의성이 인정되어 덩컨다중검정을 실시하였다. 먼저 각 원산지 자원집단의 아밀로스 및 단백질 함량 평균값을 크기순으로 나열하고 1% 유의수준에서 계산된 LSR 값을 크기순으로 나열하는 것으로 덩컨 다중범위검정을 실시하였다. 가장 큰 평균에서 가장 큰 LSR을 뺀 값(기준값: -LSR1)을 크기순으로 나열되어있는 나머지 평균들과 비교하여 1% 유의수준에서 유의성 여부를 판단하였고, 유의성이 있는 경우에는 그 평균값에 밑줄 표시하였다. 두 번째 큰 평균에서 두 번째 기준값(-LSR2)과 나머지 평균들을 1% 유의수준에서 유의성을 검정하였으며, 유의성이 있는 경우에는 그 평균값에 밑줄 표시하였다. 이와 같은 과정으로 각 평균의 기준값을 구하여 동일한 방법으로 유의성을 검정하였다. 비교 기준값보다 평균값들이 클 경우에는(-LSR) 평균간 차이가 유의하지 않기 때문에 비교하는 평균값들에 대하여 공통의 밑줄 그어 동일 집단임을 표시하였다.
결과 및 고찰
벼 유전자원의 집단분석
육성품종 벼 6,157자원의 단백질 및 아밀로스 함량별 자원분포와 정규분포를 비교한 결과는 Figs. 2, 3, 4, 5와 같다. 히스토그램을 통해 얻어진 확률밀도함수와 정규분포 함수를 상호 비교하는 것으로 자원분포경향을 확인하였다. 단백질 확률밀도함수 자원분포곡선은 평균값 8.0, 표준편차 1.3인 정규분포함수와 유사성을 나타냈으며, 자원의 다양성 지수는 0.59였다(Fig. 2). 단백질함량 5.4-6.7% 구간의 자원 비율은 13.5%였고, 6.7-8.0% 구간은 34.0%, 8.0-9.3% 구간은 34.0%, 9.3%-10.6% 구간은 13.5%였다. 단백질함량 5.4-10.6% 구간(m±2σ)의 자원들이 전체자원의 95%를 차지했다. 전체 단백질함량 확률변수구간을 평균(m)값을 중심으로 표준편차(σ)값의 양의 정수배(1σ, 2σ)와 음의 정수배(-1σ, -2σ) 간격으로 분할하여 네 개의 집단으로 구분하였으며, 각각의 집단을 0.1% 함량단위로 나눈 후 이에 속하는 자원들 중 가장 빈도수가 높게 나타나는 국가의 자원을 대표자원으로 나타냈다(Table 3). 육성품종 전체 자원에 대한 아밀로스 함량분포의 정규분포함수에서는 확률밀도함수와 일치하지 않는 부분이 나타났으며, 정규분포곡선 속에서 뚜렷한 두 개의 집단으로 구분됨을 확인할 수 있었다. 이는 개략적으로 5.0-12.0% 구간과 16.0-31.5% 구간으로 대별되었다(Fig. 3). 두 개의 집단으로 구분되게 하는 아밀로스 함량구간은 12.5%에서 16.5%사이였으며(여기에 속하는 자원은 거의 없다는 의미임), 이로 인하여 전체 아밀로스함량 자원이 정규분포를 이루지 않았다. 따라서 두 개 집단을 각각 나누어 확률밀도함수와 정규분포함수를 구한 결과 정규분포함수와 거의 일치함을 알 수 있었다(Fig. 4, Fig. 5). Oh et al. (2017)은 육종분야에서 벼 분류 기준으로 사용되는 아밀로스 함량범위(Jeong et al., 2013; Song et al., 2008; Kim et al., 1991)를 바탕으로 NIRS 측정 아밀로스 함량에 대하여 9% 이하를 찰벼, 9% 이상을 메벼로 분류하였고, 메벼는 다시 저아밀로스(16.9-19.8%), 중아밀로스(19.8-25.6%), 고아밀로스(25.6%-28.5%) 자원으로 나누었다. 이 분류기준을 참고하여 Fig. 3의 전체 아밀로스 함량구간을 찰벼(5.9-11.5%)집단과 메벼(16.9-28.5%)집단으로 나누고 각각의 확률밀도함수와 정규분포를 나타냈다(Fig. 4, Fig. 5). 찰벼집단의 경우 자원분포는 평균값 8.7, 표준편차 1.4인 정규분포와 유사하였으며, 자원의 다양성 지수는 0.64를 나타냈다. 5.9-7.3% 아밀로스함량 구간의 자원 비율은 13.5%였고, 7.3-8.7% 구간은 34.0%, 8.7-10.1% 구간은 34.0%, 10.1%-11.5% 구간은 13.5%였다. 5.9-11.5% 함량구간(m±2σ) 자원들이 전체자원의 95%를 차지했다(Fig. 4). 찰벼 아밀로스함량 확률변수를 평균값을 중심으로 표준편차값의 양의 정수배(σ1, 2σ)와 음의 정수배(-1σ, -2σ) 간격으로 분할하였으며, 각 구간에 속하는 자원들을 성분함량 순으로 표시하였다(Table 4).
Table 3. List of resources classified with protein contents in rice variety germplasm
Table 4. List of resources classified with amylose contents in waxy type rice variety germplasm
메벼집단의 경우 아밀로스 함량 20-21% 구간에서 자원밀도는 높아졌고, 22-25% 구간에서는 자원밀도가 낮아졌다. 이를 제외하면 자원분포는 평균값 22.7, 표준편차 2.9인 정규분포와 유사하였고, 자원의 다양성 지수는 0.81이었다(Fig. 5). 이와 같이 일부 구간에서 자원밀도가 높거나 낮게 나타나는 것은 특정 아밀로스 함량을 선호하는 벼 육종 방향이 반영된 결과로 판단된다. 16.9-19.8% 저아밀로스 함량구간(m-2σ≦X≦m-σ; group 1)의 자원비율은 13.5%였고, 19.8-25.6% 중아밀로스(m-σ≦X≦m+σ; group 2, 3)는 68.0%였고, 25.6%-28.5% 고아밀로스(m+σ≦X≦m+2σ; group 4)는 13.5%였다. 16.9-28.5% 함량구간(m±2σ)에 속하는 자원들이 전체자원의 95%를 차지했다(Fig. 5). 메벼집단의 아밀로스 함량 전체 확률변수 구간을 저아밀로스(group 1), 중아밀로스(group 2, 3), 고아밀로스(group 4) 구간으로 나누고 각 구간에 속하는 자원들을 함량 순으로 표시하였다(Table 5).
Table 5. List of resources classified with amylose contents in common rice variety germplasm
이론적으로 히스토그램의 계급폭(n)을 무한히 작게 하여 확률밀도함수를 구하면 계단모양의 확률밀도함수는 부드러운 곡선 형태를 이루게 되어 세밀한 함수를 얻을 수 있다. 하지만 이와 같은 방법은 과정의 복잡함으로 인해 실제로는 이상적인 확률밀도함수인 정규분포를 구하여 도수분포표로부터 작성된 확률밀도함수와 상호 비교함으로써 자원 집단의 함량분포 특성을 파악하게 된다. 자원 집단의 확률밀도함수가 정규분포와 유사할 경우 정규분포의 표준화 과정을 이용하면 특정 함량구간의 확률값을 구할 수 있고, 이를 전체 자원수와 곱하면 특정 함량구간의 자원 비율을 계산할 수 있다. 이러한 특성을 활용하여 현재 보존 중인 자원들의 특성에 관한 확률밀도함수를 정하면 즉, 정규분포화 하게 되면 자원관리를 전산화할 수 있는 등 자원 관리의 효율성을 높일 수 있을 것으로 사료된다.
국가별 품종 육성 방향
독립변수를 몇 개의 수준(또는 범주)으로 나누고 각 수준에 따라 나누어진 집단 간의 평균차를 검정하는 방법(차의 검정)으로써 서로 다른 세 개 이상의 집단에서 평균간 차이가 있는 지를 확인하고자 할 때 분산분석이 이용된다. 독립변수를 아밀로스 또는 단백질 함량에 따라 나누고 종속변수를 육종의 목표점으로 정하여 국가별 육성품종 기준점이 상이한가를 검정해보고자 수집보존자원을 대상으로 통계분석을 실시하였다.
육성품종 중 높은 자원비율을 차지한 중국 원산지 1,542자원, 일본 원산지 1,409자원, 한국 원산지 413자원, 인도 원산지 287자원들을 대상으로 아밀로스 성분에 대한 분산분석을 실시한 결과 SSB 10,500.74, SSW 80,619.35를 얻었고, 또한 단백질 성분에 대한 분산분석 결과 SSB 245.08, SSW 5,522.88을 얻었다(Table 6, Table 7). 귀무가설(H0)은 ‘국가별 자원들의 함량 간 차이는 없다’로, 대립가설(1)은 ‘국가별 자원들의 함량 간 차이는 있다’로 설정하였다. 아밀로스함량에 대해서는 정규분포곡선 분석에서 두 개의 집단으로 구분되어 육성품종 벼 전체 자원을 찰벼집단과 메벼집단으로 나누어 실시하였으나 국가별 자원 간 비교에서는 통합하여 통계처리 하였다. 메벼집단에 비해 찰벼집단이 차지하는 비중이 낮기 때문에 표본 집단의 구성이 비교적 고르게 분포되어 있으므로 통계처리에 적합한 자원집단으로 판단되었기 때문이다.
아밀로스함량의 경우 검정통계량 Fs는 158.34였으며, 유의 수준 0.01, SSB 자유도 3, SSW 자유도 3,647일 때 F-분포표의 기각값(F0.01(3,3647))은 3.78이므로 검정통계량과 기각값의 비교에서 검정통계량의 값이 월등히 커서 귀무가설이 기각되고 대립가설이 채택되었다. 따라서 ‘벼 유전자원의 아밀로스 함량은 국가별 품종육성 기준이 다르다고 할 수 있으며, 1% 유의수준에서 차이가 인정된다’는 결론을 내릴 수 있었다(Table 6).
Table 6. ANOVA table of amylose contents in rice variety germplasm by countries
SV | df | SS | MS | Fs | Critical value (F0.01(3,3647)) | p |
SSB | 3 | 10500.74 | 3500.25 | 158.34** | 3.78 | 1.78e-96 (p<0.01) |
SSW | 3647 | 80619.35 | 22.11 | |||
SST | 3650 | 91120.08 |
단백질 함량의 경우 검정통계량 Fs는 53.95, 유의 수준 0.01, SSB 자유도 3, SSW 자유도 3,647일 때 F-분포표의 기각값(F0.01(3,3647))은 3.78이므로 검정통계량과 기각값의 비교에서 검정통계량의 값이 월등히 커서 귀무가설이 기각되고 대립가설이 채택되었다. 따라서 ‘벼 유전자원의 단백질 함량은 국가별 품종육성 기준이 다르다고 할 수 있으며, 1% 유의수준에서 차이가 인정된다’는 결론을 내릴 수 있었다(Table 7).
Table 7. ANOVA table of protein contents in rice variety germplasm by countries
SV | df | SS | MS | Fs | Critical value (F0.01(3,3647)) | p |
SSB | 3 | 245.08 | 81.69 | 53.95** | 3.78 | 4.12e-34 (p<0.01) |
SSW | 3647 | 5522.88 | 1.51 | |||
SST | 3650 | 5767.96 |
벼 육성품종의 국가별 특성
분산분석 결과 집단 평균 간 유의미한 차이가 검정되면 어느 집단에서 유의한 차가 있는 지를 검정하여야 하며 이때 사용되는 통계방법 중 하나가 덩컨의 다중범위검정(DMRT)이다. 이 방법은 각 집단들의 평균()과 LSR값을 비교하여 집단 간 평균차를 검정하는 방법이다. 분산분석결과 중국, 일본, 한국, 인도 자원들의 아밀로스 및 단백질 평균들 간의 유의성이 인정되어 어떤 국가별 자원들 간의 유의차가 있는지를 덩컨의 다중범위검정을 사용하여 확인하였다.
아밀로스 함량의 경우 계산된 는 0.2였고, 군내 자유도 3,647, 유의수준 0.01일 때 SSR값은 통계교과서에 수록된 ‘다중검정을 위한 스튜던트화한 범위표’를 참조하여 얻었다. 그 결과 계산된 LSR값과 아밀로스 평균함량과의 차를 기준값으로 정하여 다중범위검정을 실시하였다. 아밀로스 함량의 경우 인도자원, 중국과 한국자원, 일본자원의 세 집단으로 나눌 수 있었으며, 국가별 평균 함량은 각각 인도 25.46%, 중국 20.27%, 한국 19.99%, 일본 18.85%였다. 인도자원의 DMRT 기준값(Amylose-LSR0.01)은 24.68이었고, 나머지 세 자원들의 평균값보다 크기 때문에 유의성이 있었으며, 결과적으로 인도자원은 독립집단을 이룬다고 할 수 있다. 이에 대한 결과를 구체적으로 해석해 보면 인도자원은 인디카 품종으로 한국, 중국, 일본의 자포니카 품종과는 구분되는 아밀로스 함량 특성을 나타낸 것으로 사료된다. 중국자원의 기준값이 19.51이고 한국자원 평균값이 19.99, 일본자원 평균값이 18.85이므로(Japan 18.85<China 19.51<Korea 19.99) 중국자원과 한국자원은 유의성이 없고 중국자원과 일본자원은 유의성이 있으므로 중국자원과 한국자원은 동일 집단으로 간주되었고, 중국자원은 일본자원과는 다른 독립집단을 이뤘다(Table 8).
Table 8. DMRT table of amylose contents in rice variety germplasm by countries
Origin | Amylose (%) | SSR0.01 | LSR0.01 | Amylose-LSR0.01 | DMRT |
India | 25.46 | 3.90 | 0.78 | 24.68 (25.46-0.78) | 25.46 20.27 19.99 19.99 18.85 |
China | 20.27 | 3.80 | 0.76 | 19.51 | |
Korea | 19.99 | 3.64 | 0.73 | 19.26 | |
Japan | 18.85 | - | - | - |
단백질 함량의 경우 계산된 는 0.05였고, 군내 자유도 3,647, 유의수준 0.01일 때 SSR값은 ‘다중검정을 위한 스튜던트화한 범위표’를 참조하여 얻었다. 그 결과 계산된 LSR값과 단백질 평균함량과의 차를 기준값으로 정하여 다중범위검정을 실시하였다. 단백질 함량의 경우 인도와 중국자원, 일본자원, 한국자원의 세 집단으로 나눌 수 있었으며, 국가별 평균 함량은 각각 인도 8.17%, 중국 8.01%, 일본 7.73%, 한국 7.23%였다. 인도자원의 기준값은 7.97이고 중국자원의 평균값은 8.01, 일본자원 평균값은 7.73이므로(Japan 7.73<India 7.97<China 8.01) 인도와 중국자원은 유의성이 없고 인도와 일본자원은 유의성이 있으므로 인도자원과 중국자원은 동일 집단으로 간주되었고, 인도자원은 일본자원과는 다른 독립집단을 이뤘다. 일본자원의 기준값 7.55는 한국자원의 평균값 7.23 보다 크기 때문에 유의성이 있으므로 결과적으로 일본자원은 독립집단을 이룬다고 할 수 있다(Table 9).
Table 9. DMRT table of protein contents in rice variety germplasm by countries
Origin | Protein (%) | SSR0.01 | LSR0.01 | Protein-LSR0.01 | DMRT |
India | 8.17 | 3.90 | 0.20 | 7.97 (8.17-0.20) | 8.17 8.01 8.01 7.73 7.23 |
China | 8.01 | 3.80 | 0.19 | 7.82 | |
Japan | 7.73 | 3.64 | 0.18 | 7.55 | |
Korea | 7.23 | - | - | - |
인도자원의 아밀로스 평균함량은 25.46±3.43%였고, 단백질은 8.17±1.43%였다. 아밀로스의 경우 인도자원은 독립 집단을 구성하였고 단백질의 경우 인도자원과 중국자원은 동일 집단을 구성하였다. 중국자원의 아밀로스 평균함량은 20.27±4.69%였고, 단백질은 8.01±1.36%였다. 아밀로스의 경우 중국자원은 한국자원과 동일집단을 구성하였다. 한국자원의 아밀로스 평균함량은 19.99±4.30%였고, 단백질은 7.23±0.88%였다. 단백질의 경우 한국자원은 독립 집단을 구성하였다. 일본자원의 아밀로스 평균함량은 18.85±5.03%였고, 단백질은 7.73±1.12%였다. 일본자원은 아밀로스 및 단백질에서 다른 원산지 자원들과 구별되는 독립적인 집단을 구성했다(Table 10). 이러한 결과와 관련하여 국가별 육종기준이 다르다고 사료된다. 일본의 경우 벼 육종목표는 밥맛, 품질, 복합 내병성, 직파 적응성, 수량성의 5가지 항목에 중점을 두고 있으며 특히 밥맛검정 과정에서 NIRS를 이용하여 아밀로스, 단백질, 지방, 수분함량을 평가하고 있다(Park, 2005). 일본 소비자들은 아밀로스 함량이 낮은 품종을 취반, 섭취 시에 좋은 종으로 선호하기 때문에 육종방향은 낮은 아밀로스와 낮은 단백질 함량의 품종 개발에 있다고 사료된다. 일본 원산지 자원의 평균 아밀로스 함량(18.85%)은 한국 원산지 자원(19.99%)과 비교해서 대략 1% 정도 낮은 것으로 보고되었으며, 이는 본 연구 결과와도 일치하였다(Kim, 2004; Park, 2005).
Table 10. Amylose and protein contents in rice variety germplasm by countries
yMean separation within columns by Duncan’s multiple range test at p=0.01.
적요
본 연구는 선행연구에서 개발된 근적외선 분광분석(NIRS) 예측모델을 활용하여 측정된 국내외 육성품종 벼 유전자원의 아밀로스 및 단백질 함량 자료를 통계처리 하여 자원의 지리적 특성과 함량에 대한 정확한 정보를 제공하기 위해 실시하였다. 정규분포분석 결과 육성품종 벼 자원의 단백질 평균은 8.0%였고, 찰벼 아밀로스 평균은 8.8%였고, 메벼 아밀로스 평균은 22.7%였다. 전체자원의 95%를 차지하는 자원들의 함량범위는 단백질의 경우 5.4-10.6%, 찰벼 아밀로스는 5.9-11.5%, 메벼 아밀로스는 16.9-28.5%였다. 자원의 다양성지수는 단백질의 경우 0.59, 찰벼 아밀로스는 0.81, 메벼 아밀로스는 0.64였다. ANOVA, DMRT 처리 자원 수는 중국 자원의 경우 1,542, 일본은 1,409, 한국은 413, 인도는 287자원이었다. 국가별 아밀로스 평균함량은 일본 자원의 경우 18.85%, 한국 자원은 19.99%, 중국 자원은 20.27%, 인도 자원은 25.46%였다. 단백질 평균함량은 한국 자원의 경우 7.23%, 일본 자원은 7.73%, 중국 자원은 8.01%, 인도 자원은 8.17%였다. ANOVA 분석결과 벼 유전자원의 아밀로스 및 단백질 함량은 국가별 차이가 있었고 1% 유의수준에서 차이가 인정되었다. DMRT 분석결과 국가별 아밀로스 함량은 일본, 중국과 한국, 인도의 세 집단으로 나눌 수 있었으며 각 집단 간 아밀로스 함량차이는 1% 유의수준에서 차이가 인정되었다. 단백질 함량의 경우 한국, 일본, 인도와 중국의 세 집단으로 나눌 수 있었으며, 각 집단 간 단백질 함량차이는 1% 유의수준에서 차이가 인정되었다. 일본 자원은 가장 낮은 아밀로스 평균함량을 나타냈고, 한국 자원은 가장 낮은 단백질 평균함량을 나타냈다. 이에 비해 인도 자원은 가장 높은 아밀로스와 단백질 평균함량을 나타냈다. 이러한 지리적 분포에 따른 육성품종 벼 자원 간 함량 차이는 각 지역별 자원 선호도와 육종 방향이 반영된 결과라고 할 수 있다.