논문 상세보기

R을 이용한 벌점화 축소추정 기법 비교연구: 요크셔 돼지 산자수와 SNP에 대한 적용 사례 KCI 등재

A comparative Study of Regularized Regression Approaches using R: Application to SNP and Litter Size of Yorkshire P

  • 언어KOR
  • URLhttps://db.koreascholar.com/Article/Detail/280581
구독 기관 인증 시 무료 이용이 가능합니다. 4,000원
농업생명과학연구 (Journal of Agriculture & Life Science)
경상대학교 농업생명과학연구원 (Institute of Agriculture & Life Science, Gyeongsang National University)
초록

본 연구는 R을 기반으로 하여 벌점화 축소추정 기법을 활용한 유전체 선발 방법론들을 소개하고 이를 활용하여 요크셔 돼지의 산자수를 추정하고 비교 분석하고자 하였다. 비교하고자 하는 7가지의 벌점화 축소추정 기법은 다음과 같다: 능형회귀, 능형회귀 BLUP, LASSO, adaptive LASSO, fused LASSO, elastic net 그리고 SCAD. 농촌진흥청에서 제공한 519마리 암퇘지의 2,000개 유전자형 자료와 종속변수로 사용된 산자수가 연구에 사용되었다. 연구 결과의 비교 평가를 위해서 사용된 예측오차와 Pearson 상관계수에 따르면, 예측오차는 LASSO와 elastic net이 각각 0.6884과 0.6876으로 가장 작은 값을 가졌으며, 상관계수는 0.7466과 0.7388로 7가지 방법론 중에서 가장 좋은 예측력을 나타내었다. R을 활용한 이러한 연구 결과를 토대로 LASSO와 elastic net이 유전체 선발 기법 중 좋은 방법론임을 알 수 있었다.

The aim of this study was to introduce the genomic selection methods via regularized regression in R packages for estimating litter size using dense molecular markers of Yorkshire pigs. The predictive performance of seven regularized linear methods such as ridge regression, ridge regression BLUP, LASSO, adaptive LASSO, fused LASSO, elastic net and SCAD were comparatively evaluated through the simulation study. After implementation of quality control and normalization, the whole dataset provided by the Rural Development Administration remains 47,112 SNPs and litter size as the dependence variable on 519 pigs. The randomly selected 2,000 SNPs are used in simulation study by reason of reducing computation costs. According to results of the prediction error and the Pearson correlation used as the measure of comparing the comprehensive performance, LASSO and elastic net have 0.6883 and 0.6876 for the average prediction error and 0.7407 and 0.7388 for the average correlation, respectively. From these reasons, it is concluded that LASSO and elastic net is a good approach to genomic selection using R.

저자
  • 박민수(서울대학교 통계학과) | Minsu Park
  • 김태헌(농촌진흥청 국립축산과학원) | Tae-Hun Kim
  • 조은석(농촌진흥청 국립축산과학원) | Eun-Seok Cho
  • 김희발(서울대학교 식물동물생명공학부) | Heebal Kim
  • 오희석(서울대학교 통계학과) | Hee-Seok Oh Corresponding author