본 연구는 R을 기반으로 하여 벌점화 축소추정 기법을 활용한 유전체 선발 방법론들을 소개하고 이를 활용하여 요크셔 돼지의 산자수를 추정하고 비교 분석하고자 하였다. 비교하고자 하는 7가지의 벌점화 축소추정 기법은 다음과 같다: 능형회귀, 능형회귀 BLUP, LASSO, adaptive LASSO, fused LASSO, elastic net 그리고 SCAD. 농촌진흥청에서 제공한 519마리 암퇘지의 2,000개 유전자형 자료와 종속변수로 사용된 산자수가 연구에 사용되었다. 연구 결과의 비교 평가를 위해서 사용된 예측오차와 Pearson 상관계수에 따르면, 예측오차는 LASSO와 elastic net이 각각 0.6884과 0.6876으로 가장 작은 값을 가졌으며, 상관계수는 0.7466과 0.7388로 7가지 방법론 중에서 가장 좋은 예측력을 나타내었다. R을 활용한 이러한 연구 결과를 토대로 LASSO와 elastic net이 유전체 선발 기법 중 좋은 방법론임을 알 수 있었다.
The aim of this study was to introduce the genomic selection methods via regularized regression in R packages for estimating litter size using dense molecular markers of Yorkshire pigs. The predictive performance of seven regularized linear methods such as ridge regression, ridge regression BLUP, LASSO, adaptive LASSO, fused LASSO, elastic net and SCAD were comparatively evaluated through the simulation study. After implementation of quality control and normalization, the whole dataset provided by the Rural Development Administration remains 47,112 SNPs and litter size as the dependence variable on 519 pigs. The randomly selected 2,000 SNPs are used in simulation study by reason of reducing computation costs. According to results of the prediction error and the Pearson correlation used as the measure of comparing the comprehensive performance, LASSO and elastic net have 0.6883 and 0.6876 for the average prediction error and 0.7407 and 0.7388 for the average correlation, respectively. From these reasons, it is concluded that LASSO and elastic net is a good approach to genomic selection using R.