논문 상세보기

두 상업용 돼지 SNP 칩 간의 유전자형 일치율 및 데이터 호환성 평가 KCI 등재

Evaluation of Genotype Concordance and Data Compatibility between Two Commercial Porcine SNP Chips

  • 언어KOR
  • URLhttps://db.koreascholar.com/Article/Detail/449859
구독 기관 인증 시 무료 이용이 가능합니다. 4,200원
농업생명과학연구 (Journal of Agriculture & Life Science)
경상국립대학교 농업생명과학연구원 (Institute of Agriculture & Life Science, Gyeongsang National University)
초록

돼지 유전체 연구에서 Affymetrix와 Illumina의 SNP 칩은 널리 활용되지만, 플랫폼 간 기술적 차이로 인해 데이터 통합 및 비교 분석에 어려움이 있다. 본 연구는 Affymetrix Axiom® Pig55K와 Illumina PorcineSNP80v1 플랫폼 간의 데이터 호환성을 직접 비교하고, 두 플랫폼에서 생산된 데이터의 통합 및 활용을 위한 실질적인 가이드라인을 제공하고자 수행되었다. 동일한 127두의 돼지 샘플을 두 플랫폼으로 분석하여 유전자형을 호출하고, 각 플랫폼에 최적화된 품질 관리(QC)를 거쳤다. 공통 마커는 Illumina 프로브 서열을 돼지 참조 유전체(Sscrofa11.1)에 직접 정렬하여 식별하였으며, 이를 기반으로 유전자형 일치율 및 최소 대립유전자 빈도(MAF) 상관관계를 분석하였다. 최종적으로 두 플랫폼 간에 27,774개의 공통 마커가 식별되었으며, 전체 유전자형 일치율은 96.53%로 나타났다. 하지만 이는 극히 낮은 일치율을 보인 5개의 이상치(outlier) 샘플에 의한 것으로, 이들을 제외한 77개 정상 샘플에서의 일치율은 98.88% ~ 99.88%로 매우 높았다. 본 연구 결과는 플랫폼 간의 기술적 차이보다 분석 샘플의 품질이 데이터 호환성에 결정적인 영향을 미침을 보여준다. 샘플 품질이 보장된다면 두 플랫폼의 데이터는 상호 교차 활용이 가능할 만큼 높은 신뢰도를 가지며, 이는 대규모 데이터 통합 연구의 기반이 될 수 있음을 시사한다.

In porcine genomic research, SNP chips from Affymetrix and Illumina are widely utilized, yet technical differences between platforms present challenges for data integration and comparative analysis. This study was conducted to directly compare the data compatibility between the Affymetrix Axiom® Pig55K and Illumina PorcineSNP80v1 platforms and to provide practical guidelines for integrating and utilizing data from both. Genotypes were generated by analyzing the same 127 pig samples on both platforms, followed by platform-specific quality control (QC). Common markers were identified by directly aligning Illumina probe sequences to the porcine reference genome (Sscrofa11.1), based on which the genotype concordance rate and Minor Allele Frequency (MAF) correlation were analyzed. Ultimately, 27,774 common markers were identified between the platforms, with an overall genotype concordance rate of 96.53%. This was, however, skewed by five outlier samples with extremely low concordance rates; the rate for the remaining 77 high-quality samples was very high, ranging from 98.88% to 99.88%. These results demonstrate that the quality of the analytical samples, rather than the technical differences between platforms, has a critical impact on data compatibility. If sample quality is assured, data from both platforms possess high reliability for interchangeable use, suggesting a viable foundation for large-scale data integration studies.

목차
초록
Abstract
서론
재료 및 방법
    1. 공시동물 및 유전체 데이터
    2. 유전자형 데이터 처리 및 품질 관리
결과 및 고찰
    1. 플랫폼별 데이터 처리 및 품질 관리 결과
    2. 플랫폼 간 유전자형 일치율 분석
    3. 유전자형 불일치 패턴
    4. MAF 빈도와 유전자형 일치율
    5. 플랫폼 간 데이터 호환성 및 샘플 품질의 영향
    6. 유전자형 불일치의 원인과 클러스터링 방법론의 차이
    7. 플랫폼 간 마커 정보 검증 전략
    8. 연구의 한계 및 의의
References
Appendix 1. Genotype discordance pattern in high-quality samples (n=77) under fully automated genotyping.
저자
  • 노동훈(경상국립대학교 축산과학부 석사과정생) | Dong Hun Noh (Master Course Student, Division of Animal Science, Gyeongsang National University, Jinju, 52828, Korea)
  • 김지원(국립축산과학원 가축개량평가과 전문연구원) | Ji Won Kim (Research Associate, National Institute of Animal Science, RDA, Cheonan, 31000, Korea)
  • 강문혜(경상국립대학교 항공우주공학부 연구원) | Mun Hye Kang (Researcher, School of Aerospace Engineering, Gyeongsang National University, Jinju, 52828, Korea)
  • 정종현(정P&C연구소 전무이사) | Jong Hyun Jung (Director, Jung P&C Institute, Yongin, 16950, Korea)
  • 이상민(국립축산과학원 가축개량평가과 농업연구사) | Sang Min Lee (Researcher, National Institute of Animal Science, RDA, Cheonan, 31000, Korea)
  • 당창권(국립축산과학원 가축개량평가과 농업연구사) | Chang Gwon Dang (Researcher, National Institute of Animal Science, RDA, Cheonan, 31000, Korea)
  • 박병호(국립축산과학원 가축개량평가과 농업연구관) | Byoung Ho Park (Senior Researcher, National Institute of Animal Science, RDA, Cheonan, 31000, Korea)
  • 오상현(경상국립대학교 축산과학부 교수) | Sang Hyon Oh (Professor, Division of Animal Science, Gyeongsang National University, Jinju, 52828, Korea) Corresponding author