돼지 유전체 연구에서 Affymetrix와 Illumina의 SNP 칩은 널리 활용되지만, 플랫폼 간 기술적 차이로 인해 데이터 통합 및 비교 분석에 어려움이 있다. 본 연구는 Affymetrix Axiom® Pig55K와 Illumina PorcineSNP80v1 플랫폼 간의 데이터 호환성을 직접 비교하고, 두 플랫폼에서 생산된 데이터의 통합 및 활용을 위한 실질적인 가이드라인을 제공하고자 수행되었다. 동일한 127두의 돼지 샘플을 두 플랫폼으로 분석하여 유전자형을 호출하고, 각 플랫폼에 최적화된 품질 관리(QC)를 거쳤다. 공통 마커는 Illumina 프로브 서열을 돼지 참조 유전체(Sscrofa11.1)에 직접 정렬하여 식별하였으며, 이를 기반으로 유전자형 일치율 및 최소 대립유전자 빈도(MAF) 상관관계를 분석하였다. 최종적으로 두 플랫폼 간에 27,774개의 공통 마커가 식별되었으며, 전체 유전자형 일치율은 96.53%로 나타났다. 하지만 이는 극히 낮은 일치율을 보인 5개의 이상치(outlier) 샘플에 의한 것으로, 이들을 제외한 77개 정상 샘플에서의 일치율은 98.88% ~ 99.88%로 매우 높았다. 본 연구 결과는 플랫폼 간의 기술적 차이보다 분석 샘플의 품질이 데이터 호환성에 결정적인 영향을 미침을 보여준다. 샘플 품질이 보장된다면 두 플랫폼의 데이터는 상호 교차 활용이 가능할 만큼 높은 신뢰도를 가지며, 이는 대규모 데이터 통합 연구의 기반이 될 수 있음을 시사한다.
In porcine genomic research, SNP chips from Affymetrix and Illumina are widely utilized, yet technical differences between platforms present challenges for data integration and comparative analysis. This study was conducted to directly compare the data compatibility between the Affymetrix Axiom® Pig55K and Illumina PorcineSNP80v1 platforms and to provide practical guidelines for integrating and utilizing data from both. Genotypes were generated by analyzing the same 127 pig samples on both platforms, followed by platform-specific quality control (QC). Common markers were identified by directly aligning Illumina probe sequences to the porcine reference genome (Sscrofa11.1), based on which the genotype concordance rate and Minor Allele Frequency (MAF) correlation were analyzed. Ultimately, 27,774 common markers were identified between the platforms, with an overall genotype concordance rate of 96.53%. This was, however, skewed by five outlier samples with extremely low concordance rates; the rate for the remaining 77 high-quality samples was very high, ranging from 98.88% to 99.88%. These results demonstrate that the quality of the analytical samples, rather than the technical differences between platforms, has a critical impact on data compatibility. If sample quality is assured, data from both platforms possess high reliability for interchangeable use, suggesting a viable foundation for large-scale data integration studies.