Pseudonymized medical information for drug development: issues and suggestions
과학기술 연구에서 기초 자료 확보의 중요성은 양질의 많은 데이터를 필요로 하는 인공지능 기술의 등장과 더불어 더욱 증대되었다. 신약개발로 대표되는 의료 분야의 연구에서는 생명 데이터가 사용된다. 생명 데이터는 복잡한 처리과정이 필요하여 인공지능 기술활용의 필요성이 높지만, 개인의 민감정보를 담고 있기에 사용에 많은 제약이 따른다. 개인정보 이용의 활성화를 위하여 이른바 ‘데이터 3법’ 개정안이 통과되었다. 개인정보 보호 법의 적용 범위에 가명정보의 개념이 새로이 포함 되었는데, 가명정보는 기존의 개인정보와는 달리 정보주체의 동의 없는 자유로운 처리가 가능하다는 점이 특징적이다. 그러나 법문 규정 상 가명정보의 의미가 명확하지 않아 개인정보 보호법의 해석과 적용에 어려움이 있을 것으로 생각된다. 광의의 개인정보 개념은 가명정보를 포함하지만, 개인정보 보호법에서는 가명정보를 일반적인 개인정보와는 다르게 취급한다. 일반적으로 사용 되는 개인정보, 가명정보, 익명정보의 정의와 비 식별화 기법으로부터 현행 개인정보 보호법 상 의료 가명정보의 개념을 이해하고자 하였다. 비식별화가 진행되면 개인정보는 가명정보 혹은 익명 정보가 되며, 이 과정에서 개인정보의 보호는 강해지지만 정보의 활용도는 감소한다. 도식을 이용 하여 정보주체와 정보활용자의 이해관계가 최적화되는 비식별화 정도를 결정하였다. 가명정보에서는 정보주체와 정보생산자가 일치하지 않으며, 그에 따라 여러 문제들이 발생한다. 가명정보의 유출로부터 개인이 식별될 위험이 있으며, 가명정보의 주체가 정보 제공의 대가를 받지 못하는 것이 문제될 수 있다. 가명정보 보유자가 개인정보를 무분별하게 처리하는 것 역시 정보주체의 의사와는 다르다는 점에서 검토할 가치가 있다. 정보활용 제외 신청 제도 도입, 정보 이용 내역의 통지 의무 부과, 개인정보 보호기금 제도와 가명정보 유출 시의 예외적 면책 사유 도입 등의 방법을 통해 정보주체의 권리를 보호하면서도 연구자의 정보활용을 촉진할 수 있을 것으로 기대된다.
In the era of artificial intelligence, the importance of data has been increased. Biological data, used in medical research including drug development, need the application of artificial intelligence due to their complexity. However, sensitive information included in those data limits their use. To facilitate the use of personal information, amendments for three different laws passed the National Assembly. The concept of pseudonymization was introduced to Personal Information Protection Act. Processing of pseudonymized information does not require consent of data subject. Because of its vague definition, the interpretation and application of pseudonymized information seems to be difficult. Although personal information includes pseudonymized information in the Definition Article, these two types of information are separate over the Personal Information Protection Act. To understand pseudonymized medical information, general concepts of personal information, pseudonymized information, and anonymized information, and the techniques for de-identification are introduced. Personal information changes to pseudonymized or anonymized information depending on the degree of de-identification. In this process, protection of personal information becomes stronger while the usability decreases. Optimal degree of de-identification is determined with schematic approach. In pseudonymized information, data subject and data producer are not the same. This results in several problems: the danger of personal identification, lack of compensation for the data subject, and indiscriminate processing of pseudonymized information by data possessor. It is expected that the introduction of (1) opt-out policy, (2) obligation of data usage notification, (3) personal information protection fund, and (4) exceptional exemption from responsibility for pseudonymized information leakage will protect both data subject and researcher using those data.