Prospects of Applying Machine Learning Techniques to Support Judicial Decisions
인공지능은 우리가 매일 들고 다니는 휴대폰을 비롯한 생활 전반뿐만 아니라 모든 사회 영역에까지 침투하고 있다. 특히 최근에 대두된 인공지능의 학습방법으로서의 머신러닝 기법의 발달로 이제 인공지능은 엄청난 양의 데이터를 학습하면서 성장해나가는 형태를 기본으로 하고 있다. 사법절차를 비롯한 분쟁해결영역도 인공지능이 넘보는 분야에서 더 이상 예외가 아니다.
언뜻 생각하면 법체계는 언어, 논리, 그리고 개념 간의 관련성이 지배하는 영역이어서, 전자적⋅기계적인 분석방법이 적극적으로 도입될 수 있는 분야로 비추어지나, 실제로 아직까지는 법 영역에서 자연어처리나 머신러닝 기법은 기대만큼의 성과를 내지는 못하고 있다.
최근 판결의 결과를 예측하는 시스템을 개발하는 연구들이 활발한데, 현재까지 공표된 대부분의 판결예측 연구들은 일단 사실관계는 확정을 해둔 채, 해당 사실관계의 특징적인 요소들이 담긴 기존 사례들을 분석하여 인간이 하는 것과 유사한 결론을 도출하는 과정으로 이루어진다. 그에 비하여 날 것 그대로의 증거들을 분석하여 허위의 주장이나 증거들을 걸러내고 진실한 사실관계를 재구성하는 정도에 이른 연구들은 찾아보기 힘들다.
특히 우리나라의 경우에는 인공지능이 학습에 필요한 충분한 판례 데이터를 확보하지 못하기가 어렵다는 점이 많이 지적되고 있는 현실이다. 다만 판결문을 훈련데이터로 활용하게 되더라도, 이 유기재가 생략된 판결문도 많다는 점이나 판사 개인이 판결 이유를 기재하는 방식이 훈련데이터의 분석에 영향을 끼칠 수도 있다는 점 등을 유념 해야 한다. 또한 판결문 등 기존 훈련데이터에 편향성이나 오류가 내재되어 있다면, 인공지능의 학습도 당연히 영향을 받을 수밖에 없다. 나아가 인공지능이 추상적인 불확정개념의 해석이나 적용 까지도 할 수 있을지는 아직 의문이다.
인공지능 판사의 출현은 적어도 단시일에 이루어지지는 않을 것이고, 단기적으로는 인공지능을 활용하여 판사의 업무를 보조하는 역할을 더 기대해볼 수 있겠다. 인공지능이 사법분야 내에서 활동할 수 있는 영역을 구체적ㆍ세부적으로 연구 하는 작업은, 인간 법관이 주도권을 잡은 채로 인공지능이 보조적인 역할을 하는 시대에서 인공지능을 활용할 수 있는 영역을 효과적으로 짚어내는 데에 도움이 될 수 있다.
다만 점차적으로 판사를 보조하는 지위에서 어느새 조금씩 인간 판사의 판단을 잠식할 위험성은 항시 경계해야 한다. 특히 인공지능 시스템이 개선될수록 판사가 인공지능이 작성한 보고서나 판결문 초안에 과도하게 의지하여 기계적, 통계적인 판단만을 내리게 될 위험을 조심해야 한다.
Artificial intelligence is rapidly penetrating into our daily lives, including social sectors. Especially with the advent of machine learning techniques, artificial intelligence systems are continuously evolving thanks to advanced neural network techniques which allow the processing of gigantic amount of data sets. Dispute resolutions, including the judicial process, is not a safe harbor anymore from the invasion of artificial intelligence.
Some consider the legal system, a structure of correlations among language, logic and concepts, should be a sector where mechanical and systematic approach could be easily applied. Contrary to these expectations, natural language processing techniques concerning legal texts are not yet showing significant progress in legal sectors. One reasons is because there is a shortage of tools to convert unsorted legal texts to analyzable data objects.
Recently several previous studies on predicting judicial decisions, namely ‘mimicking the human judge’, have been published. Most studies primarily focus on predicting the probable judgments that the court would have made through analyzing the given facts and matching the most similar precedent(or a combination of existing multiple cases), with the assistance of cutting-edge machine learning algorithms. However, it is yet difficult to find studies attempting to emulate another important role of a human judge which is fact-finding, by trying to deduct facts from conflicting evidence and claims.
In Korea, one of the main obstacles to the development of judgement prediction systems is that public access to most court decisions is not permitted. Even if utilizing court decisions as training data becomes possible, it should be noted that in certain types of cases, judges are allowed to omit their rationale in their judgements, and judges’ personal style of writing decisions might affect the training data. Machines are also susceptible to errors or biases in judgements. Indefinite legal concepts still remain as a challenge for legal artificial intelligence.
An AI judge might not suddenly appear in a short period. Nonetheless, examining the specific areas within the judicial system to which machine learning techniques could be practically applied will be useful in determining ‘the scope of assistance’ from legal computation systems. Nevertheless, we should constantly stay on guard against the risk that this legal machine’s assistance and influence could gradually expand to the point where a machine’s decision takes priority over a human’s.