Mar 5, 2011

문서검토 인공지능 소프터웨어가 변호사를 점차로 대체

문서검토를 할 수 있는 인공지능 소프트웨어가 점점 똑똑해지면서 소송 비용을 줄일 수 있게 하고, 변호사들을 대신하고 있다는 뉴욕타임즈 기사를 흥미롭게 읽었다.

한국 소송에는 없지만, 미국에서는 디스커버리가 소송에서 중요한 역할을 할 뿐 아니라, 비용과 시간도 많이 잡아 먹는다. 최근에는 이메일이 기업 내에서 의사소통 수단으로 중요하게 등장하면서 디스커버리를 위해 분석하고 제출하여야 하는 문서 자료의 양이 엄청나게 늘어 났다. 그래서 e-discovery라는 용어까지 등장하고, e-discovery 전문 변호사도 등장하였다.

디스커버리에 소요되는 시간과 비용이 얼마나 되는지를 대략이라도 보여 주기 위해, 내가 다니는 회사가 소송을 당했고, 내가 담당하는업무가 소송에서 문제되는 일과 관련이 있어서, 상대방 당사자가 내 이메일 가운데 소송 사건과 관련 있는 이메일을 모두 제출하라는 요청을 하였다고 가정을 해 보자. 요청을 받는 우리 회사는 먼저 내 이메일 계정에 저장되어 있는 이메일 기록을 백업을 받아 보존하는 조치를 취해야 한다. 나의 이메일 기록을 모두 제출할 필요는 없고, 요청받은 정보와 관련성이 있는 이메일만 제출하면 충분하지만, 관련성 있는 이메일을 골라 내기 위해서는 먼저 누구인가가 이메일을 읽고, 판단하고, 정리를 하여야 한다. 이제까지는 그 일을 인간, 즉 변호사가 하였다.

디스커버리에 투입되는 시간과 비용을 대략이라도 보여 주기 위해 다음과 같은 가정을 해보자: 내가 다니는 회사가 임금 관련 소송을 당하였다. 나는 회사 인사부에서 근무를 하면서, 승진, 이동배치, 임금에 관한 업무에 직간접으로 관여를 한다. 내가 회사 메일을 통해 하루에 이메일 40개를 받고, 10개에 대해 답장을 한다.

그러면 내 이메일 계정 안에는 하루 50개 이메일이 저장되어 있다. 소송에서 문제되는 기간이 1년이고, 각종 휴일, 휴가를 빼고 실제 업무하는 날들이 200일이라고 하면, 50 X 200개, 즉 10,000개 이메일이 검토되어야 한다. 그런데 회사 내에서 나와 관련이 있는 업무를 하는 사람이 10명이라고 한다면 이메일은 10만 개가 된다. 관련되는 기간이 길어지거나, 관련 업무를 하는 사람들이 늘어난다면 검토해야 하는 이메일 숫자는 쉽게 1백만, 1천만 개로 늘어날 수 있다. 이메일 하나가 문서 1쪽에 불과할 때도 있지만, 몇 페이지에 이르고 첨부파일이 첨부된 이메일도 있으므로 10만 개 이메일은 쪽수로 환산하면 쉽게 1백만 쪽이 넘어 갈 수 있다.

종전에는 이러한 검토 작업을 시간 당으로 보수를 받는 변호사들이 수행을 하였다. 아무리 관련성이 없는 내용은 빠르게 읽고 지나가거나, 반복되는 내용이 있다고 하더라도, 1백만 쪽에 이르는 문서를 읽고 이해하고 정리하는데는 몇 주 또는 몇 달이 걸릴 수 있다. 시간이 많이 걸리면, 그에 따라 변호사 비용도 늘어난다.

이러한 비용 문제를 해결하기 위해 컴퓨터가 등장하였다. 컴퓨터가 수행한 가장 기본적인 작업은 이메일들 가운데 소송과 관련성이 있는 내용을 담은 이메일을 걸러내는 것이다. 소송이 임금과 관련이 있으므로, 컴퓨터가 이메일을 검색하여 그 가운데 "월급, 봉급, 보너스, 상여금"과 같은 관련성 있는 단어를 포함하는 이메일만을 골라 낸다면, 인간이 해야 하는 작업은 많이 줄어들 수 있다.

하지만, 그 관련 단어가 포함되어 있다고 해서 반드시 그 이메일이 소송과 관련이 있는 것은 아니다. 고등학교 친구로부터 '월급'을 받으면 한턱 내라는 사적인 이메일이나, 신상품을 구매하면 '보너스' 포인트를 주겠다는 카드 회사의 광고성 메일도 '월급,' '보너스'라는 단어가 포함되어 컴퓨터가 변호사의 검토가 필요한 이메일로 분류할 가능성이 있다. 그래서 컴퓨터가 한번 걸러낸 문서를 검토하는데도 여전히 많은 시간과 비용이 소요될 수 있다.

그런데, 최근에는 e 디스커버리 소프트웨어가 진화를 하면서, 이메일에 담긴 의미, 사건과 관련성, 이메일 간의 연과성, 메신저나 전화 통화 내역과 연관성, 대화의 분위기와 같은 이제까지 '인간'만이 할 수 있었던 검토작업까지 컴퓨터가 할 수 있게 되었다고 한다. 예를 들어 A와 B가 이메일을 주고 받다가, 갑자기 '전화할게'라는 말로 이메일이 중단되고, 두 사람이 전화통화를 한 기록이 있다면, 그 두 사람이 이메일로 남기고 싶지 않은 비밀스럽거나 의심스러운 대화를 하였다는 정황 증거가 될 수 있는데, 그러한 점들을 소프트웨어가 포착을 할 수 있다고 한다. 그 밖에도 격식 없는 말투로 이메일을 주고 받다가, 갑자기 격식 있는 공식적 표현을 쓰기 시작하는 시점도 면밀한 검토가 필요한 이메일 대화로 잡아 낸다고 한다.

이와 같은 문서검토 인공지능 소프트웨어를 통해 미국 소송의 당사자들은 많은 시간과 비용을 절약할 수 있게 되었다. 하지만, 변호사 고용을 필요로 하는 일자리는 많이 줄어들게 되었다고 한다.

이 기사에서 직접 다루고 있지는 않지만, 개인적 견해로는 미국에서 소송을 당하는 한국 기업들이 인공지능 소프트웨어의 혜택을 빠른 시간 내에 볼 수 있을지는 의문이다. 현재도 소프트 웨어로 한국어 문서를 key word 검색을 하여 1차로 문서를 걸러내는 작업은 가능하다. 하지만, 인공지능으로 문서의 의미를 파악하는 소프트웨어를 개발하기 위해서는 한국어가 기업업무용 이메일에서 어떻게 사용되는지에 관한 광범위한 연구가 필요하기 때문이다. 현재 미국의 문서검토 인공지능 소프트웨어는 엔론 사건에서 얻어진 5백 만개 이메일이 수년 전에 일반에 공개되어, 언어학자들과 컴퓨터 과학자들이 그 이메일들을 분석 연구한 덕분이라고 한다. 하지만, 그러한 광범위한 이메일 기록은 개인 정보 및 사생활 보호 문제가 있기 때문에 공개되기가 쉽지 않은데, 인공지능 문서검토 소프트웨어 개발을 가능하게 할 정도 분량의 한국어 이메일이 언제 확보될 수 있을지는 아직 불분명하다.


Armies of Expensive Lawyers, Replaced by Cheaper Software - NYTimes.com

No comments:

Post a Comment