Predictive Coding

Automated document analysis technology underlies the structure of FRONTEO’s Artificial Intelligence “KIBIT”

미국에서는 민사소송 실제 심리 전, 원고와 피고가 서로 증거를 공개하고 각각의 쟁점을 정리하도록 하는 ‘디스커버리’라는 절차가 있습니다. 이에 따라 정해진 재판 일까지 증거가 될 수 있는 전자 데이터 및 서류를 적절한 절차에 근거하여 제출해야 합니다. 한국기업이라도 미국에서 사업을 하고 있다면 본사 데이터 센터에서 보유한 모든 전자 데이터가 증거자료로 채택되어 공개 대상이 됩니다.

기업이 증거자료를 공개할 수 없거나 불필요한 데이터를 공개했을 경우, 소송에서 불리한 상황으로 이어질 가능성이 큽니다. 그렇기 때문에 소송이 진행되는 즉시, 많은 양의 데이터 안에서 필요한 문서만 정확히 추출하는 것이 소송의 승패를 좌우하는 열쇠가 됩니다.

한 대의 PC에 저장되어 있는 디지털 정보의 양이 2톤 트럭 4대 분과 같다는 빅데이터 시대입니다. 한 건의 소송에서 취급하는 데이터의 양이 1 테라바이트를 넘어서는 일도 흔히 발생하고 있습니다.

기존에는 eDiscovery를 위해 변호사들이 중요 문서를 직접 조사하고 일일이 확인할 수밖에 없었습니다. 그러나 이런 방식의 문서 분석으로는 빠르고 정확한 작업 진행을 기대하기 어렵다는 한계가 있습니다. 이 문제를 해결할 수 있는 솔루션이 바로 FRONTEO에서 자체 개발한 Predictive Coding 입니다.

What is Predictive Coding?

Predictive Coding은 텍스트마이닝 기술과 인공지능 기술을 기반으로 FRONTEO가 자체 개발한 자동 문서 분석 소프트웨어입니다. 변호사가 중요한 데이터라고 의사 결정을 내리는 패턴을 학습한 Predictive Coding은 수많은 양의 데이터에서 중요 문서를 자동으로 분류해냅니다. Predictive Coding을 활용한 데이터 분석은 사람이 행하는 분석보다 4,000배 이상 빨라, eDiscovery 과정에서 가장 큰 비용을 차지하는 Document Review 공정을 대폭 단축시켜 전체적인 비용 절감 효과를 거둘 수 있습니다. 또한 키워드 검색 설정 실수로 추출할 수 없었던 중요한 문서까지 빠짐없이 추출 가능하므로 중요 문서 추출 누락의 위험을 최소화 할 수 있습니다.

FRONTEO’s Unique Approach to Predictive Coding

FRONTEO의 Predictive Coding은 한국어를 비롯한 일본어, 중국어 등 멀티 바이트로 구성된 아시아 언어 분석에 특화되어 있어, 문서 내 모든 한글 텍스트를 완벽하게 추출합니다. 또한 국내 기업에서만 사용하는 고유한 형태의 파일까지도 처리 가능하므로 특수한 확장자로 작성된 중요 문서가 검토 과정에서 누락되는 위험을 방지할 수 있습니다.

Predictive Coding provides the basis for "KIBIT"

FRONTEO의 Predictive Coding은 Data Scientist 역할의 상당 부분을 대신하고 있습니다. EDiscovery Processing 작업 자체가 대량의 데이터를 분석하고 정리하는 것인데, 이는 바로 Data Scientist에게 요구되는 과정과 유사하기 때문입니다.

FRONTEO는 자체 개발한 Predictive Coding을 한층 더 진화시킨 인공지능 기반 데이터 분석 솔루션 KIBIT을 개발했습니다. FRONTEO는 지금까지 국제 소송 분야에서 오랜 경험을 쌓아온 빅데이터 분석 분야 선구자로서, 앞으로도 다양한 지식과 노하우를 바탕으로 빅데이터 분석이 필요한 다양한 산업 전반에 KIBIT을 지속적으로 적용해나갈 것입니다.

“Behavior Informatics” and the Role of “KIBIT”

FRONTEO는 빅데이터를 단순히 축적된 데이터가 아닌 인간의 사고와 행동의 총체로 이해합니다. 그리고 이를 분석하기 위해 ‘Behavior Informatics (행동정보과학)’을 연구하고 있습니다. 이 개념은 정보과학(통계학, 수학, 데이터마이닝 패턴 인식 기술 등)과 행동학(심리학, 범죄사회학 등)을 융합한 것으로, 인간 행동과 패턴을 다각적으로 분석함으로써 미래 행동을 예측하는 솔루션을 제공합니다.

과거 Data Scientist가 담당한 데이터 분석과 평가 작업의 대부분은 이제 KIBIT이 대체할 수 있습니다. 따라서 Data Scientist는 분석 결과를 기반으로 비즈니스 전략을 수립하는 등 보다 창조적인 업무에 집중할 수 있습니다.

FRONTEO는 인공지능 KIBIT과 Behavior Informatics의 지속적인 연구로 데이터 분석 전문 기업에서 행동 정보 데이터 분석 및 예측 솔루션을 제공하는 Future Discovery 전문 기업으로 도약하고자 합니다.