FRONTEO、人の行動の機微を捉える AIアルゴリズムの改良に成功

Home » corporate » ニュース » 2022 » FRONTEO、人の行動の機微を捉える AIアルゴリズムの改良に成功
2022.08.24 プレスリリース

- 報道関係各位 -

FRONTEO、人の行動の機微を捉える AIアルゴリズムの改良に成功

デジタルフォレンジックにおける関連文書80%の発見に必要な レビュー文書数を従来比で最大44%削減

株式会社FRONTEO
代表取締役社長 守本正宏
東京都港区港南2-12-23
(コード番号:2158東証グロース)

 株式会社FRONTEO(本社:東京都港区、代表取締役社長:守本 正宏、以下 FRONTEO)は、自社開発したAIエンジン「KIBIT(読み:キビット)」を構成するコア技術の一つであるLandscaping*1において、アルゴリズムの改良によりデジタルフォレンジック(デジタルデバイスに記録された情報を対象とする情報保全・分析調査)における証拠に関連する文書と関連しないレビュー文書数を、従来比で最大44%削減する分類性能の向上に成功しました。

 

 企業が管理するデータ量は年々増加の一途をたどっており、デジタルフォレンジックにおいては、証拠保持者(カストディアン)1人当たり数TBに及ぶこともあるデータを収集し、膨大な文書の中から限られた期間内で証拠に関連する文書を発見しなければなりません。調査に関わる弁護士にとって、時間、費用、調査品質が大きな課題となります。その中でも、関連情報を発見するプロセスの文書レビューは、時間と費用の約7割を占めると言われ、AIの活用が不可欠です。KIBITは、リーガルテック領域において既に米国や日本で運用が進んでおり、レビューに関する文書量やそれに伴う時間と費用の大幅な削減を実現し、課題解決の一助となっています。

 

 この度の改良は、KIBITを構成するコア技術の一つであるLandscapingにおいて、データ内で頻繁に出現しない希少度の高いワードの中で、人の行動の機微を示す可能性の高いものに対し、証拠文書に関連する度合いを、統計学に基づいてより精緻に定式化する独自技術を開発したものです。例えば、一般的に希少度の高いワードは逆文書頻度(IDF)*2と呼ばれる統計量で扱われますが、これに加えて、ワードの出現回数により生じる統計誤差を考慮する方法や、得られた希少度から証拠の関連度合いを計算する方法などを用いました。その結果、従来と比べて、証拠に関連する文書の80%を発見するのに必要な、人がレビューする文書数の最大44%の削減と、Recall Rate*3 の改善を実現しました。(図1参照、FRONTEOのテストデータを使用) 

 

 FRONTEOは、今後も日本におけるデジタルフォレンジックとディスカバリ(米国の民事訴訟制度における証拠開示手続き)のパイオニアとして、不正調査や訴訟支援の効率化に役立つAI技術の開発と改良に努めてまいります。

 

図1. 改良前(オレンジ)と改良後(緑)の比較。
AIなし(ランダムサンプリング、黒の点線)によるレビューと比較し、
改良前も高い分類性能を示していましたが、改良後は分類性能のさらなる向上を実現しています。

 

*1 Landscaping:相互情報量をベースとし、各ワードの証拠文書における関連度合いを数値化することのできる、直感性や説明可能性に優れたFROTNEO独自のコア技術。証拠として関連する文書の含まれる割合の低いデータの解析向けに設計され、今後もより多くのデジタルフォレンジック案件への適用を見込んでいます。
*2 逆文書頻度(IDF):単語がデータ内でいかに少数の文書にしか現れないか(希少か)を表す尺度。
*3 Recall Rate:再現率。証拠として関連性のあるすべてのデータの中で、関連性があることが正しく予測されたデータの割合。

 

 

■KIBITについて URL: https://www.fronteo.com/products/kibit/
「KIBIT」は、専門家や業務熟練者が備える“暗黙知”を再現する独自の機械学習アルゴリズムを用い、キーワードに頼らずテキストを解析する人工知能です。少量の教師データで短時間での高精度な解析が可能です。

 

■FRONTEOについて URL: https://www.fronteo.com/
FRONTEOは、自然言語処理に特化した自社開発AIエンジン「KIBIT(読み:キビット)」と「Concept Encoder(商標:conceptencoder、読み:コンセプトエンコーダー)」、「Looca Cross(読み:ルーカクロス)」を用いて膨大な量のテキストデータの中から意味のある重要な情報を抽出し、企業のビジネスを支援する、データ解析企業です。2003年8月の創業以来、企業の国際訴訟を支援する「eディスカバリ(電子証拠開示)」や「デジタルフォレンジック調査」などのリーガルテック事業をメインに、日本、米国、韓国、台湾とグローバルに事業を展開してきました。同事業で培ったAI技術をもとに、2014年よりライフサイエンス分野、ビジネスインテリジェンス分野、経済安全保障へと事業のフィールドを拡大し、AIを用いて「テキストデータを知見に変える」ことで、創薬支援、認知症診断支援、金融・人事・営業支援など、様々な企業の課題解決に貢献しています。2007年6月26日東証マザーズ(現:東証グロース)上場。2021年1月第一種医療機器製造販売業許可を取得(許可番号:13B1X10350)、同9月管理医療機器販売業を届出(届出番号:3港み生機器第120号)。資本金3,034,846千円(2022年3月31日現在)。

 

※FRONTEO、KIBIT、conceptencoder、Looca CrossはFRONTEOの日本における登録商標です。

 

 

<報道関係者のお問い合わせ先>

株式会社FRONTEO  広報担当

Email: pr_contact@fronteo.com