企業は外部からも内部からも様々なリスクにさらされています。テクノロジーの進化で各種リスクの管理手法も向上してきていますが、企業内部からの不正行為は外部の脅威よりさらに検知や防止が困難で、どの企業でも深刻な課題となっています。
社内の不正リスク検知に有効な手段の一つが、メール監査です。電子メール、近年はチャットなどデジタル上のやり取りには、不正の過程で必ず何らかの証拠が残ります。ここに着目して普段からメール監査を実施しておけば、不正の発覚時にいち早く証拠を発見できるのはもちろん、発覚前に兆候を捉えてリスクを最小限に抑えられます。こうした取り組みが潜在的なインシデントから企業と従業員を守り、企業の健全な運営と発展にもつながります。
ここでは、企業にとっての不正のリスクについて解説し、リスク回避のいち手段であるメールやチャット、通話などのコミュニケーションモニタリングをAIで実現するFRONTEOの「KIBIT Eye」のアルゴリズムを解説します。
監修
株式会社FRONTEO
取締役/CTO
博士(理学)
豊柴 博義
数学を専攻し博士(理学)を取得。米国国立環境健康科学研究所(NIEHS)や武田薬品工業等で、遺伝子発現データ解析やターゲット探索、バイオマーカー探索等の研究に従事。FRONTEOのAIアルゴリズムを研究開発。
企業が抱えるリスクは多岐にわたる
企業は経営戦略上のリスク、法令違反のリスク、セキュリティリスク、財務状況のリスクなど、多岐にわたるリスクに直面しています。例を挙げれば、品質不正、独占禁止法のカルテル、贈収賄や情報漏洩、不正会計や金融商品取引法違反など枚挙にいとまがありません。
一方で、コンプライアンスへの関心も昨今とくに高まっており、企業の社会的責任の観点からもコンプライアンス遵守の体制強化は不可欠です。万一、法令違反や不正行為が表面化すれば、企業は社会的信用を喪失し、売上減少などの損失を被ります。事案によっては、大きな課徴金や罰金を伴うことも考えられます。
企業の社内不正対策は、有事の捜査から平時の監査(モニタリング)へ
企業が信頼性に足る経営を続けるためにも、先に挙げたような不正の兆候を早期に検出して対処する体制を整えることが必要です。中でも、発覚前に兆候を検知する、平時監査の重要性への認識が高まってきています。
働き方の多様化やデジタル化による、平時の備えとしての監査(モニタリング)の重要性の高まり
不正への企業の対策は通常、不正の発覚や訴訟など「有事」の対応が主流です。近年はリモートワークの普及や雇用の流動化による働き方の多様化や、デジタル化の発展と複雑化で、不正の背景やその手口は多岐に渡るようになりました。そのため、最近では「平時」から不正の兆候を察知して防ぐための監査、つまり普段のやり取りをモニタリングし、不正の兆候を早期に検知する試みが、リスク回避に有効な手段として注目を集めています。
不正に完全犯罪はなく、その兆候は電子メールやチャットなどのコミュニケーションに色濃く残ります。とくにメールは企業内外のやり取りの中心ツールのため、不正調査案件においては最も重視される調査対象であり、電子証拠の中でも特に重要な地位を占めてきました。
企業の不正リスク検知に役立つ、メール監査AI
近年話題をさらったChatGPTをはじめ、AI(人工知能)が高い注目を集めていますが、AIの活用範囲は文章生成のような使い方だけにとどまりません。AIの最大の特長は「大量のデータを処理できる」点で、膨大なメールデータから不正のリスクを見つけ出す作業にも大いに力を発揮します。
企業のメールサーバーには大量のメールのログが記録されていますが、単に保存しているだけでは不正は発見できません。メール監査を効果的に行うためには、ログを取得し、分析して不正を見つける手法やその判断基準が必要です。
大量の通常の業務連絡メールに紛れた、不正の兆候を含むわずかなメールの発見にAIを活用すれば、平時監査の不正検知も、訴訟に発展した際の証拠メール探索も、圧倒的に精度と対応スピードが上がり、結果的にリスクの発生も最小化できます。
不正リスク検知のメール監査にAIを用いるメリット
メール監査にAIを活用すると、判定基準が一定となり人のような判断のばらつきや見落としが起こりにくい、機械学習を通じて人が気づききれない不正のパターンまで自動で学んで検出精度を向上できる、などAIならではのメリットがあります。そうした作業上のメリットはもちろん、メール監査AIの活用は、企業の健全な経営維持に欠かせない非常に大きなメリットもあるのです。
迅速な対応が可能で、被害の拡大を防げる
AIが分析し検知した不正リスクの高いメールのみを監査担当者がチェックするので、監査作業の負担が軽減できます。平時の監査作業が効率的になるので、不正リスクの早期発見で有事になる前に先回りして対処できます。また、適切な分析による予兆の発見で、万一有事になった場合も被害の拡大を防止できます。
人を守り、組織を守る
不正リスクを早期に発見することで初動が早くなるということは、例えばパワハラにさらされている人を守ることができ、被害の拡大を防ぐことで組織を守ることができます。不正リスクの早期検知は単に不正を見つけるだけでなく、人と組織を守ることになるのです。
企業のコンプライアンス強化をアピールできる
企業のコンプライアンス体制強化の施策の一つとしてAI活用に取り組むことは、不正行為への牽制にもなります。不正予防のための監査を徹底的に実施する「不正は見逃さない」という姿勢を社内外へアピールすることにもつながります。
不正リスク検知のメール監査にAIを用いる注意点、課題
AIを不正リスクの検知に用いる際の一般的なデメリットとしては、教師データ(学習データ)の用意の負担や、AIモデルのブラックボックス化が挙げられます。
教師データ作成の負担が大きい
不正リスク検知のAIモデルを構築するための教師データの作成や用意の負担は無視できません。効果的なAIモデルを構築するには多量の質の高いデータセットが必要ですが、その収集や整備は手間がかかるのが実態です。
AIの判断基準が不透明で解釈しづらい恐れがある
検出されたデータがなぜ不正と判断されたか(されなかったか)、AIの判定プロセスが不透明で、結果の解釈がときに難しく、AIの判断理由がブラックボックス化する恐れがあります。
AIで近年メジャーなディープラーニングは、中間層(隠れ層)の処理を確認することは実質的に不可能で、開発したエンジニア自身もモデルの中で起きている処理や仕組みの説明は困難です。メール監査の判定理由が不透明で、誤判定を修正しようにも手に負えないような事象が重なれば、システムへの信頼が低下し、監査の本来の目的が達成されない恐れがあります。
自然言語処理AIでメール監査を実現する「KIBIT Eye」
メールの中身はテキスト、つまり言語なので、解析には自然言語処理AIが用いられます。自然言語処理(NLP:Natural Language Processing)とは、非構造化データ(数値ではない)の自然言語を、コンピューターが扱える「数値」に変換して解析する技術です。
FRONTEOのメール監査のツール「KIBIT Eye」に搭載している自然言語処理AIには、機械学習の一種でディープラーニングとはまた別の、独自アルゴリズムを用いています。
FRONTEOのメール監査AIツール「KIBIT Eye」の、高い精度の証左
FRONTEOのメール・チャット監査AIツールの「KIBIT Eye」のアルゴリズムには多くの工夫が施されており、その結果高い精度を達成しています。
自社検証では、閲覧率20 %時の監査対象となるデータの抽出割合(発見精度)の比較で、前身のシステムで82.5 %だった発見精度が、KIBIT Eyeでは99.5 %と、大幅な解析精度の向上が確認されました。この進化で言葉の意味合いをさらに適切に見分けられるようになり、不正調査の精度が一段と向上しています。
KIBIT Eyeのデータ検出能はTransformerベースの生成AIのChatGPTやBERT以上の性能であることも、自社検証で確認されています。これは実は当然で、KIBIT Eyeが少量の教師データで目的の文書を発見することに最適化している一方で、ChatGPTは自然な文章を目指し「次の単語(トークン)を予測し続ける」ことに最適化しているためで、汎用AIは存在しないのです(ノーフリーランチ定理による帰結とも理解されます)。
ディープラーニングとは別の、数式主体で解析するアルゴリズム
「KIBIT Eye」中のアルゴリズムは、AIで近年一般的なディープラーニングとは別のアルゴリズムで、数式で解くことを主眼においています。ディープラーニングにおいて計算コストがかかりブラックボックス化する「隠れ層」が「KIBIT Eye」には無く、基本的に計算式から構成されるため、動作が非常に軽く、どの要素が結果にどのように影響するかという説明性が高くチューニング可能なことも特長です。
不正リスクの検知に特化したAIが、監査で高い精度を発揮できる理由
「KIBIT Eye」のアルゴリズムは、共感覚などの人の色認識から着想しており、出力結果では色合いを利用して不正の度合いを把握します。従来の手法では見逃してしまっていた微細な情報も直感的に、的確に捉えられます。
仕組みの面では、これまでも提供していたAIメール監査ツールからさらに、次元数(特徴量)を必要最小限に最大化し、精度を最大化。高精度の理由には、他にも語の重み付けの向上や特徴量の最適な取り扱い、過学習を抑える仕組みなどがあり、多くの工夫の集合体で、微妙なニュアンスを適切に捉え、不正リスクの検知の精度と効率を大幅に向上させています(特許取得済み*)。
*特許番号 :特許第7376033号
理由① 不正を見分けるための、単語への適切な重み付け
自然言語処理で重要な視点の一つに、言葉の「重み付け」、つまり文書内の単語の重要度をどう表すかという視点があります。「KIBIT Eye」中の独自アルゴリズムでは、教師データからモデルを構築する際、不正に関連する語にはプラスの重みを割り当て、不正に関連しない文書に同じように出てくる語にはマイナスの重みを最適に割り当てます。例えば、人がある文書を見て不正との関連性を判断するとき、紙一枚の文書中に特定の単語が他より多く目に入ったら「関連がありそうだ」と判断しますが、この感覚を数式で表そうとする試みが、ここで言う「重み付け」です。
これら「重み」は、最終的に集約されてスコアとして出力されるため、言葉への適切な重みの割り当て手法が、AIの精度に影響する重要な要素となります。
理由② 少量の教師データでも、特徴量の最適化により解析精度を最大化
「KIBIT Eye」は、教師データが少量のみでも高い精度で目的の文書の検出が可能です。
最大数の特徴量の候補から選抜し、最小数の特徴量で解析する
AIモデルにおいて特徴量とは、データの特徴を表にしたときのデータの各項目のようなものです。「KIBIT Eye」は、メール文書中の単語(≒形態素)の全てを特徴量として解析。そこから構築したモデルの性能を自動で検証し、性能向上に大きく寄与しない特徴量(形態素)を削除しながら精度を高めていきます。そうして最終的に、必要最小限の特徴量のみでモデルを構築します。
機械学習では次元数、すなわち特徴量の項目は多いほど良いわけではありません。精度と汎化性能*の高い学習モデルには、目的に最適な特徴量、つまり質の良い特徴量を選抜して解析することが必須です。
*汎化性能:未知データにも教師データと同等の精度が出せる能力
テキスト以外の情報も使用する
メール監査では通常、文書内のテキストを自然言語処理の対象に解析していきますが、「KIBIT Eye」ではテキストデータ以外の情報も解析の候補にします。例えば、メール本文の「文字数」や「行数」といった情報が該当しますが、これは人によるレビュー時に、メールのテキストだけでなくその長さにも印象が左右されるのと同様のイメージです。
なお、アルゴリズムを制御するハイパーパラメーターが極めて少ないのも特徴で、これもAIの動作の軽さにつながっています。
理由③ 過学習を抑えるモデル構成
AIの精度を上げようとすると、教師データでは正解しても実運用のデータでは汎用性がない「過学習」に陥ります。しかし「KIBIT Eye」では、学習モデルを線形ベースとし、アンサンブル学習をオン/オフすることで過学習を抑制しています。
学習モデルが線形ベース
「KIBIT Eye」でモデルを構築、すなわち関数を求める際は、線形モデルまたは一般化線形モデル、つまり直線のグラフに近づくように関数を選び出します。
図の右側のように、線形モデル、つまりグラフが直線であれば少ない教師データでも汎化性能が高くて過学習しにくく、解析精度が向上できることが期待されます。
アンサンブル学習のオン/オフを自動調整する
アンサンブル学習とは、複数のモデルで学習させ、単独のモデルよりも精度を高めようとする手法です。しかしアンサンブル学習によりかえって性能を低下させてしまう場合もあり、その時には自動でアンサンブル学習をオフにして、過学習を抑制しつつ精度を高めていくことができます。
理由④ 高スコア領域をハイライト
一般のメール監査システムで不正調査を行う場合、不正への関連度が高い「メール」に高いスコア(証拠への関連度合い)がつけられます。しかし特に長文にわたるデータでは、メールのどの部分が高いスコアに影響したのか解りづらいという課題がありました。
「KIBIT Eye」では、メールの文書全体だけでなく、文章や単語も対象に、文書内の高スコア領域を特定しハイライトします。一般に、AIの結果の出力だけが得られても、その判断理由がわからない場合が多いといわれます。しかしハイライト箇所から、AIがその文書を高スコアと判断した理由を読み取ることができます。レビュアー(担当者)にとっては、文書のうち特にどの部分の関連性が高いか直感的にわかるため、説明性が高まり、レビュー業務がさらに効率的になります。
特定領域のみをハイライトできるよう、AIの解析対象には文書全体も、文章も、個々の単語もすべてが含まれます。このような切り出しが高速にできるのは技術的にも画期的なことです。
これからのAIに求められる説明性と、これまでのノウハウを併せ持つメール監査AI
これからのAIに求められるのは、説明性の高い「責任あるAI」
話題のChatGPTは、非常に人間らしい文章でやり取りができる優れた特徴をもつ一方、ハルシネーションという不正確な情報が出力される事象も知られています。AIにこれまでにない期待が寄せられる今、AIの実用化、つまり社会実装には、その出力結果の説明がつくという視点も求められてくるでしょう。
「KIBIT Eye」は、説明性を念頭に最低限のパラメーターで設計し、ディープラーニングを用いず計算式ベースで解析するアプローチ。出力結果にどの要素が影響したかをたどれるため、異常の原因も探りやすく、メンテナンスコストも抑えられます。説明性を備えたAIなら、その判断が信頼できて利用者も結果を受け入れやすくなりますし、AIが誤った結論に達した場合にはチューニングが可能なので、安全性も確保できます。実際、「KIBIT Eye」の運用においては、FRONTEOのカスタマーサクセスチームが誤判定の原因をチューニングしてモデルの最適化に努め、企業のAI実装に伴走しています。
FRONTEOが持つ行動情報理論とノウハウに、最新アルゴリズムが融合した「KIBIT Eye」
AIに性能の高さが求められるのはもちろん、同時に、元となるデータベースが正しく、目的に応じたノウハウに基づくことも、そのAIの価値を高めます。
FRONTEOは不正調査のパイオニアとして、10年以上に渡りAIを活用した企業訴訟支援や監査に注力し、企業の不正リスクへの対応をサポートして来ました。
「KIBIT Eye」は、FRONTEOが10年以上にわたり積み重ねた行動情報の研究と監査のノウハウ、そして自社開発のアルゴリズムから成るメール監査AIです。これまで支援してきた企業監査で蓄積した知見を活かし、行動情報科学の洞察も組み込んで、そこに人の感性を再現した認知モデルのアルゴリズムを融合したことで、レビュアーの判断に匹敵する高い精度の不正検知を実現しています。
メール監査の必要性は、不正を許さないすべての企業に
コンプライアンス体制の強化が一層求められる中、企業は不正を許さない姿勢の打ち出しが求められます。しかし不正が起こる前のリスクの予見が困難なために、残念ながら、多くの企業で内部不正が起こり続けているのが実態。メールやチャットの監査は、すべての企業に必要な対策といえるのです。
AIのビジネス活用に期待がかかる一方で、一般的にAI導入の障壁は高いのが実情ですが、FRONTEOは、より高い精度のAIを、より少ない負担で活用することが、導入のハードルを下げ、AIの社会実装の拡大へつながると考えています。その点「KIBIT Eye」は、少量の教師データで運用可能なため導入障壁が低く、AIが人の判断や暗黙知を学んで再現することで膨大なデータからいち早く目的のデータを見つけ出すなど、監査をはじめとした場面で最適な性能を発揮します。