生成AIをはじめAI(人工知能)への期待が急速に高まっています。中でも自然言語処理に長けたChatGPTは、今やAIの代表格の一つ。ChatGPTはその性能が優れているのはもちろん、ここまで注目を集めたのは文章の生成という成果を「チャット形式」というアウトプットで「可視化」したことも一因でしょう。
AIの成果を最大限活かせるかどうかには、アルゴリズムの構造や精度といったAIそのものの性能に加え、成果をどう「可視化」するかという手法や技術も大きく影響します。
ここでは、データビジュアライゼーションの必要性を確認しながら、FRONTEOが日本・米国の2カ国で特許を取得しているAI解析結果のビジュアライゼーション手法「2次元マップ生成」を紹介します。この2次元マップ生成は、予想外の発見――セレンディピティ――を必然的に引き寄せるビジュアライゼーションです。
データビジュアライゼーションとは、データを可視化して活かすこと
データビジュアライゼーションとは、データを可視化して理解しやすい形に変換することです。グラフやチャートなどの視覚的な表現を通して複雑なデータをビジュアル化することで、データがひと目で理解しやすくなります。
現代のビジネス環境では、膨大なデータが絶え間なく生成し蓄積されますが、それだけでは何も生み出しません。データは、的確に解釈して次の行動のために活用することで、はじめて意味を持ちます。データを瞬時に理解できる「データビジュアライゼーション」は、データ活用に欠かせないステップなのです。
データビジュアライゼーションのメリットと目的
データビジュアライゼーションの目的は、データを的確に解釈し、意思決定に役立てることです。
データビジュアライゼーションのメリットは、グラフやチャートで視覚的に表現することでデータの傾向やパターン、相関関係が一目瞭然になることです。営業データであれば、折れ線グラフで売上の推移を示す、棒グラフで商品カテゴリーごとの比較する、などがよく行われます。ビジュアル化したデータから状況の変化にも気づきやすくなるなど、課題への解決策が見つけやすくなるのも大きなメリットです。
データビジュアライゼーションの手法とポイント、注意点
データビジュアライゼーションの手法の主な例と、そのポイント、注意点を解説します。
データビジュアライゼーションの代表的な手法 – グラフや色分けの活用
- 折れ線グラフや棒グラフ
ビジネスで日常的に使用するのが数値のグラフ化でしょう。折れ線グラフはデータの変化や推移の表現に、棒グラフはデータの比較に適しており、トレンドやパターンを視覚的に理解しやすくなります。
- ヒートマップ
色の濃淡でデータを表現する手法で、ビッグデータの分析に効果的です。例えば地図の色分けによる表現などはよく使われる手法で、新型コロナウイルスの都道府県別の感染状況の報道で多く見かけられました。
データビジュアライゼーションのポイントと注意点
データビジュアライゼーションでは、データと目的に応じた最適なビジュアルを選ぶことがポイントです。データを深く理解した上で、目的や用途に応じて比較や相関関係などを考慮した最適な見せ方を検討します。
注意点は、当然ながら正確なデータを適切に処理することです。データ収集の段階から細心の注意を払い、誤解を招く表現や意図的な軸の操作などで解釈を曲げることのないよう十分配慮しましょう。
AIのデータ解析結果をビジュアライゼーションする手法
一般的なデータにおいてデータビジュアライゼーションが大切であるのと同様に、AI活用においても、AIの解析性能だけでなく結果のビジュアル化のステップが大変重要です。
通常、情報検索やデータ解析のAIアプリケーションでは検索・解析結果がリスト表示されることが多いですが、よりわかりやすく効果的に表すために他の表現方法も工夫されています。
AI解析結果のデータビジュアライゼーションの例
リスト表示
リスト表示は最もポピュラーな形式で、一定の条件に従って情報を順序立てて提示する手法です。シンプルな一方で、情報が大量だと項目を横断した全体像はつかみにくいのが課題です。
ワードクラウド
ワードクラウドは、文章中の単語をその頻度などに応じた大きさや色で配置して視覚的に示す手法です。例えばSNSのトレンドを表す際に用いられ、話題のトピックやキーワードがひと目でわかります。
共起ネットワーク
共起ネットワークは、単語など要素どうしの関係性をネットワークで表現したものです。例えば文中に出現する単語の回数や距離に基づいて単語どうしを線で結び、ネットワーク状の表現でつながりを可視化します。
AIの解析データを「ビジュアライゼーション」する必要性と得られる効果
AIで解析するデータはとくに膨大で、そのままではその道のプロでも理解しきれません。AIの解析データをビジュアライゼーションすることは、本来データが持っている情報を逃してしまう機会損失を招かないためにも必須で、さまざまな効果も得られます。
複雑な情報の整理とピックアップ
データをビジュアライゼーションすることで、全体像を見渡しつつ、情報を的確に把握できるようになります。課題に対してどの要素が重要なのかといった情報の整理やピックアップにも有用です。
新しい着眼点や発想へのヒント
ビジュアライゼーションを通じてデータの特徴やパターンに気づきやすくなることで、新しい着眼点や発想が生まれます。浮かび上がったデータの傾向が、新たな戦略やアプローチを考えるヒントにもなります。
組織のコミュニケーションや意思決定の円滑化
データを効果的に活用し、組織の意思決定の質を向上させるためには、メンバーの認識を揃えることが必須。AIの解析データをビジュアライゼーションすることにより、エンジニアだけでなく経営者や営業担当などチームメンバーで共通の理解を得られ、チームの建設的な議論につながります。
FRONTEOのAI「KIBIT」のビジュアライゼーション手法「2次元マップ」
FRONTEOの自社開発AI「KIBIT」は、機械学習の一種で、ChatGPTをはじめ生成AIでメジャーなディープラーニングとはまた別の独自アルゴリズムを用いています。
さらにビジュアライゼーションの点でも、テキスト情報を2次元のマップに変換し表現する独自の技術を開発し、日本・米国の両国で特許を取得しています*。
*「2次元マップ生成装置、2次元マップ生成方法および2次元マップ生成用プログラム
(2D MAP GENERATION APPARATUS, 2D MAP GENERATION METHOD, AND 2D MAP GENERATION PROGRAM)」
[特許番号]日本:特許第7116969号/米国:プレスリリース https://www.fronteo.com/20240111
FRONTEO独自の「2次元マップ生成」でテキスト情報をマップに変換する流れ
テキスト情報のマップ化は、「言語のベクトル化」、つまり自然言語処理において言語を数値(数値の組み合わせ=ベクトル)に置き換えることから始まります。
まず元となる膨大なテキスト情報を、多くの数値の組である特徴ベクトルに置き換え、そのベクトルの関係性を保持しながらデータを2次元の緯度経度情報まで圧縮します(次元圧縮/次元削減)。さらに人間が視覚的に認識できるようにデータを平面上にプロットして色や散らばり具合などでビジュアライゼーションすることで、「2次元マップ」を生成するのです。
「2次元マップ生成」の技術を搭載したKIBIT製品
2次元マップ生成で実現できることと、得られる効果「セレンディピティ」
この「2次元マップ」では類似した情報が近い位置にプロットされるので、膨大な情報が一気に理解しやすく変換され、共通点を持つクラスターの構成や規模、関係性が一目瞭然になります。
対象情報の全体像やその構成・特徴、要素どうしの類似性・関連性を視覚的かつ直観的に把握できるので、リスト表示からは得られない洞察が得られます。通常の解析では見逃してしまう予想外の情報をも発見する「セレンディピティ」につながります。
「セレンディピティ」とは、ふとした偶然で幸運に出会うこと。2次元マップ生成はセレンディピティを必然的に引き寄せる手段です。エキスパートはこのマップを通じて有用かつ価値ある情報に出会い、新たな着想やチャンスを得て探索や研究を飛躍させることができるのです。
AIの使いやすさは、データビジュアライゼーションでさらに高まる
AIの応用範囲が広がりめざましい進歩を遂げる中、ともすれば高い能力のAIは便利で何でもできそうに感じられるかもしれません。確かに優れたAIは私たちを助けてくれますが、そのデータから課題を解決する・判断するという「ラストワンマイル」は、人であるエキスパートにしかなし得ないのです。
そうしたエキスパートの判断が最短かつ最小の労力でなされるよう、FRONTEOは言語の解析結果を「マップ化」するビジュアライゼーションで、AIの使いやすさ・ユーザビリティを一層向上させ、社会実装を推進していきます。