![](https://www.fronteo.com/wp-content/uploads/2023/07/0001.jpg)
ChatGPTの登場で、AIは研究者、開発者だけでなく一般の人々からも注目されるようになりました。ChatGPTはチャット型で使いやすいサービスということで話題ですが、これまでもさまざまなAIが開発・実用化され、現在もあらゆる目的で世界中の企業や研究者がAIの開発にしのぎを削っています。
ChatGPTを含むAIは、人智を超えた「夢のツール」なのでしょうか?身近な例やAIの特徴を通して解説していきます。
![ChatGPTだけがAIではない。そもそもAI(人工知能)とは? 自然言語処理とは?](/wp-content/uploads/2021/06/Toyoshiba_S.jpg)
監修
株式会社FRONTEO
取締役/CTO
博士(理学)
豊柴 博義
数学を専攻し博士(理学)を取得。米国国立環境健康科学研究所(NIEHS)や武田薬品工業等で、遺伝子発現データ解析やターゲット探索、バイオマーカー探索等の研究に従事。FRONTEOのAIアルゴリズムを研究開発。
AI(人工知能)とは
AIとは、人工知能を意味するArtificial Intelligenceの略です。もはや一般名詞ともいえる「AI」ですが、まだ実は明確に統一された定義は存在していないのです。幅広い分野において、人間の知能、知性、感情を完全に模倣するものと定義されることもあるでしょう。しかし、一般的には、AIはデータを解析したり学習したりすることで、これまで人間が行ってきた特定のタスクの実行のためにプログラムされたシステムを指すことが多いといえます*。例えば、私たちの身の回りにはさまざまなAIがあります。文章でやりとりのできるChatGPTをはじめ、自動運転車や音声アシスタント(スマートスピーカー)、顔認識システムなどもAIを用いたサービスです。
* 前者の人間の知能を完全に模倣したAIを「強いAI」、後者の特定タスクを実行するAIを「弱いAI」と分類することもあります。現在実用化されているAIはすべて弱いAIです。
AIのこと、勘違いや誤解をしていませんか?
例えば、ChatGPTは、テキストでの質問にまるで人間のように自然に答えてくれ、上手に質問すれば必要な情報を整理して教えてくれる、非常に便利なAIサービスです。そのため、AIは人間よりもずっと知能が高い、何でも知っていて万能だと感じることもあるでしょう。しかし本当にそうでしょうか。
AIは人間以上の知能? AIに仕事を奪われる?
AIはいまだ人間以上の知能をもつとはいえません。AIは特定のタスクにおいて高い能力を発揮するように開発されていますが、人間のような総合的な知能をもつこととは別です。
そのため、AIに仕事が奪われるのでは?という声も聞かれますが、AIは人間の仕事を助けているのが実際のところで、例えば、AIが大量のデータを解析し、人間がその結果や数字を判断し、業務を進めるといった使われ方をしています。AIの発展は人間の仕事を奪うというよりも、これまでできなかった規模の知的労働を可能にしたり、これまでの人間の仕事を省力化したりするものと捉えるのが、多くのケースにおいて適切といえます。
AIは完璧で、間違ったりはしない?
AIは完璧で間違わないというイメージを持っているかもしれませんが、実際にはAIにも限界や誤りがあります。理由は二つあります。機械学習全般に言えることですが、第一に、AIの答えは「確率」だからです。確率0%や100%は常には得られません。第二に、AIは学習したデータに基づいて予測や判断をするため、学習データの品質や量によって正確性は変わるからです。AIは何でも知っているわけではなく、新しい状況や未知のデータに対してはどうしても能力が限定的になってしまいます。これは、AIモデルは学習データの範囲内(内挿)の課題には非常に高い精度を示す一方、学習データが存在しない範囲外では十分な性能を発揮できないことに起因します。
そのため、突発的なアクシデントのもとで適切な判断をしたり、 複雑な倫理的な判断を行ったりするのは難しいでしょう。高い能力のAIは便利で何でもできそうに感じますが、人間が、解決したい課題とそのAIの特性をよく理解した上で、AIを適材適所に配置・活用することが大切。総合的な判断をしてこそ、人類はAIによる飛躍的発展を得ることができるのです。
数あるAIの一つ、自然言語処理AIとは
AIが活用される分野は幅広く、AlphaGoで有名な囲碁を打てるAIの他、AI搭載の将棋ソフト、顔認証や自動運転などで用いられる画像認識AIやアレクサやSiriのような音声アシスタントで用いられる音声認識AI、そしてChatGPTで用いられる自然言語処理AIなど、多岐にわたります。
自然言語処理(NLP:Natural Language Processing)は、人が日常的に使う自然言語をコンピューターが処理する技術です。ディープラーニングの登場で、大量のデータからパターンを学習した高度な自然言語処理が実現しましたが、その中でも、Transformerの登場は大きな進化をもたらしました。
ディープラーニングとは
ディープラーニングは機械学習の一種で、人間の脳の仕組み・神経のつながりに似た、多層のニューラルネットワークを用いた学習手法で、自然言語処理に限らずさまざまな用途で用いられる手法です。入力と出力の間を結ぶ近似関数(モデル)を非常に柔軟に作り出すことができます。得られたモデルは、入力に対する最適解のリストを、確率やスコア付きで出力してくれます。
Transformerとは
Transformer(トランスフォーマー)は、2017年に発表された自然言語処理のモデルです。このモデルで文脈や意味をより良く捉えることができるようになったことから、自然言語処理の大きな転換点となりました。Transformerの登場により、機械翻訳や質問応答、テキスト生成、文の要約などの性能が大幅に向上したのです。
ChatGPTが得意なこと、ChatGPTに代表される生成AI
2022年末から話題となったChatGPTとは、OpenAIという組織が開発した会話型、チャット型のAIサービスです。ユーザーの質問や入力に対し、自然で人間らしい文章表現を生成・応答できるのが特徴です。
ChatGPTは会話型のAIサービスで、GPTは言語処理の仕組み
ChatGPTはAIである、という言い方は実は正確ではなく、ChatGPTはAIサービスの名称です。GPTとは言語処理の仕組みで「Generative Pre-trained Transformer」の略称であり、事前学習した生成Transformerといった意味合いです。
ChatGPTがここまで話題になったのは、チャットがスムーズに返ってくる「会話ができるサービス」だったから。特に自然な文章、言葉で返ってくるようになったのが強みです。
テキストによる質問や入力に対して応答し、文章を生成する生成AI
ChatGPTはディープラーニングによって多くのデータを学習し、その中からパターンを見つけ出して応答を生成します。学習済みデータをそのまま出力するのではなく、質問に合わせた適切で自然な応答を生成できる点が、自然言語処理として非常に優れているといえるでしょう。
一般的な会話や質問にはかなり高い精度で回答でき、その文章も自然ですが、専門的な知識や複雑な問いかけになると応答が不正確になる傾向があります。とはいえ、ChatGPTは情報提供や基本的なサポートには十分役立つ、いわば話し相手やアシスタントとして便利に利用できます。
ChatGPTは何をやっているのか
これほどのインパクトを与えたChatGPTの中身は意外なほどシンプルです。「次の単語(トークン)を予測し続ける」、すなわち、そこまでに入力されたテキストの次の単語を確率的に予測し続けるというものです。自然さを導入するために、最も確率の高い単語以外も使われることはあります。
一方、これを自分が話している状況に照らし合わせてみましょう。あなたは単語を一つ話し、その次に来る自然な単語を選んで話し、またその次に来る自然な単語を考えて話し……、という活動を高速に繰り返しています。そのような自身の振る舞いをどう考えますか?これは、話したいイメージを持って話しているというよりは、自然な発話をすることに特化している、あるいは、論理を考えているというよりは、たくさんの単語を紐でつなぐパターン、構文、あるいは文法に近いものを覚えている、というのが実態に近いかもしれません。逆に言うと、複雑怪奇だと思っていた言語なるものは、案外、そういう比較的シンプルな表現ツールなのかもしれません。
生成AIとは
生成AI(ジェネレーティブAI)とは、学習済みのデータを元にしてコンテンツを生成するAIのこと。ChatGPTは大量の事前学習済みデータから文章を生成できるAIで、他にも画像やデザイン、音楽、プログラムのコードなどを生成できるAIもあります。
FRONTEOのAI「KIBIT」が得意なこと、自然言語処理AIとしての特徴
FRONTEOの自社開発AIエンジン「KIBIT(キビット)」も自然言語処理AIですが、「生成型」のAIではなく、膨大なテキストデータの中から必要な情報を探したり見つけたりする「発見型」のAIです。
毎秒のように情報が増え続ける現代、情報の取捨選択はどの分野でも、どの企業でも大きな課題です。たとえば会計不正を調査する税理士は、大量の決算資料や関連書類から、不正に関連する書類ややり取りを見つけ出し、訴訟を担当する弁護士は、膨大な関係資料の中から、証拠になりうる文書を探す必要があります。コールセンター担当者は、問い合わせ履歴やアンケートのようなさまざまなお客様の声から、製品の改善や新規開発に活かす意見を日々探し出しています。
そんな全データや全書類を何十人もの人員を投じて確認する代わりに、AIエンジン「KIBIT」は弁護士、税理士や各業務担当者のようなエキスパートの判断や思考を学習により再現し、必要な情報を選び出すのです。
人間らしい文脈を学び、情報をいち早く見つけ出すAI
KIBITは、機械学習の一種で、ディープラーニングとはまた別のアルゴリズムを用い、極めて少量の教師データから、通常のノートPCレベルのコンピューターで、省電力且つ高速に、テキストを解析・学習します。
例えば、不正に関係する文書と関係しない文書を教師データ(元になるデータ)としてKIBITに与えます。文書は、例えばA4の紙を数ページやメール1通というまとまった単位になります。この時、KIBITは単語だけでなく、文章で使われている文字の構成、多寡や組み合わせから、文書全体や注目している文章周辺の雰囲気(機微)を捉え、雰囲気を定量的に表す特徴量や傾向を抽出し、「発見」するためのAIモデルを構築します。
これが、KIBITが言葉の多義性や揺らぎに強く、あたかも文脈を読んでいるように解析ができるしくみです。これにより、実際に解析する文書で使われている単語が、最初に与えた文書とは違っていても、文書全体で近い雰囲気であれば「関係する文書」とKIBITが判断します。
それぞれのAIに、それぞれの強みや使い方がある
世の中で実用化されているAIには、自動運転や音声・顔認識システム、そしてチャットボットなどさまざまなタイプがあります。テキスト・言語を対象とする自然言語処理AIであっても、ChatGPTとKIBITではタイプが異なります。
文章を作ったり、まとめたりするのが得意な「生成型AI」のChatGPT、エキスパートの思考を再現して膨大なテキストデータから必要な情報を探し出す「発見型AI」のKIBIT、というように特長が異なります。AIを使う人間側が適材適所で使い分けたり併用したりすればいいのです。つまりKIBITもChatGPTもシェアを奪い合うライバル関係ではなく、異なる特長を持つ「AIの仲間」だといえるのです。
どんな企業にも、どんな業務にも、KIBITに使えるテキストデータがある
テキストデータの高精度分析が特長のKIBITは、エキスパートを支援することを目的に開発されました。
例えば創薬の研究者には、何万報もの論文から、創薬の元になる「ターゲット」を提案。訴訟を担当する弁護士には、膨大な関係資料から、証拠になりうる文書を高精度で提示。一般的な企業・組織においては、メールやSNSを解析して、ビジネス判断や戦略策定に有益な情報を揃え、与えます。医療、法律、知財、金融、人事……とさまざまな分野のエキスパートに、必要かつ適切な情報を提供して、課題の解決を後押ししていくのです。
どんな業界、どんな業務にもKIBITに使えるテキストデータは存在します。仕事の中で使っている身近なデータ、つまり日々やりとりするメールや報告書、電話の会話、面接・面談の記録、SNSへの書き込みなど、テキストやテキストに変換できるデータはどれも、KIBITが解析可能なターゲットです。
その際、大量の教師データは必要ありません。一般的にAIには数千~数万件の教師データが必要と思われがちですが、KIBITは数十件の教師データでも学習し、使い始められます。KIBITを使えば、あらゆるテキストデータを活用して、さまざまな分野のエキスパートの支援が可能になるのです。