ChatGPTをビジネスで利用するには①
はじめまして
エバンジェリストSE 槌井(つちい)と申します。
エバンジェリストSEの役割は先端技術の市場動向を調査し、分かりやすくその内容を弊社及びパートナー様に伝え、市場創出に繋げていく活動を行うことです。
私自身はWeb3に着目しているのでそこを深堀したブログを主に掲載する予定ですが、IT先端技術は他にも沢山あるので、トレンドを意識しながら先端技術について紹介していく予定です。
なぜ、先端技術の情報をNOPが発信するかというと、DXやサスティナビリティを意識した新しいソリューションをパートナー様と共創し、豊かな未来を作り上げることを実現するためです。そのためには、製品だけではなく、ソリューションや市場動向の情報も必要です。
技術変化や複雑化が激しい今日では、いち早く新技術に対してどう取り組むべきなのか検討、実践しないと競争力をつけることができません。
このブログではネットワークエンジニアから見た先端技術の動向を記載していきます。新技術をどのようにビジネスに活用し、今後あるべきネットワーク像はどういうものなのかを考えるヒントになれば幸いです。
記念すべき第1回目のブログはChatGPTについてです。これをどう利用するかによって、人がやるべき仕事の範囲が変化していきますし、利用が高まればインフラ(ネットワーク・セキュリティ・クラウド)にも影響が出ると考えます。
先日、Interopカンファレンス2023に出席しましたが、どのセッションでも生成AIという言葉ではなく、GPTという言葉が出てきたのが印象的でした。どの登壇者もGPTは今後ビジネスに深く浸透すると予測していました。
そこで、今回はChatGPTをビジネス利用するために知っておくべき情報をこのブログで記載します。ただし、この技術の進化は早く、現時点(2023年7月)でのものと捉えて下さい。
ChatGPTをビジネス利用をするためには、以下のことを把握する必要があります。
① ChatGPTの仕組みと回答精度
② セキュリティ面での考慮事項
③ 社内ナレッジを利用するために必要なこと
上記の内容を3回に分けて記載していきます。その後にNOPでの検証状況をお届けします。
今回は①ChatGPTの仕組みと回答精度について紹介します。
目次[非表示]
ChatGPTとは
もうご存知かと思いますが、ChatGPTの特徴をまとめます。
■OpenAI(非営利団体→会社へ変更)が開発したテキスト生成AI
■ 2021年秋までのインターネット上のWebページから集めた情報で学習し、回答
■モデル(推測のための計算式)はGPT(オープンソースではない)
■ 学習データより統計的に次に来る言葉を推測
■人間の調整により、好ましい回答になるように調整されている
■回答は必ずしも正確ではない
■フィードバックを元に回答形式や内容が変化
ChatGPTは2022年11月30日に公開され、ユーザー数はリリースから5日で100万人、2カ月で1億人を突破したとのことです。携帯電話は1億人突破まで16年、Twitterは5年、Instagramは2.5年かかったことと比較すると、凄まじい普及の速さです。この普及の速さから、今後当たり前のように使われる1ツールになるということがうかがえます。(今後の規制動向に注目する必要がありますが)
しかし、日本企業での利用状況はMM総研の調査によると10%にも満たない状況で、新テクノロジーを積極採用する初期採用層が利用している状況だそうです。(参考:MM総研日米企業におけるChatGPT利用動向調査 https://www.m2ri.jp/release/detail.html?id=580 )
この調査結果に記載されているように、回答の精度やセキュリティ面が懸念されています。
今回は回答の精度に関してみていきましょう。
例えば、「日本のIT業界の課題は?」と聞くと、5つの課題が回答されます。内容としても模範的な回答です。Regenerateを押せば、また少し変化した回答が出力されます。ただ、この回答の仕方や内容はフィードバックによって変わってくるので、日にちを開けて質問すると回答形式が少し変わっていることもあります。
ちなみに「Cisco WLCの基本コンフィグを作って」と頼むと以下のような出力になります。
ただ、情報が古いため、基本的なコンフィグは作成できますが、最新技術を利用したコンフィグは作成できません。製品に関しても情報が古いため、利用する価値はありません。
しかし、カスタマイズして、必要になる情報を学習させれば利用範囲が広がるはずです。このことについては「③社内ナレッジを利用するために必要なこと」で方法について紹介します。
また、例えば「ネットワンパートナーズはどのような会社ですか?」といった質問に関しては「具体的な情報は提供できません。私の知識が及んでいない可能性があります」 との回答になります。「Amazonはどのような会社ですか?」と聞いたら答えてくれます。
このように似たような質問でも回答にばらつきがあります。
学習データ量は公開されてますが細かくどの範囲の情報を使っているかは公開されていないので、どこまでビジネスで使えるのかは、使ってみて感覚を掴むしかないと思います。
とある方がネットワークのIPアドレス設計を検証したところ、ほとんど正解でしたが間違える時もあったとのことです。
今のところ、このように不正解の法則が分かっていません。そのため、人が回答の精度を確認するということは必須です。
ChatGPT以外のLLM
ChatGPTはGPTというLLM(Large Language Models:自然言語処理モデル)に対して、UIとしてChatという表示形式を採用したものです。
言語処理そのものはLLMが担当します。現在、LLMの種類は沢山あり、分類の考え方もいくつかあります。また、オープンではなく戦略的にクローズな状況で開発されているものも多くあるため、はっきりと何個ですということは言えません。
以下は主なLLMを利用したChatサービスです。ここで使用されている3つのLLMをまずは注目するといいと思います。
この中でオープンソースなものはLLaMAだけです。オープンソースだけあり、これを使ったサービスは海外では沢山作られています。
GPTを使ったサービスも沢山あり、MicrosoftのBingもその1つです。しかし、学習データや追加学習の違いにより、同じ質問をしてもChatGPTと回答の質が異なります。
ChatGPTは返答作成処理ではインターネット接続しないので既存の学習データのみでの回答となります。
しかし、BingはAIがインターネットに接続しているため、インターネット上の情報から回答を生成することができます。ChatGPT以上に情報量はありますが、やはり不正確なこともあります。製品情報も創作が入っていることがありました。まだ学習データがそのことに関しては足りないのかもしれません。ただ、フィードバックによって回答の仕方が変化します。23年春ごろから使ってみてるのですが、だんだん回答の精度が上がっているように感じます。
また、Google Bardは3か月という短さで使用LLM自体を変更しています。Appleも生成AI開発中です。他にも日本語に特化したLLMを開発しているところもあります。
このようにAIは変化が激しい状況なので「どのLLMがいいのか」という判断は現時点でのことは言えますが、それがずっと続くとは思えません。
個人的にはGPTに匹敵するものはいくつかあるけど、大きな差を感じていないので、現時点でビジネス利用では誰もが知っているGPTを使うことを前提とする、でいいと思っています。生成AIは、多くの人が使うことで早く完成度が上がる傾向があるからです。
GPTの進化
GPTはバージョンアップするにつれ、複雑な言語処理が可能となり、ユーザーからも以前のものより優れた回答が得られると評価されています。
以下はこれまでのGPTのバージョンを比較したものです。
パラメータ数とは回答を推測するための要素の数であり、トークンとはAIが認識できるこれまでのやりとりの単語数のことです。(かなり要約して表現しています)
どちらも多ければ多いほど、長文、長い時間での会話に対応することができます。しかし、ただ単に多いからと言って、精度がよく、かつ人間の好みになる回答になるとは限らないことを念頭に入れておいて下さい。Metaが開発したLLaMAのパラメータ数は他のLLMと比べてかなり少ないのですが、これは大量のデータがなくても結果が出るように考えられたモデルだからです。なので数で他のLLMと比較しても意味がありません。
また、質の低い情報を多く与えて学習させても誤判断が多くなるので、単に処理能力の数での勝負は意味がなく、どう加工したデータを学習させたのかも重要です。
GPTもバージョン3からバージョン3.5でパラメータ数が約2倍増加しましたが、それほど回答精度には影響がが出ず、RLHFによってかなり人間好みの回答ができるようになったと言われています。バージョン4ではパラメータ数が飛躍的に増加したらしく(バージョン4は非公開なので推測値)、これは数が増加したことにより精度が高まったと言われています。
このようにAIの能力を判断するにはAIの特性を知る必要があります。
ChatGPTの回答精度を上げた強化学習RLHF
ChatGPT(GPT3.5以降)で採用された追加学習がRLHF(Reinforcement Learning from Human Feedback)です。これは人間のフィードバックに基づく強化学習です。
簡単に言えば、このタイプの質問の答え方としてはこのような要素を入れた回答をしてというひな型を学習させます。そして同じ質問に対する回答を複数回出力させ、その結果を人が評価し、いい評価がもらえるための傾向をAIが学習していくことで、人の好みの回答をすることができるようになります。
「IT業界の課題は?」と聞いた時に5つの箇条書きで答えたのは、このひな形に当てはめたことが伺えます。
ChatGPTの情報は見つからなかったのですが、前身であるInstructGPTでは1万3千ほどひな型を用意したとされています。これが、実際何人でどのくらいの作業時間だったのかの情報はありません。ただ、とても時間がかかるとだけ聞いています。また、回答の良し悪しをAIに学習させるには、一貫性が必要となるため熟練したデータトレーナー/プロントエンジニアが必要とされています。
人間を不快にしたり、犯罪の手助けをするような出力を過去の会話型AIはしてしまい、使用停止になったものがいくつかありました。しかし、そういういったことには答えないようにこのRLHFで調整されています。(ただし、このRLHFで調整されていないGPTを利用することは可能です)
このような調整がChatGPTではされているので、しっくりくる回答が得られる状態になっています。
ChatGPTの仕組みのまとめ
今回はChatGPTの仕組みについて紹介しました。
仕組みを知ることでどのようにテキスト生成AIをどう選び、どう扱えばいいのか、多少見えてきたのではないかと思います。
次回は②セキュリティ面での考慮事項について記載します。例えば画像生成AIで作成されたものは、著作権物と類似していると違反になるとのことです。自分が知らない著作権物に似たものが生成され、それを使用すると過失になります。そのため、このブログでも生成AIを使った画像利用は断念しました。
世界中にある著作権物なんて把握していませんから。。。
今後、しばらくはChatGPTについて記載していきますが。その後はWeb3(メタバース、分散ネットワーク、ブロックチェーンなど)について紹介していきます。
これから、どんどん先端技術情報をお届けしますので、お楽しみに!
何か聞きたいことがあればお気軽にこちら までお問合せ下さい。