スポンサーリンク
サイバーエージェントが商用利用可能なLLM(大規模言語モデル)を公開したので早速試してみた。
テキスト生成AIについてのまとめはこちら。
大規模言語モデル、LLMとはChat GPTで大補油される、1年前から盛り上がっているAIブームの立役者だ。
それまでは人間が作るような自然な文章をAIで作ることは非常に難しかったが、LLMの登場により可能になった。要は必要な単語、言い回しを記憶させることでAIの語彙が豊富になるということだ。もちろん「記憶」にはDeep Learningを使う。この技術のおかげでAIが現実的なものになった。
国産のLLMは数社がやっているが、サイバーエージェントもその一つだ。今回のバージョンは70億パラメータ、32,000トークンに対応するCALM2-7Bを作った。
パラメータ数ではChat GPTに及ばないものの、まあまあ実用的らしい。
Apache 2.0ライセンスなので商用利用に問題なし。ソースコードを改変した場合はGPLのように訴求して全部のソースを開示しなければならない、ということもないので気分を楽にして使うことができる。
これを自作PCに構築して試してみようと思う。
次回はVMにインストールしてみた話。
PR