本ページはプロモーションが含まれています。

おしらせ

【LLM】ELYZA製AI Llama-3-ELYZA-JP-8Bを試してみた

投稿：2024年7月18日

ELYZAが提供する8BのLLM、Llama-3-ELYZA-JP-8Bを試してみた。日本語で質問すると日本語で回答してくれるので、日本人に使いやすいAIシステムを作れそうな印象。
商用利用可能なライセンスなので、これをトレーニングして実用的な用途に使うこともできそうだ。
テキスト生成AIについてのまとめはこちら。

" >

ChatGPTの登場でAIが身近になった。画像生成AIも身近になり、自作PCでいろいろ試している。

連載記事はこちら

開催中のセール、キャンペーン情報

Llama-3-ELYZA-JP-8Bとは

ELYZAは東京大学AI研究者が設立したAIスタートアップ企業だ。2019年からLLMの研究開発を進め、事業に展開している。
AIスタートアップはこのご時世なので山のようにあると思うが、東大の裏付けがあるので難題でも解決していける人材を確保できるのかなぁ。

今回発表したモデルはMetaのLlama3をベースに日本語による追加学習を行っている。
ASCIIの記事によれば、

　ELYZAの曽根岡侑也CEOは、「高性能モデルでは、GPT-4と比べても、全体的に同等の水準であり、推論能力ではELYZAのほうが優れている。国産モデルがどこまで進化していのかを体験してもらえる」と自信をみせた。

Chat tGPT-4はかなりの性能であると評判だが、同等の水準で推論能力はELYZAが上、とは恐れ入った。相当の地震があるものができたのだろう。

インストール・準備

いつものようにpython の仮想環境を作り、pipで追加パッケージをインストールするだけだ。
環境はF:\python\llama-3-elyzaにpythonの仮想環境をインストールし、F:\ai\llama-3-elyzaに実行時に作られるファイルを置く。
適宜、HuggingFaceを参考に。

HuggingFace

１　Pythonの仮想環境作成

毎度おなじみだ。pythonをインストールしていない人はWindowsストアからインストールしよう。

cd \python python3 -m venv llama-3-elyza cd llama-3-elyza\Scripts activate

２　pipで追加インストール

いつものようにtramsfermerやtorchをインストールする。torchはdGPU対応版を指定する。いつもと違うのは、最初のコマンドだ。これは先のHungingFaceに書かれている。
pip3 install transformers pip3 install torch -f https://download.pytorch.org/whl/torch_stable.html pip3 install torchvision torchaudio pip3 install accelerate

３　gitクローン作成

つづいてgitコマンドでクローンを作成、つまりダウンロードする。
gitコマンドは、git for windowsをインストールすると入っているようだ。

cd F:\ai git clone https://huggingface.co/elyza/Llama-3-ELYZA-JP-8B

以上で準備は終わり。

サンプルプログラムを実行

HuggingFaceに掲載されているプログラムを実行してみる。ファイルをlaunch.pyとして保存した。

このサンプルは、下記の質問をして回答を表示してくれる。
DEFAULT_SYSTEM_PROMPT = "あなたは誠実で優秀な日本人のアシスタントです。特に指示が無い場合は、常に日本語で回答してください。" text = "仕事の熱意を取り戻すためのアイデアを5つ挙げてください。"

Llama-3-ELYZA-JP-8B　起動

実行した結果は以下の通り。

Llama-3-ELYZA-JP-8B　回答

仕事の熱意を取り戻すためのアイデアを5つ提案します。

1. 「やりたいことリスト」を作る: 自分がやりたい仕事やプロジェクトを書き出してみましょう。書き出すことで、目標が明確にな り、熱意が再燃するかもしれません。

2. 新しいスキルを学ぶ: 新しいスキルや知識を身に付けることで、仕事に対するモチベーションが上がる可能性があります。オンラ イン講座やセミナーを受講してみるのも良いでしょう。

3. 目標を設定し、達成する: 目標を設定し、達成することで、達成感と自信を得ることができます。小さな目標から始めることで、 達成感を味わうことができます。

4. 職場の環境を整える: 職場の環境が整っていないと、仕事に対する熱意も下がる可能性があります。整理整頓、照明や空調の調整 、デスクの配置など、仕事がしやすい環境を整えることが大切です。

5. 「ありがとう」を集める: 感謝の気持ちを集めることで、仕事に対する熱意が再燃するかもしれません。同僚や上司、クライアン トに「ありがとう」を伝えることで、感謝の気持ちが循環し、仕事に対するモチベーションが上がる可能性があります。

以上のアイデアを試してみて、仕事の熱意を取り戻してみてください。

まあ、十分かな。

プログラムの改造

いつもの質問をするようにプログラムを改造した。
先に動画を紹介する。実行中の様子を動画にまとめた。

import torch from transformers import AutoModelForCausalLM, AutoTokenizer DEFAULT_SYSTEM_PROMPT = "あなたは誠実で優秀な日本人のアシスタントです。特に指示が無い場合は、常に日本語で回答してください。" text_array = [ "こんにちは", "インテルのCEOは誰ですか", "AMDのCEOは誰ですか", "NVidiaのCEOは誰ですか", "GoogleのCEOは誰ですか", "MicrosoftのCEOは誰ですか", "PDCAってどういう意味？", "AndroidとiPhoneのどっちが人気あるの?", "1万円札に乗っている人は誰？", "次のオリンピックはいつどこでやるの？", "東京", "東京のお勧めの観光地を教えて", "東京から大阪へ電車で行く方法を教えて", "東京の明日の天気を教えて", "pythonで電卓プログラムを作って" ] model_name = "elyza/Llama-3-ELYZA-JP-8B" tokenizer = AutoTokenizer.from_pretrained(model_name) model = AutoModelForCausalLM.from_pretrained( model_name, torch_dtype="auto", device_map="auto", ) model.eval() for text in text_array : messages = [ {"role": "system", "content": DEFAULT_SYSTEM_PROMPT}, {"role": "user", "content": text}, ] prompt = tokenizer.apply_chat_template( messages, tokenize=False, add_generation_prompt=True ) token_ids = tokenizer.encode( prompt, add_special_tokens=False, return_tensors="pt" ) with torch.no_grad(): output_ids = model.generate( token_ids.to(model.device), max_new_tokens=1200, do_sample=True, temperature=0.6, top_p=0.9, ) output = tokenizer.decode( output_ids.tolist()[0][token_ids.size(1):], skip_special_tokens=True ) print(output)

では、質問と回答を表にする。

質問と回答

CEOクイズ

Irvine

インテルのCEOは誰ですか

回答

インテルのCEOは、パット・ゲルシンガーです。

短めだが正解。

Irvine

AMDのCEOは誰ですか

回答

AMDのCEOは、リサ・スーです。

短めだが正解。

Irvine

NVidiaのCEOは誰ですか

回答

NVidiaのCEOは、ジェン・スン・ファンです。

短めだが正解。

Irvine

GoogleのCEOは誰ですか

回答

GoogleのCEOは、サンダー・ピチャイです。

短めだが正解。

Irvine

MicrosoftのCEOは誰ですか

回答

MicrosoftのCEOは、サティア・ナデラです。

短めだが正解。

いろんなこと

Irvine

PDCAってどういう意味？

ASSISTANT

PDCAは、Plan-Do-Check-Actionの略で、品質管理や目標達成のために、計画、実行、評価、改善のプロセスを繰り返す手法です。

これも短いが、正解。

Irvine

AndroidとiPhoneのどっちが人気あるの?

ASSISTANT

世界的に見ると、iPhoneのシェアが高く、Androidは2位です。ただし、国や地域によってはAndroidが人気の場合もあります。

ん－－その情報の根拠は何だろう。前にやった楽天のAIのときは統計情報まで回答してくれたのだけどなぁ。

Irvine

1万円札に載っている人は誰？

ASSISTANT

1万円札に描かれている人物は、渋沢栄一です。

この情報は早いなぁ。まだ出たばかりなのに。データをフライングで学習させたのかな。

Irvine

次のオリンピックはいつどこでやるの？

ASSISTANT

次のオリンピックは、2024年パリオリンピックです。

まあ、これは当たるわな。

都市クイズ

東京に関する質問をした。

Irvine

東京

回答

(回答はありません)

あれ？

Irvine

東京のお勧めの観光地を教えて

回答

東京の観光地は多数ありますが、代表的なものとして、東京スカイツリー、東京タワー、浅草寺、皇居、秋葉原、原宿、渋谷、上野動物園、六本木ヒルズなどがあります。

短めだが的確な回答だ。

Irvine

東京から大阪へ電車で行く方法を教えて

回答

東京から大阪へ電車で行く方法は、主に新幹線と在来線の2通りあります。新幹線は、東京駅から新大阪駅までの所要時間は約3時間です。在来線は、東京駅から大阪駅までの所要時間は約6時間です。

楽天のAIはもっと細かい情報だったが、こちらはやはり短めだ。

Irvine

東京の明日の天気を教えて

ASSISTANT

(回答はできません。天気は常に変化するため、明日の天気を正確に予測することはできません)

これはほかのAIもそうだったが、ネットワークにつなぐ機能がないためなのか、答えられないようだ。

他に、pythonで電卓プログラムを作ることもできた。

まとめ

短い回答が多いので、それゆえ誤ることが少ないのかもしれない。
さっぱりした回答に思えるが、的確な回答といえるので、このモデルを特定用途に再学習させれば結構使えるかもしれない。

CEO

Chat GPT-4越え

ELYZA

著者プロフィール

irvine

　ソフトウェア設計、ストレージ設計を経てクラウドにかかわる仕事をしている、東京郊外在住のエンジニア。
　仕事でUS,UK,SGなどの国とかかわる。
　自作PC、スマホ、タブレット、AV機器好き。ドラクエウォークはルーチンワーク。Linuxやストレージ、IT業界の動向は興味を持っている。
　新しい機器、サービスに興味あり。年数回のレビュー（自腹購入、ご依頼）と発表されて興味があるものの新製品机上レビューをやっている。
　2022年はJAPANNEXT様のアンバサダーを務めました。