LLM
- LLM
-
LLM(Large Language Model)
大規模言語モデル。
数万から数億と膨大なパラメーターを持っている大規模なModelデータ。
凄まじい量のテキストデータをディープラーニングにより解析、学習させ作られた結果がLLMでこれを利用したものが
ChatGPTなどに代表されるようなAIとなる。
入力された内容を分解、解析し
その言葉や単語から答えとして可能性が高いものを探し出して返答する。
こんにちはと言われた場合
「こんにちは」「こんばんは」「ありがとう」など候補がある場合
次に返す内容は「こんにちは」の可能性が高いためAIは「こんにちは」を返答する
非常にざっくりとそのようなもの。
そのために重要なのは、最初の学習段階の学習量、返答を返すための高速な演算処理装置になるが
学習から返答までこの計算を得意とするのがGPUだったりするため
nvidiaなどが注目されれ、多数のGPUがその計算処理に利用される。
(実際にはAI用に特化されたものが利用されている。)
OpenAIのChatGPT、GoogleのGemini、X(旧Twitter)のGrokなどが有名。
Grokは、公開されていたりするが(Model含めて)
動作させるには、GPUのメモリが80GBほど必要なようである。
↑