解説
何が起きたか
OpenAIとBroadcomは、LLMの推論処理に最適化したチップを発表しました。推論とは、利用者がAIに質問したあと、AIが答えを生成する処理のことです。
なぜ重要か
AIサービスの利用が増えるほど、応答速度、電力、サーバー費用が重要になります。専用チップは、汎用的な計算機よりも特定用途に合わせやすいため、AIサービスの運用効率に影響する可能性があります。
利用者への影響
短期的には、一般ユーザーが直接設定を変える話ではありません。ただし長期的には、AIサービスの応答速度、安定性、利用料金、提供できる機能の幅に関係してくる可能性があります。
ここちゃんメモ
モデルの性能だけでなく、裏側のチップやサーバーもAIの使いやすさを支えているでち。ニュースを見るときは「何ができるようになるか」と「誰のコストが下がるか」を見ると分かりやすいでち!