Google の TurboQuant という新メモリ圧縮アルゴリズム
2026年3月30日 10:00
Googleの研究部門であるGoogle Researchは2026年3月24日にTurboQuantという新技術を発表しました。 この技術は大規模言語モデルが動作する際に不可欠な会話履歴などの情報を保持するメモリ領域(KVキャッシュ)を、精度を維持したまま従来の6分の1にまで圧縮するアルゴリズムです。 これにより処理速度も最大8倍に向上するという衝撃的な結果が示されています。 これまでは高価なメモリをいかに大量に搭載するかという物理的な物量戦が主流でしたが今回Googleはソフトウェアの力でそのハードウェア依存という限界を打ち破りました。
このニュースによりSKハイニックスやサムスン電子、マイクロン・テクノロジーといった大手メモリメーカーの株価は一斉に下落しました。 メモリ需要の成長スピードにブレーキがかかると市場に受け止められたためです。 特にデータセンターなどで高価なメモリを大量に買い増す必要性が減る可能性があり、これらのメーカーの強気な成長シナリオに修正の見方が入っています。
しかし運用コストが劇的に下がることは、これまで高コストゆえにAIの導入が難しかった分野で活用が広がることも意味します。 小さなIoTデバイスやスマートフォンなどにも高度なAIを搭載できるようになってきます。 AIの開発はハードウェアの増強からソフトウェアやアルゴリズムの進化による効率化へと新たな局面に入ったと言えます。
