Google Researchは大規模言語モデルとベクトル検索エンジンのための新しい圧縮技術群として、「TurboQuant」「PolarQuant」「Quantized Johnson-Lindenstrauss(QJL)」を2026年3月24日に発表しました。AIで大きな負担になっているメモリ使用量を減らしつつ、処理速度と検索性能も高めることが目的で、Googleはこれらの技術が特にLLMのK ...
Forget the parameter race. Google's TurboQuant research compresses AI memory by 6x with zero accuracy loss. It's not ...