ローカルAI勢に朗報!GoogleがVRAMを6分の1にロスレス圧縮する方法を発表。既にHuggingFaceで開発者達が一斉に実装開始

1 : 2026/03/25(水) 21:11:12.36 ID:kpqjqlS20

TurboQuant: Redefining AI efficiency with extreme compression

TurboQuant: Redefining AI efficiency with extreme compression
レス1番のリンク先のサムネイル画像
2 : 2026/03/25(水) 21:13:25.20 ID:2xA4QJIe0
バカみたいなChromeを先にどうにかしろ
5 : 2026/03/25(水) 21:16:43.23 ID:F5UC3nnH0
>>2
chromeのメモリが改善されてなかったら飛ばし記事?
8 : 2026/03/25(水) 21:24:53.41 ID:RVCxqmpE0
>>5
KVキャッシュ(AIが対話中に保持する記憶)のメモリ使用量を従来の6分の1以下に削減できる技術だからブラウザとは関係ない
3 : 2026/03/25(水) 21:14:18.92 ID:pfUuPJGnM
俺のグラボでもWAN動くようになるのか
4 : 2026/03/25(水) 21:15:17.94 ID:RV2jxcD70
4090でもVLAM不足を感じてたところだ
改善してほしい
6 : 2026/03/25(水) 21:20:00.43 ID:DilX8pAx0
kvキャッシュが小さくなるのか
いいんでない?
7 : 2026/03/25(水) 21:22:16.88 ID:wqRMnp9Z0
モデル本体じゃなくてKVキャッシュだぞ
いやわかっていてこのスレタイだと思うけど
9 : 2026/03/25(水) 21:34:58.14 ID:BL7JYLr6H
小型モデルが進化してるから3060の2枚目を確保しといたわ
20 : 2026/03/25(水) 22:32:10.26 ID:idSqadWN0
>>9
いいなあ
10 : 2026/03/25(水) 21:39:00.91 ID:ugvSQIWZ0
モデルは小さくならんのに開発者ですらわかってないよな
11 : 2026/03/25(水) 21:41:10.25 ID:XohtSLtt0
クソデカモデルを6分の1にして低VRAMで実行できるわけじゃなさそうだな
チャット履歴を圧縮するだけっぽい
12 : 2026/03/25(水) 21:45:34.58 ID:4+9yw8kB0
ロスレス圧縮なんて可能なのか?
13 : 2026/03/25(水) 21:49:08.19 ID:+63dHrpy0
ローカルモデルでも長いコンテキストで動かせるようになるの?
14 : 2026/03/25(水) 21:55:39.67 ID:L3z8ZwlY0
なんに使うんだこれ
ローカルLLMでエ口TRPGくらいしか思いつかん
15 : 2026/03/25(水) 21:57:41.31 ID:8e+o4VR40
KVキャッシュに泣かされてきたのでめっちゃ助かる(´・ω・`)
16 : 2026/03/25(水) 22:03:30.89 ID:6Ems3NvaH
まじでやばいぞこれ
17 : 2026/03/25(水) 22:06:35.87 ID:mXr9c5H/0
メモリバブル逝ったぁあああぁああああぁあああぁ
18 : 2026/03/25(水) 22:09:48.52 ID:pKUaVxmDH
🤗🤗🤗🤗🤗🤗

👉 🤗

こうですか?わかりません!><

19 : 2026/03/25(水) 22:12:56.06 ID:qyUNO1CaH
ん?メモリの需給逼迫を見越して買われてたサンディスクとかマイクロンやばない?
21 : 2026/03/25(水) 22:43:28.73 ID:/chNdIlC0
Qwen3.5ってエ口書ける?
23 : 2026/03/25(水) 23:04:15.33 ID:T+r7c4az0
>>21
hereticとか付いているタイプは書ける
26 : 2026/03/26(木) 03:20:09.17 ID:j9/1fEzJ0
>>21
規制解除バージョンは行けるっちゃ行けるけど、自発的な発言はキツいな
一々サポートしないと書けない
31 : 2026/03/26(木) 09:00:37.09 ID:4oCO4vCdM
>>21
uncensoredで検索
22 : 2026/03/25(水) 22:46:47.78 ID:p06maJFu0
計算能力は据え置きだけど
記憶力と思い出す力が向上って感じ?
24 : 2026/03/25(水) 23:05:30.91 ID:VZgPBQI20
ようするに前と同じものが出力しやすいってだけじゃね
25 : 2026/03/26(木) 03:18:33.93 ID:j9/1fEzJ0
俺のPCでも48bくらいのモデルがスラスラ動かせるようになるのか
27bのIQ2Mじゃ物足りないからはよ導入してくれ
27 : 2026/03/26(木) 05:24:44.68 ID:eAiVvJwP0
✕1/6に減らせる
○6つ並列できるようになる
29 : 2026/03/26(木) 08:00:15.01 ID:7LBid+UU0
一発でお望みのが出ないからきらい😠
30 : 2026/03/26(木) 08:45:36.04 ID:WoVY53CQH
論文からクロードで構築できるんやね凄い

コメント

タイトルとURLをコピーしました