Nvidiaバブル、終了か。加算演算だけで高速・高性能を実現するAIモデル「BitNet」をMicrosoftが発表し、ハードウェア革命到来

1 : 2024/02/28(水) 21:03:49.07 ID:jm46InH00

WirelessWire News
『1ビットLLMの衝撃! 70Bで8.9倍高速 全ての推論を加算のみで!GPU不要になる可能性も』
https://wirelesswire.jp/2024/02/86094/

Microsoftの中国チームがとてつもないLLMをリリースした。それが「BitNet 1.58Bits」だ。

もともとMicrosoftはかねてから「1ビット量子化」の研究を続けて来た。しかし、32ビット浮動小数点での計算が主流な時代にはあまりに野心的で荒唐無稽なプロジェクトに見えていたのは否めない。しかし、現在、大規模言語モデル(LLM;Large Language Model)は8ビット、4ビットで量子化されるのが当たり前になり、量子化しても性能劣化はある程度まで抑えられることも知られるようになった。

昨年10月に発表した「BitNet」は、多くの人々が他のことに気を取られていてほとんど話題にならなかった。
そんな中、満を持して発表された1ビットLLMの性能に関するレポートは、衝撃的と言っていい内容だ。論文のタイトルも堂々と「The Era of 1-bit LLM(1ビットLLMの時代)」としている。

彼らが発表したグラフを引用しよう。
レス1番のサムネイル画像

まず、最近主流になっている70B(700億)パラメータモデルでの比較である。Llamaの70BとBitNetの70Bモデルを比較すると、BitNetは8.9倍のスループットを誇るという。

「速いだけで回答が微妙なのでは」と心配するのが普通だろう。
そこでLlamaモデルとの比較が載っている。
レス1番のサムネイル画像

この表によると、BitNetはLlamaよりも3倍高速でしかも高精度ということになる。
PPLは「困惑」の度合いを意味する数値で、低いほど「困惑してない」ことになる。Llamaよりも性能劣化してないどころか性能は上がっている。

また、各種ベンチマークにおいても平均点は同規模のBitNetがLlamaを上回っている。しかもBitNetは規模が大きくなるほどLlamaに対して優位に立つようになっている。

この圧倒的なスピードの秘密は、BitNetが文字通り「1ビットで処理している」からだ。

レス1番のサムネイル画像

2 : 2024/02/28(水) 21:04:01.75 ID:jm46InH00
通常、LLMをふくむディープラーニングされたニューラルネットは巨大な行列の積和演算(掛け算と足し算)を必要とする。
推論時も学習時もそうだ。

しかし、1ビット、つまり、行列の中身が0か1しかないのであれば、全ての計算を加算演算のみにできる。
加算と乗算では計算速度も負荷も段違いに異なるため、これだけのスピードの差が出ている。また、当然ながらメモリ効率も高い。

このため、この論文では「積和演算に最適化されたGPUではなく、加算処理のみに特化した新しいハードウェアの出現」までもが予言されている。
今現在、世界各国が血眼になってGPUを確保し、囲い込んでいることを考えると、実に痛快な論文だ。

非常に驚異的なことが書いてあるのだが、残念ながらBitNetによるLLMの実装とモデルはまだ公開されていない。
だから彼らの主張が本当かどうかはまだ誰にもわからないのだが、BitNetTransformerの実装だけは公開されているため、腕に覚えがあるエンジニアなら自分でトレーニングコードを書いて確かめることができる。

いずれにせよ、 この論文が本当だとしたら、とんでもないことが起きることになる。
この業界に居て長いが、本当にいつもいつも、こんなニュースに触れて興奮できるこの時代を生きる我々は幸運としか言えない。
もちろん筆者もBitNetを試してみるつもりだ。

3 : 2024/02/28(水) 21:04:14.43 ID:jm46InH00
【論文】
The Era of 1-bit LLMs: All Large Language Models are in 1.58 Bits
1 ビット LLM の時代: すべての大規模言語モデルは 1.58 ビット
https://huggingface.co/papers/2402.17764
4 : 2024/02/28(水) 21:04:22.61 ID:jm46InH00
Xの反応
レス4番のサムネイル画像
レス4番のサムネイル画像
5 : 2024/02/28(水) 21:05:19.66 ID:LytqI1Jn0
AIって意外と精度いらんらしいな
6 : 2024/02/28(水) 21:05:26.92 ID:qjdAtkeh0
一生の宝にするとか言ってたニーサ民売れずに爆死w
7 : 2024/02/28(水) 21:05:55.99 ID:HvgJppYI0
まあNVIDIAもMSFチームだからええんやない
8 : 2024/02/28(水) 21:06:13.33 ID:t2o+1zrAd
っぱ、握るならAMDよ!
9 : 2024/02/28(水) 21:06:21.96 ID:HPvf94G00
一生一緒にNVIDIA
10 : 2024/02/28(水) 21:06:50.75 ID:o5HvaOg00
一生一緒に分散投資
11 : 2024/02/28(水) 21:06:52.75 ID:Y3r7ULvf0
結局謎の企業よりインテルの方が強いんよ
12 : 2024/02/28(水) 21:07:38.84 ID:MCr/rwXr0
切り捨てが発生しないから精度よくなるんか?
13 : 2024/02/28(水) 21:07:47.90 ID:BDcCEXl80
量子コンピューターと同じ
すごいすごい言われてたけど
この10年間で株が上がったのはnvidia
14 : 2024/02/28(水) 21:07:49.00 ID:XWGcjDRa0
MS株も買ってるワイ 高みの見物
15 : 2024/02/28(水) 21:08:12.76 ID:Oab7Oxcf0
これ半分Wintelだろ
16 : 2024/02/28(水) 21:08:36.61 ID:yxdrA2uVH
ゲイツは株売ったしな
17 : 2024/02/28(水) 21:09:06.64 ID:zcnSYerV0
ええ
18 : 2024/02/28(水) 21:09:23.21 ID:EBvydWRd0
っぱリサ・マリーよ
19 : 2024/02/28(水) 21:10:21.57 ID:8p4bltTe0
とうとうでたね。。。
20 : 2024/02/28(水) 21:10:38.34 ID:v+ywFOJd0
面白そうね
21 : 2024/02/28(水) 21:10:48.62 ID:wpKbrTTI0
これ抜きにしてもヌビダビスの株価の上がり方は流石に垂直すぎてバブルやろ
22 : 2024/02/28(水) 21:10:52.61 ID:Fw+ArHA+0
NASDAQ100でいいじゃん(いいじゃん)
23 : 2024/02/28(水) 21:11:27.90 ID:N/11bhOO0
謎の企業の決算前に発表すればよかったのにやさちいね
24 : 2024/02/28(水) 21:11:58.64 ID:BFAI+HMv0
中身を1と0と-1で表現してる
なので4値の2bitではないけど3値必要なので正確には1.58bit

こうすることでかけ算があったはずの行列の計算を強制的に足し算引き算無の3種類に落とし込める
加えて演算を進めていくにつれて浮動小数だとノイズが混じっていくが、こっちは精度が落ちようがない

30 : 2024/02/28(水) 21:13:23.08 ID:zcnSYerV0
>>24
1bit?と思ってリンク先見た
そうだね
43 : 2024/02/28(水) 21:16:15.97 ID:Z9vXrWzc0
>>24
あーやっぱそうか

それで1.58なんや😺

50 : 2024/02/28(水) 21:17:32.85 ID:voITPUzba
>>24
へえ🥺
25 : 2024/02/28(水) 21:12:25.60 ID:JfjzipZg0
1bitAIか
ネトウヨ時代の到来
26 : 2024/02/28(水) 21:12:47.55 ID:4P6+jUjK0
実用化は20年後かな
27 : 2024/02/28(水) 21:13:04.91 ID:Z9vXrWzc0
  まじかー😹
28 : 2024/02/28(水) 21:13:11.19 ID:svxYOvlc0
ゲーマー歓喜だろ
29 : 2024/02/28(水) 21:13:20.66 ID:EFwNuqcs0
お前らいつもエヌビ捨ててんな
31 : 2024/02/28(水) 21:13:42.77 ID:62l6X4HDd
つまりどういう事なんだよ
32 : 2024/02/28(水) 21:13:58.72 ID:sVxU7VpP0
行列演算の手続きを加法一本にして単純化したわけか
誰でも思い付きそうだが何が技術的に難しいんだろう?
33 : 2024/02/28(水) 21:14:07.66 ID:itfLqwwS0
これbit低くなる事に精度下がるんだろ
34 : 2024/02/28(水) 21:14:16.92 ID:fkatMcul0
俺のマイクロソフト株が爆上げするんか?
35 : 2024/02/28(水) 21:14:26.92 ID:+WXhHKzP0
なるほど分からん
36 : 2024/02/28(水) 21:14:47.66 ID:62l6X4HDd
1ビット脳とかバカにされてたのどうして
37 : 2024/02/28(水) 21:14:53.36 ID:gHOVnK9oM
ざまあみろクソ革ジャン🤣🤣🤣🤣
38 : 2024/02/28(水) 21:15:05.35 ID:G876RL/j0
NVDA売気配つえーな
決算前まで大暴落くるか
39 : 2024/02/28(水) 21:15:22.46 ID:VlGpVYeB0
難し過ぎてわからん
40 : 2024/02/28(水) 21:15:23.05 ID:k0N0m9IK0
PER30倍台の成長企業にバブルもくそもないだろ
41 : 2024/02/28(水) 21:15:29.35 ID:R6I0KXWB0
タイトルかっこよすぎ
42 : 2024/02/28(水) 21:16:14.33 ID:E3x9F7vuH
1ビット脳とかこれ半分ジャップだろ
44 : 2024/02/28(水) 21:16:21.75 ID:fkatMcul0
まさか1ビット脳が高評価される時代になるとはな
45 : 2024/02/28(水) 21:16:45.17 ID:U1UNo/eM0
なんか結局GPUにMapして並列化する方が早いで終わりそうな気がするが
46 : 2024/02/28(水) 21:16:53.27 ID:2MeybooA0
中国人の頭脳は異常
47 : 2024/02/28(水) 21:17:08.48 ID:kNC0LStQ0
そこまでNividaのプレが下がってる訳でも無いしMicrosoftのプレが上がってる訳でも無いな
様子をうかがっている段階か
48 : 2024/02/28(水) 21:17:23.53 ID:LVGmqD9M0
NVIDIA爆下げしてくれ
株界隈が面白くなるぞ
49 : 2024/02/28(水) 21:17:28.92 ID:Y+q2yOj80
要はAIの学習法でもっと良いのがありましたってことだよな
51 : 2024/02/28(水) 21:17:39.64 ID:v/CIiXg50
難しすぎて凄さがまったくわからんwww

コメント

タイトルとURLをコピーしました