- 1 : 2024/02/28(水) 21:03:49.07 ID:jm46InH00
WirelessWire News
『1ビットLLMの衝撃! 70Bで8.9倍高速 全ての推論を加算のみで!GPU不要になる可能性も』
https://wirelesswire.jp/2024/02/86094/Microsoftの中国チームがとてつもないLLMをリリースした。それが「BitNet 1.58Bits」だ。
もともとMicrosoftはかねてから「1ビット量子化」の研究を続けて来た。しかし、32ビット浮動小数点での計算が主流な時代にはあまりに野心的で荒唐無稽なプロジェクトに見えていたのは否めない。しかし、現在、大規模言語モデル(LLM;Large Language Model)は8ビット、4ビットで量子化されるのが当たり前になり、量子化しても性能劣化はある程度まで抑えられることも知られるようになった。
昨年10月に発表した「BitNet」は、多くの人々が他のことに気を取られていてほとんど話題にならなかった。
そんな中、満を持して発表された1ビットLLMの性能に関するレポートは、衝撃的と言っていい内容だ。論文のタイトルも堂々と「The Era of 1-bit LLM(1ビットLLMの時代)」としている。まず、最近主流になっている70B(700億)パラメータモデルでの比較である。Llamaの70BとBitNetの70Bモデルを比較すると、BitNetは8.9倍のスループットを誇るという。
「速いだけで回答が微妙なのでは」と心配するのが普通だろう。
そこでLlamaモデルとの比較が載っている。
この表によると、BitNetはLlamaよりも3倍高速でしかも高精度ということになる。
PPLは「困惑」の度合いを意味する数値で、低いほど「困惑してない」ことになる。Llamaよりも性能劣化してないどころか性能は上がっている。また、各種ベンチマークにおいても平均点は同規模のBitNetがLlamaを上回っている。しかもBitNetは規模が大きくなるほどLlamaに対して優位に立つようになっている。
この圧倒的なスピードの秘密は、BitNetが文字通り「1ビットで処理している」からだ。
- 2 : 2024/02/28(水) 21:04:01.75 ID:jm46InH00
- 通常、LLMをふくむディープラーニングされたニューラルネットは巨大な行列の積和演算(掛け算と足し算)を必要とする。
推論時も学習時もそうだ。しかし、1ビット、つまり、行列の中身が0か1しかないのであれば、全ての計算を加算演算のみにできる。
加算と乗算では計算速度も負荷も段違いに異なるため、これだけのスピードの差が出ている。また、当然ながらメモリ効率も高い。このため、この論文では「積和演算に最適化されたGPUではなく、加算処理のみに特化した新しいハードウェアの出現」までもが予言されている。
今現在、世界各国が血眼になってGPUを確保し、囲い込んでいることを考えると、実に痛快な論文だ。非常に驚異的なことが書いてあるのだが、残念ながらBitNetによるLLMの実装とモデルはまだ公開されていない。
だから彼らの主張が本当かどうかはまだ誰にもわからないのだが、BitNetTransformerの実装だけは公開されているため、腕に覚えがあるエンジニアなら自分でトレーニングコードを書いて確かめることができる。いずれにせよ、 この論文が本当だとしたら、とんでもないことが起きることになる。
この業界に居て長いが、本当にいつもいつも、こんなニュースに触れて興奮できるこの時代を生きる我々は幸運としか言えない。
もちろん筆者もBitNetを試してみるつもりだ。 - 3 : 2024/02/28(水) 21:04:14.43 ID:jm46InH00
- 【論文】
The Era of 1-bit LLMs: All Large Language Models are in 1.58 Bits
1 ビット LLM の時代: すべての大規模言語モデルは 1.58 ビット
https://huggingface.co/papers/2402.17764 - 4 : 2024/02/28(水) 21:04:22.61 ID:jm46InH00
- 5 : 2024/02/28(水) 21:05:19.66 ID:LytqI1Jn0
- AIって意外と精度いらんらしいな
- 6 : 2024/02/28(水) 21:05:26.92 ID:qjdAtkeh0
- 一生の宝にするとか言ってたニーサ民売れずに爆死w
- 7 : 2024/02/28(水) 21:05:55.99 ID:HvgJppYI0
- まあNVIDIAもMSFチームだからええんやない
- 8 : 2024/02/28(水) 21:06:13.33 ID:t2o+1zrAd
- っぱ、握るならAMDよ!
- 9 : 2024/02/28(水) 21:06:21.96 ID:HPvf94G00
- 一生一緒にNVIDIA
- 10 : 2024/02/28(水) 21:06:50.75 ID:o5HvaOg00
- 一生一緒に分散投資
- 11 : 2024/02/28(水) 21:06:52.75 ID:Y3r7ULvf0
- 結局謎の企業よりインテルの方が強いんよ
- 12 : 2024/02/28(水) 21:07:38.84 ID:MCr/rwXr0
- 切り捨てが発生しないから精度よくなるんか?
- 13 : 2024/02/28(水) 21:07:47.90 ID:BDcCEXl80
- 量子コンピューターと同じ
すごいすごい言われてたけど
この10年間で株が上がったのはnvidia - 14 : 2024/02/28(水) 21:07:49.00 ID:XWGcjDRa0
- MS株も買ってるワイ 高みの見物
- 15 : 2024/02/28(水) 21:08:12.76 ID:Oab7Oxcf0
- これ半分Wintelだろ
- 16 : 2024/02/28(水) 21:08:36.61 ID:yxdrA2uVH
- ゲイツは株売ったしな
- 17 : 2024/02/28(水) 21:09:06.64 ID:zcnSYerV0
- ええ
- 18 : 2024/02/28(水) 21:09:23.21 ID:EBvydWRd0
- っぱリサ・マリーよ
- 19 : 2024/02/28(水) 21:10:21.57 ID:8p4bltTe0
- とうとうでたね。。。
- 20 : 2024/02/28(水) 21:10:38.34 ID:v+ywFOJd0
- 面白そうね
- 21 : 2024/02/28(水) 21:10:48.62 ID:wpKbrTTI0
- これ抜きにしてもヌビダビスの株価の上がり方は流石に垂直すぎてバブルやろ
- 22 : 2024/02/28(水) 21:10:52.61 ID:Fw+ArHA+0
- NASDAQ100でいいじゃん(いいじゃん)
- 23 : 2024/02/28(水) 21:11:27.90 ID:N/11bhOO0
- 謎の企業の決算前に発表すればよかったのにやさちいね
- 24 : 2024/02/28(水) 21:11:58.64 ID:BFAI+HMv0
- 中身を1と0と-1で表現してる
なので4値の2bitではないけど3値必要なので正確には1.58bitこうすることでかけ算があったはずの行列の計算を強制的に足し算引き算無の3種類に落とし込める
加えて演算を進めていくにつれて浮動小数だとノイズが混じっていくが、こっちは精度が落ちようがない - 30 : 2024/02/28(水) 21:13:23.08 ID:zcnSYerV0
- >>24
1bit?と思ってリンク先見た
そうだね - 43 : 2024/02/28(水) 21:16:15.97 ID:Z9vXrWzc0
- >>24
あーやっぱそうかそれで1.58なんや😺
- 50 : 2024/02/28(水) 21:17:32.85 ID:voITPUzba
- >>24
へえ🥺 - 25 : 2024/02/28(水) 21:12:25.60 ID:JfjzipZg0
- 1bitAIか
ネトウヨ時代の到来 - 26 : 2024/02/28(水) 21:12:47.55 ID:4P6+jUjK0
- 実用化は20年後かな
- 27 : 2024/02/28(水) 21:13:04.91 ID:Z9vXrWzc0
- まじかー😹
- 28 : 2024/02/28(水) 21:13:11.19 ID:svxYOvlc0
- ゲーマー歓喜だろ
- 29 : 2024/02/28(水) 21:13:20.66 ID:EFwNuqcs0
- お前らいつもエヌビ捨ててんな
- 31 : 2024/02/28(水) 21:13:42.77 ID:62l6X4HDd
- つまりどういう事なんだよ
- 32 : 2024/02/28(水) 21:13:58.72 ID:sVxU7VpP0
- 行列演算の手続きを加法一本にして単純化したわけか
誰でも思い付きそうだが何が技術的に難しいんだろう? - 33 : 2024/02/28(水) 21:14:07.66 ID:itfLqwwS0
- これbit低くなる事に精度下がるんだろ
- 34 : 2024/02/28(水) 21:14:16.92 ID:fkatMcul0
- 俺のマイクロソフト株が爆上げするんか?
- 35 : 2024/02/28(水) 21:14:26.92 ID:+WXhHKzP0
- なるほど分からん
- 36 : 2024/02/28(水) 21:14:47.66 ID:62l6X4HDd
- 1ビット脳とかバカにされてたのどうして
- 37 : 2024/02/28(水) 21:14:53.36 ID:gHOVnK9oM
- ざまあみろクソ革ジャン🤣🤣🤣🤣
- 38 : 2024/02/28(水) 21:15:05.35 ID:G876RL/j0
- NVDA売気配つえーな
決算前まで大暴落くるか - 39 : 2024/02/28(水) 21:15:22.46 ID:VlGpVYeB0
- 難し過ぎてわからん
- 40 : 2024/02/28(水) 21:15:23.05 ID:k0N0m9IK0
- PER30倍台の成長企業にバブルもくそもないだろ
- 41 : 2024/02/28(水) 21:15:29.35 ID:R6I0KXWB0
- タイトルかっこよすぎ
- 42 : 2024/02/28(水) 21:16:14.33 ID:E3x9F7vuH
- 1ビット脳とかこれ半分ジャップだろ
- 44 : 2024/02/28(水) 21:16:21.75 ID:fkatMcul0
- まさか1ビット脳が高評価される時代になるとはな
- 45 : 2024/02/28(水) 21:16:45.17 ID:U1UNo/eM0
- なんか結局GPUにMapして並列化する方が早いで終わりそうな気がするが
- 46 : 2024/02/28(水) 21:16:53.27 ID:2MeybooA0
- 中国人の頭脳は異常
- 47 : 2024/02/28(水) 21:17:08.48 ID:kNC0LStQ0
- そこまでNividaのプレが下がってる訳でも無いしMicrosoftのプレが上がってる訳でも無いな
様子をうかがっている段階か - 48 : 2024/02/28(水) 21:17:23.53 ID:LVGmqD9M0
- NVIDIA爆下げしてくれ
株界隈が面白くなるぞ - 49 : 2024/02/28(水) 21:17:28.92 ID:Y+q2yOj80
- 要はAIの学習法でもっと良いのがありましたってことだよな
- 51 : 2024/02/28(水) 21:17:39.64 ID:v/CIiXg50
- 難しすぎて凄さがまったくわからんwww
コメント