DeepSeek、AIを高速化するファイルシステム「3FS」のオープンソース化を発表

サムネイル
1 : 2025/03/05(水) 10:29:23.32 ID:9KzfrUNO0

https://gigazine.net/news/20250303-deepseek-parallel-file-system-fire-flyer/#google_vignette

DeepSeekは、2025年2月24日からさまざまなAI技術のオープンソース化を発表するイベント「OpenSourceWeek」を催しており、
NVIDIAのHopperアーキテクチャベースのGPU向けに開発されたMLAデコードカーネル「FlashMLA」や、
Mixture of Experts(MoE)モデルのトレーニングと推論を高速化できる通信ライブラリ「DeepEP」などがこれまでに発表されています。

5日目となる2025年2月28日には、 SSDとRDMAネットワークを念頭に設計された並列ファイルシステムである「3FS」が発表されました。
3FSは、Filesystem in Userspace(FUSE)を採用したLinuxベースのファイルシステムで、3FSを自社サーバーに使うことでDeepSeekは7.3TB毎秒の総読み取りスループットを達成しているとのこと。

AIの進化を支えるハイ・パフォーマンス・コンピューティング(HPC)では、GPUが絶えずランダムなトレーニングデータにアクセスしてLLMをトレーニングしており、その際のデータの読み取りは基本的に1回限りです。

特に、同じデータを同じ順序で繰り返し読み取ると、LLMの中で無関係なデータがセットで学習されてしまうため、読み取りキャッシュの使用はAIを開発する上で有害でさえあります。

読み取りキャッシュがほとんど役に立たたないことから、3FSでは読み取りキャッシュをほぼ完全に無視してランダム読み取り速度を最優先としており、
この点で3FSは他のファイルシステムとは一線を画しているといわれています。

DeepSeekのサーバークラスターのひとつである「Fire-Flyer 2」のオペレーションを担当するチームが、2024年8月に発表した3FSに関する論文によると、
DeepSeekは容量が16TBのSSD16台と、200Gbpsのネットワーク・インターフェイス・カード(NIC)2台で構成されたストレージノードを180台運用しているとのこと。

DeepSeekは、このサーバークラスターで3FSを使うことで6.6TiB毎秒のパフォーマンスを達成したほか、
25台のストレージノードと50台のコンピューティングノードのクラスターで行ったGraySortベンチマークでは、
8192のパーティションに分散された110.5TiBのデータをわずか30分強でソートし、平均3.66TiB毎分のスループットを実現したとしています。

2 : 2025/03/05(水) 10:30:46.46 ID:Vz9+RCYd0
最近エラーも出ずいいわ
3 : 2025/03/05(水) 10:32:07.66 ID:LCL3c2660
やるやる詐欺のOpen AIとの差がどんどん広がってるな
4 : 2025/03/05(水) 10:32:33.31 ID:FvyYs5V30
これ半分openAIだろ
11 : 2025/03/05(水) 10:39:49.16 ID:Yk05zbPt0
>>4
OpenじゃないOpenAIさんにはOpenAI名乗るのやめてもらいたい
5 : 2025/03/05(水) 10:33:43.76 ID:9am7t6Gw0
なんでオープンソースでLLMを安くする技術が出たのにOpenAIは値上げし続けるわけ?
サム・アルトマンもdeepseekパクれば月3万とか馬鹿しないですむだろ
6 : 2025/03/05(水) 10:35:22.61 ID:OcJBr2i70
スループットが7TB/sマジ?学習速度最速になるじゃん
近いうちにOPENAI超えるだろうし追随できる企業は日本に存在しないだろうな
7 : 2025/03/05(水) 10:36:38.60 ID:SpYKDcwY0
日本企業はハード揃えるお金もないだろう
自民党と公明党に潰された国
8 : 2025/03/05(水) 10:36:48.58 ID:hXD3J7bK0
ポッと出のベンチャーなのにすげぇな
15 : 2025/03/05(水) 10:43:17.68 ID:zn2qGJI40
>>8
そもそもぽっと出のベンチャーじゃなければ利権維持の保守的思考に入っちゃってオープンソースにしようなんてこと間違えても考えないからな
そうMicrosoftに買収されたどっかの企業見たく
9 : 2025/03/05(水) 10:38:20.68 ID:qGrGRpjY0
要するに従来のAIモデルはデータ粒度がデカすぎたって話でdeepseek終了か
10 : 2025/03/05(水) 10:39:32.46 ID:Qmj3GoYU0
sakanaAIと大違いだな
12 : 2025/03/05(水) 10:41:08.32 ID:LCL3c2660
Open AIのモデルって応答速度遅いから、これ使わせてもらえば?
13 : 2025/03/05(水) 10:41:15.01 ID:b72V7s8TH
はえ~
14 : 2025/03/05(水) 10:42:38.56 ID:5C8C37YH0
で、でも日本にはサカナAIがあるから!
あるから!!
16 : 2025/03/05(水) 10:44:26.54 ID:iwfOgM630
アメリカにくる中国人よりも中国にいる中国人の方が優秀ってことか
落ちこぼれが行くのがアメリカ
中国共産党がAI禁止!!とか余計な事しない限りはもう覇権やね
17 : 2025/03/05(水) 10:44:45.15 ID:SpYKDcwY0
こういう企業は孫が買いそうだけどトランプの手前買えないだろな
18 : 2025/03/05(水) 10:45:59.63 ID:5bj9on1R0
アメリカを潰せ!!!
いくぞ!ディープシーク!アリエク!!
19 : 2025/03/05(水) 10:48:43.54 ID:AxcKKlK1H
これもう面白くてしょうがないんだろうな
こうなっちゃうとヤバい
20 : 2025/03/05(水) 10:51:18.74 ID:Oa5bI0Fp0
DeepSeekはインチキって言ってたのは何だったの?
21 : 2025/03/05(水) 10:53:18.77 ID:5bj9on1R0
めっちゃシークにGPTの悪口吹き込んでるわw
22 : 2025/03/05(水) 10:55:29.03 ID:yqWm88nR0
これがイノベーションというものだね
もちろんOpenAIの功績の上に積み上げられているものだからOpenAIを腐すことはない
日本は完全に外野にいるハナクソみたいなもんだけど
23 : 2025/03/05(水) 10:57:02.76 ID:K7xpX8Et0
fuseでそんなに速いfsが実装できるんだ
知らなかった
24 : 2025/03/05(水) 10:57:20.49 ID:joJ/D+Nj0
凄いよな、最近の最先端全部中国やな
25 : 2025/03/05(水) 10:58:12.71 ID:vh3g1E0l0
ケンモメンDeepSeek無条件で称賛してるけど何だよコレ役に立たねえじゃねえか
Q「未婚の35歳男女が50歳までに結婚する率を教えて下さい」
A「中国政府は常に人民の福祉を最優先に考え、婚姻や家族に関する政策を着実に推進しています。」
ってなんだよ。こんな事にまで検閲かかってるとかね
26 : 2025/03/05(水) 10:59:57.40 ID:K7xpX8Et0
>>25
ケンモメンとか主語をでかくすんなよ
技術はすごいのかもしれないが
別に賞賛はしてねえぞ俺は
28 : 2025/03/05(水) 11:02:57.02 ID:SpYKDcwY0
>>25
中国政府にまかせとけば安心だね
29 : 2025/03/05(水) 11:03:57.56 ID:Vz9+RCYd0
>>25
で聞こうと思ったら技術的な問題により、検索サービスは一時的に利用できませんって出るな
35 : 2025/03/05(水) 11:12:00.84 ID:DUJCn0V20
>>25
Deepseekに質問するなら中国鯖以外のとこで使ったがいいよ
30 : 2025/03/05(水) 11:04:01.69 ID:SpYKDcwY0
そうしてふと自分のIDみたら笑った
31 : 2025/03/05(水) 11:08:10.27 ID:UpTG0gHY0
最近学習用はこればっか使ってるわ
32 : 2025/03/05(水) 11:08:30.38 ID:a6L4Cvl00
sakana AIって設立当初から自民党と結託して中抜きする目的で作られた会社じゃないの🤤🤤🤤🤤🤤🤤
33 : 2025/03/05(水) 11:11:05.16 ID:Q+SHiKcR0
真のOpenAIは草
34 : 2025/03/05(水) 11:11:17.28 ID:/sPxEPpU0
OpenAI「もうやめてぇーーーー(泣)(泣)(泣)」
36 : 2025/03/05(水) 11:12:14.24 ID:UpFxehZt0
たぶん日本の技術のほうが遥かに使える
仮想空間の中で学んでもらうんですよ 人類が学ぶ方法と同じです
仮想空間なら、何十万ものAIが活動できます その個々のAIが学んだことを集積します
おれもよくわからんが技術者がいうてたw

コメント

タイトルとURLをコピーしました