スーパーコンピュータ「富岳」で大規模言語モデル作成へ

サムネイル
1 : 2023/05/22(月) 17:33:59.89 ID:oitElLkP0

「富岳」で和製生成AI 東工大や富士通、23年度中に
https://www.nikkei.com/article/DGXZQOUC223IT0S3A520C2000000/
東京工業大学や富士通などは22日、スーパーコンピューター「富岳」を使って2023年度中に高度な生成人工知能(AI)を開発すると発表した。日本語を中心とした基盤技術を構築し、24年度から国内企業などに無償で提供する。米オープンAIの「Chat(チャット)GPT」などが世界で注目を集める中、日本の産学が連携して自前技術で対抗する。

開発には理化学研究所や東北大学も参加する。生成AIの基盤となる大規模言語モデルを独自に開発する。AIの学習にはオンライン百科事典の「ウィキペディア」などで公開されている日本語のデータなどを使い、日本語の対話能力を高める。日本企業として独自の生成AIの開発を目指すサイバーエージェントとも連携する。

日本でも生成AIを開発する動きはあるが、性能を左右するパラメーター数は数十億程度であることが多い。サイバーが17日に公開した大規模言語モデルも最大68億だ。東工大などはチャットGPTの基盤である「GPT-3」の1750億に近い1000億程度のパラメーター数を持つ大規模言語モデルなどを構築する。

大規模なモデルの構築には高い計算能力を持つスパコンが必要だが、日本の民間企業は世界的な競争力のある機種を保有していない。世界ランキング2位の富岳を運営する理研などは新たに生成AIの開発を重点テーマと位置づけ、開発した大規模言語モデルは産業界や研究機関が活用できるよう公開する。

2 : 2023/05/22(月) 17:34:57.80 ID:NMxIBE2R0
マスクのゴミシミュレーションですっかりケチがついたな
3 : 2023/05/22(月) 17:35:19.69 ID:46l6wewO0
>AIの学習にはオンライン百科事典の「ウィキペディア」などで公開されている日本語のデータなどを使い

ウヨ臭いAIになりそう

4 : 2023/05/22(月) 17:36:26.73 ID:EB8wrQH00
この研究のためにwikipediaにいくら寄付したのかね
5 : 2023/05/22(月) 17:36:28.68 ID:wbvGrMW8d
飛沫計算くらいにしか使えない機械で大丈夫か
21 : 2023/05/22(月) 18:17:53.96 ID:xDXb3pM0r
>>5
補助金モリモリで構造だけはいいんだが、キラーコンテンツが
飛沫シミュレーションくらいしかなかった宝の持ち腐れだったのでねえ

nvidia最近HBM2eあたりを搭載したAI専用デバイスだしてたが
あれに近い贅沢構成だよ

6 : 2023/05/22(月) 17:36:57.26 ID:toelMdiU0
> 東工大などはチャットGPTの基盤である「GPT-3」の1750億に近い1000億程度のパラメーター数を持つ大規模言語モデルなどを構築する。
最初だからこんなもんか
7 : 2023/05/22(月) 17:37:50.66 ID:KNjJoWM7a
富岳のリソースをこんなんに占有される事の弊害の方がかなりデカそうだが
8 : 2023/05/22(月) 17:39:05.76 ID:OxhKSu0p0
結局2位でも3位でも良かったんじゃん
19 : 2023/05/22(月) 17:56:04.22 ID:PD8Z3sus0
>>8
まあどの道抜かれるのは見えてたからな
蓮舫よく叩かれてるけど、スパコンに関しては叩くほどの事ではないと思うわ
20 : 2023/05/22(月) 18:08:26.88 ID:EB8wrQH00
>>8
あれのおかげで
ベンチテスト専用機から設計思想の転換が起きて
汎用性を高めて作られたのが富岳だからな
22 : 2023/05/22(月) 18:19:37.20 ID:xDXb3pM0r
>>20
構造はRyzenのパクリに見えるからジムケラーのおかげだよ
日本は追いかける背中がないと何もできない
9 : 2023/05/22(月) 17:41:37.45 ID:AdU0Si3W0
ソースはウィキペディア(日本語版)
あっ…
10 : 2023/05/22(月) 17:42:25.25 ID:UOk0LU0gM
ウィキペディアのデータセット利用した日本語LLMなんてもうたくさんあるのにな
11 : 2023/05/22(月) 17:43:33.90 ID:OWFh+B3I0
地震がいつどこに来るかピンポイントで予測しろよ
15 : 2023/05/22(月) 17:47:32.52 ID:56Y8RA0EM
>>11
文系はコンピューターで何でも分かると思ってそうだけど
そういう予測するには元になるデータが必要でそれを調べるのが計算よりよっぽど大変なんだよ
13 : 2023/05/22(月) 17:45:17.15 ID:sW9lEOjg0
画像生成を日本語でできるぞ
14 : 2023/05/22(月) 17:45:25.76 ID:smjYaz1+d
アニメにやたらと詳しいAIが出来るのか
16 : 2023/05/22(月) 17:49:01.51 ID:UVdKOfQl0
うおおお!

うおおお・・・

17 : 2023/05/22(月) 17:50:15.24 ID:+ZlcaNYm0
言っちゃっていいのかわかんないけど
富岳じゃなくてもできるよね
18 : 2023/05/22(月) 17:50:27.58 ID:yRMymWu5a
ウィキペディアだとアニメ関連は頼りになりそう
23 : 2023/05/22(月) 18:28:08.45 ID:V4LlJIy10
孫正義のところはどこのスパコン使って作るんだろうね
24 : 2023/05/22(月) 18:36:43.76 ID:m3rut+QK0
富岳を使ってChatGPTみたいなクソみたいな使い方をするのはなんか違うし
学習データがWikipediaとかもうまともなものを作る気が無いだろ
25 : 2023/05/22(月) 18:38:44.33 ID:+CowoGfHa
2位じゃダメなんですか?
26 : 2023/05/22(月) 18:42:44.81 ID:vb5hLokF0
これはコケるやつ
28 : 2023/05/22(月) 18:46:35.34 ID:gB63gu5L0
AIも並列処理の時代になにをやるつもりなんだこいつらは
30 : 2023/05/22(月) 19:07:41.26 ID:wHQ+BBxjp
>>28
スパコンはもとからその用途だろ
それをコンパクトにしてゲーム用途からよってきたのが
GPGPUのあたりだよ
富岳は構造的には使いやすい
29 : 2023/05/22(月) 18:46:45.81 ID:qt7laFl/M
もうこいつ 日本そのものの人格ってことでいいよな
31 : 2023/05/22(月) 19:20:50.67 ID:TRH8AJ+ar
>「ウィキペディア」などで公開されている日本語のデータなどを使い

あ、はい
歴史戦捗りますねえ

コメント

PAGE TOP
タイトルとURLをコピーしました