Nemotron-TwoTower:LLM生成を「一語ずつ」から「ブロックごと」に動かす試み
きょう取り上げるのは、NVIDIAの Nemotron-TwoTower-30B-A3B-Base-BF16 です。Hugging Face上のNVIDIAコレクションでは、このモデルが直近で更新され、Nemotron-TwoTowerの論文とモデルカードが公開されています。論文自体は arXiv:2606.26493 として登録され、Hugging Faceのモデルカードも、モデル本体・使い方・評価結果をあわせて示しています。([huggi... もっと見る