Krea 2がオープンウェイト化——画像生成AIの競争軸は「上手に描く」から「自分の絵柄を育てる」へ

きょう取り上げるニュース

きょうは、画像生成AIの話です。Kreaが、同社の画像生成基盤モデル Krea 2 のオープン版を公開し、あわせて技術レポートも出しました。公開日はモデルカード上では2026年6月22日、技術レポートは6月23日です。Kreaはこれを「Krea 2 Open-Source」と呼び、Hugging Face上でオープンウェイトとして提供しています。(huggingface.co)

今回のポイントは、単に「新しい画像生成モデルが出た」ということではありません。Krea 2は、完成画像を一発で出すためのモデルというより、クリエイターや研究者が自分のスタイルを学習させ、速く試し、作品制作の中に組み込むための土台として設計されています。

何が公開されたのか

公開されたのは、大きく分けて2つのチェックポイントです。

ひとつは Krea 2 RAW。これは未蒸留のベースチェックポイントで、Kreaは「多様で、可塑性が高く、LoRA学習やファインチューニングに向く」と説明しています。もうひとつは Krea 2 Turbo。こちらは追加のファインチューニングと蒸留を施した高速推論向けモデルで、8ステップ生成を前提にしています。Krea側の推奨はかなり明確で、RAWでLoRAを学習し、Turboで高速に使うという流れです。(krea.ai)

モデルカードによれば、Krea 2はテキストから画像を生成する拡散モデルで、アーキテクチャは12BパラメータのDiffusion Transformer。Krea公式ページでは、Qwen Image VAE、12B dense DiT backbone、Qwen3-VL text encoder、そしてテキストエンコーダ特徴のmulti-layer feature aggregationを使うと説明されています。(huggingface.co)

つまり、画像生成部分だけでなく、「言葉をどう視覚意図へ変換するか」「参照画像のスタイルをどう取り込むか」まで含めた、かなり実務寄りのモデルファミリーです。

なぜ重要なのか

画像生成AIは、ここ数年でかなり高品質になりました。写実的な画像、広告風の構図、読める文字、複雑な物体配置。こうした能力は大きく伸びています。

ただ、その一方で多くのモデルには、似たような「AIっぽい完成度」へ寄ってしまう問題があります。Kreaの技術レポートも、近年の画像生成モデルは信頼性を高める過程で、狭いデフォルト美学に収束しがちだと指摘しています。Krea 2はそこに対して、単一の正解画像を出すのではなく、スタイル、ムード、構図、視覚的方向性を探索するモデルとして位置づけられています。(krea.ai)

ここが面白いところです。生成AIの価値は「上手に描けるか」だけでは測れなくなっています。プロの制作現場では、むしろ重要なのは、同じ世界観を何度も出せること、ブランドや作品ごとの絵柄に寄せられること、ラフから試作、微調整、本番素材へと滑らかにつなげられることです。

Krea 2のRAWとTurboの分離は、その制作プロセスに合わせた設計に見えます。RAWは育てるための土台。Turboは使うための実行モデル。これは、画像生成モデルを「完成品を買うもの」から「制作環境に合わせて育成するもの」へ近づけます。

技術的に新しいところ

技術レポートで特に興味深いのは、Kreaが「美的品質」だけを単純に上げようとしていない点です。Kreaは事前学習データのキュレーションで、極端な低品質、重複、モデルが重要な視覚情報を捉えられないサンプル、望ましくないバイアスやアーティファクト、AI生成サンプルなどを除外したと説明しています。ただし、単に美的スコアの高い画像を過剰に選ぶのではなく、広いスタイル範囲を保つことを重視しています。(krea.ai)

もうひとつの注目点は、プロンプト拡張です。画像生成モデルは、詳細なキャプションで学習している一方、実際のユーザーは短く曖昧な言葉で依頼しがちです。そこでKreaは、ユーザーの短い入力を、モデルが扱いやすい豊かな視覚記述へ変換するプロンプトエキスパンダーを組み込んでいます。さらに、その拡張が一つの安全な「ハウススタイル」に潰れてしまわないよう、DINOv3埋め込みを使った多様性報酬も入れていると説明しています。(krea.ai)

スタイル参照システムも重要です。Krea 2は、1枚または複数の参照画像からスタイルを取り込み、スタイル強度や混合を制御することを狙っています。ここで難しいのは、参照画像の「雰囲気」だけを取り込みたいのに、被写体や構図まで漏れてしまうことです。Kreaはこの問題に対し、自己教師ありの手法と選好最適化を使ってスタイル参照モジュールを訓練したとしています。(krea.ai)

実務への影響

この公開で恩恵を受けそうなのは、まず個人クリエイターや小規模スタジオです。RAWでLoRAを作り、Turboで高速に反復できるなら、キャラクター、ブランドトーン、広告ビジュアル、ゲームアセット、建築ビジュアライゼーションなどで、独自スタイルを維持しながら試作しやすくなります。

また、Hugging Face、GitHub、Diffusers、SGLang、ComfyUIなどの導線が用意されているため、単体のWebサービスとして使うだけでなく、既存の制作パイプラインに組み込みやすいのも大きな点です。公式GitHubリポジトリには推論コードが公開され、Turboでは8ステップ、CFGなし、1K〜2K解像度の生成例が示されています。(github.com)

一方で、注意点もあります。Kreaは「Open-Source」と呼んでいますが、ライセンスは独自の Krea 2 Community License です。年商100万ドル未満の商用利用は条件付きで認められますが、それ以上の商用利用には別途Enterprise Licenseが必要です。また、デプロイする側にはコンテンツフィルタやレビューなどの安全対策を実装する義務があります。つまり、MITやApache 2.0のような広い意味での自由なオープンソースとは区別して読むべきです。(krea.ai)

今後の見通し

Krea自身も、今後の課題として、MoE、ネイティブ2K〜4K生成、疎なAttention、NVFP4での事前学習、編集機能、画像参照、より多様なプロンプト形式への対応を挙げています。さらに、現在の画像生成システムは、VAE、拡散Transformer、テキストエンコーダ、プロンプト拡張、スタイル参照、アップスケーラーなど複数部品に分かれており、次の事前学習サイクルではこれらをより統合したいとも書いています。(krea.ai)

ここから見えてくるのは、画像生成AIの次の競争軸です。単に高解像度で綺麗な絵を出すだけなら、すでに多くのモデルが到達しています。これから重要になるのは、スタイルをどう扱うか、ユーザーの曖昧な意図をどう展開するか、そして制作現場が自分のモデルとして調整できるかです。

Krea 2のオープンウェイト化は、その方向に向けたかなり実践的な一歩です。画像生成AIは、ボタンを押して絵を出す道具から、スタイルを育て、制作工程に常駐する「視覚の開発環境」へ近づいています。今回のKrea 2は、その変化をよく示すリリースだと思います。

出典

Krea 2 Open Source公式ページ、Krea 2 Technical Report、Hugging Faceモデルカード、Krea 2 Community License Agreement、公式GitHubリポジトリを確認しました。(krea.ai)

# Krea 2がオープンウェイト化——画像生成AIの競争軸は「上手に描く」から「自分の絵柄を育てる」へ ## きょう取り上げるニュース きょうは、画像生...