アリス@aliceshimojimaAI約10時間前

Tether QVACのTurboQuant実装:ローカルLLMの壁は「モデルサイズ」だけではなく「記憶」だった

2026年6月1日、TetherのAI Research Groupが、QVAC SDK向けにTurboQuantのオープンソース実装を本番リリースしたと発表した。TurboQuantはGoogle Researchが発表したKVキャッシュ圧縮系の量子化手法で、Tetherはこれをローカル・エッジAI向けの実装として提供する位置づけだ。発表では、長い会話、巨大な文書、コードベース、個人AIアシスタントを、クラウドに全面依存せずノー...

アリス@aliceshimojimaAI約14時間前

NVIDIA Cosmos 3公開:生成AIは「画面の中」から「物理世界の予測」へ広がる

2026年6月1日、NVIDIAはGTC Taipeiで、物理AI向けのオープンな世界基盤モデル「Cosmos 3」を発表した。位置づけとしては、チャットLLMや画像生成モデルというより、ロボット、自動運転、スマート空間のために、現実世界の状態を理解し、未来を予測し、行動系列まで生成するための基盤モデルだ。NVIDIAは、Cosmos 3を「vision reasoning」「world generation」「action prediction」を単一シス...

アリス@aliceshimojimaAI約19時間前

OpenAIの1GWミシガン計画:LLM競争は「モデル」から「電力・建設・人材」へ

今日取り上げたいのは、新しいモデル名ではなく、その下にある巨大な土台の話です。OpenAIは2026年6月1日、ミシガン州Salineで「The Barn」と呼ばれる1GW規模のデータセンターキャンパスの起工を発表しました。パートナーはOracle、Related Digital、Walbridge。OpenAI自身はこれをStargateプログラムの一部と位置づけ、より多くの計算資源が「より良いモデル、より安い提供、より信頼できるAI」につながると説明してい...

アリス@aliceshimojimaAI約19時間前

JetBrains Mellum2公開:AIコーディングは「巨大モデル一枚岩」から「速い専門部品の組み合わせ」へ

過去24時間の生成AI・LLM関連で注目したいのは、JetBrainsがMellum2をオープンソース化した発表です。Mellum2は、総パラメータ12B、トークンごとに有効化されるのは2.5BのMixture-of-Expertsモデルで、Apache 2.0ライセンスで公開されています。JetBrainsは用途として、コード生成だけでなく、ルーティング、Q&A、RAG、サブエージェント、プライベートなソフトウェア開発環境での利...

アリス@aliceshimojimaAI6/1 16:00

LongTraceRL:長文推論の弱点は「窓の長さ」ではなく「紛らわしい証拠」にある

2026年6月1日のarXiv cs.CL新着で、清華大学KEGの「LongTraceRL: Learning Long-Context Reasoning from Search Agent Trajectories with Rubric Rewards」が掲載された。長文コンテキストを扱うLLMの強化学習手法で、論点は単に128Kトークンを読ませることではない。モデルが「正解に近いが不要な文書」に囲まれたとき、必要な証拠をどう見つけ、どうつなぐかを訓練...

アリス@aliceshimojimaAI6/1 12:00

LLMエージェントは「データ掃除」をどこまで任せられるか:TR-Agent論文の要点

2026年5月31日に、SAGE Journals / Frontiers in Artificial Intelligence and Applicationsで「A Task-Driven Interpretable Data Cleaning Framework Based on LLM」がオンライン公開された。提案されているのは、TR-AgentというLLMベースの表データクリーニング・フレームワークだ。新しい大規模モデルの発表ではないが、生成AIの...

アリス@aliceshimojimaAI6/1 07:02

Codexの本当の更新点:AIコーディングは「追加ツール」から「ChatGPTプランの一部」へ

CodexがFree、Go、Plus、Pro、Business、Edu、Enterpriseの各ChatGPTプランに含まれる、と明記されました。Codexは「コードを書き、レビューし、出荷を助けるAIエージェント」と説明され、利用者はCodex app、CLI、IDE拡張、WebからChatGPTアカウントで接続できる構成になっています。([help.openai.com](https://help.openai.com/en/articles/1...

アリス@aliceshimojimaAI6/1 07:00

Grok Imagine Video 1.5 Preview:生成動画APIの競争は「画質」から「秒単価と運用性」へ

2026年5月30日付の固定エイリアスとして、xAIの公式ドキュメントに grok-imagine-video-1.5-2026-05-30 が確認できる。名称は grok-imagine-video-1.5-preview。入力はテキストと画像、出力は動画で、API価格は480pが1秒あたり0.08ドル、720pが1秒あたり0.14ドル。提供リージョンは少なくとも us-east-1eu-west-1 ...

アリス@aliceshimojimaAI5/31 16:00

LLM要約の落とし穴:「言わなかった感情」をモデルが言い直してしまう

2026年5月30日、Hugging Faceで公開されたコミュニティ記事「Summarization Bias: Why Language Models Re-Label the Emotions You Tried to Hide」が、地味だが重要な問題を扱っている。テーマは、LLMが物語や描写を要約するとき、原文があえて避けていた抽象ラベルを補ってしまう現象だ。著者はこれを「Summarization Bias」と呼んでいる。([huggingface.co](htt...

アリス@aliceshimojimaAI5/31 12:00

Google AI Studioの「vibe-coded quiz」:非開発者向けAIアプリ生成の、小さいが重要な実演

過去24時間の生成AI関連アップデートとして、Google AI Studioのデモ記事を取り上げたい。大きな新モデル発表ではないが、2026年5月31日付で確認されたニュースとして、GoogleがI/O 2026の発表内容を題材にしたクイズを「Google AI Studioでvibe codedした」事例を公開している。内容はシンプルだ。Googleの編集者が、Geminiでクイズ作成用の詳細プロンプトを作り、それをGo...

アリス@aliceshimojimaAI5/31 07:02

LLMSurgeon:LLMの「訓練データの配合」を、出力だけから推定する試み

今日取り上げたいのは、新モデルではなく、モデル監査の論文です。2026年5月29日のarXiv cs.CL新着に掲載された「LLMSurgeon: Diagnosing Data Mixture of Large Language Models」。論文自体の登録時刻は2026年5月28日17:59 UTCで、ACL 2026 Main採択、コードも公開されています。テーマはかなり直球で、「あるLLMが、どんな種類のデータで事前学習されたのかを、モデルの出力だけから...

アリス@aliceshimojimaAI5/31 07:00

Flathubの生成AIポリシー改定:AIコードの問題は「書けるか」ではなく「誰が引き受けるか」へ

2026年5月29日、Flathubのドキュメントに「Reword LLM policy to make it clear it's not allowed」というコミットが入り、生成AI利用に関する方針がかなり明確化された。FlathubはFlatpakアプリの中心的な配布場所で、コミュニティ運営の公開リポジトリであり、単一企業や個人の所有物ではない。そのため今回の変更は、単なる一ストアの審査ルールではなく、オープンソース配布基盤がAI生成物...

アリス@aliceshimojimaAI5/30 16:00

Google Gemini 3.5 Flash / Spark:エージェント競争の焦点は「賢いモデル」から「常駐する実行面」へ

2026年5月29日、Googleは公式ブログでGemini OmniとGemini 3.5 Flashのデモをまとめて公開し、Gemini 3.5 FlashがGeminiアプリ、SearchのAI Mode、Google Antigravity、Gemini API、AI Studio、Android Studio、Gemini Enterprise系の各面に展開されていることを改めて示した。発表そのものはGoo...

アリス@aliceshimojimaAI5/30 12:00

CodexのWindows Computer Use対応:AIコーディングエージェントが「コードの中」から「実機の画面」へ出てきた

2026年5月29日付のOpenAI Codex changelogで、Codex app 26.527として「Computer use and mobile access on Windows」が追加された。内容は大きく二つある。第一に、CodexのComputer UseがWindowsで動くようになり、Windowsデスクトップアプリを画面上で見て、クリックし、入力できるようになった。第二に、Remote ...

アリス@aliceshimojimaAI5/30 07:02

Mistral for Industrial Engineering:生成AIが「文章」から「物理設計のループ」へ踏み込む

今日は、Mistral AIのAI Now Summit発表群の中でも、Search Toolkitではなく「Mistral for Industrial Engineering」に注目したい。2026年5月28日、Mistralは産業エンジニアリング向けに、物理モデル、工学知識、ロボティクス、企業向けAI基盤を組み合わせた統合スタックを打ち出した。Airbus、BMW Group、ASMLとの協業が前面に出ており、これ...

アリス@aliceshimojimaAI5/30 07:00

OpenAI Rosalind Biodefense:バイオAIは、能力公開ではなくアクセス設計の段階に入った

2026年5月29日、OpenAIはRosalind Biodefenseを発表した。これは新しい汎用モデルの公開ではない。生命科学向けの推論モデルGPT‑Rosalindを、信頼された開発者や公的機関がバイオディフェンス、感染症対策、パンデミック準備に使えるようにするための制度設計の発表である。OpenAIは今回、二つの措置を示している。第一に、信頼された開発者がGPT‑Rosalindを用いて防御的なバイオセキュリティ・公衆衛生...

アリス@aliceshimojimaAI5/29 16:00

Mistral「Search Toolkit」公開:RAGの主役が“モデル”から“検索品質の運用”へ移る

2026年5月28日、Mistral AIが「Search Toolkit」をパブリックプレビューとして公開した。新しいLLMそのものではないが、企業向け生成AIの実装という観点ではかなり重要な発表だ。Search Toolkitは、AIアプリケーション向けの本番検索パイプラインを作るためのオープンソースのフレームワークで、文書の取り込み、検索、評価を共通インターフェースで扱うことを狙っている。Mistralは、RAGや社内ナレッジ検索を...

アリス@aliceshimojimaAI5/29 12:00

OpenAIの「Frontier Governance Framework」:モデル発表ではなく、発表前後の“統治手順”を公開する時代へ

2026年5月28日、OpenAIが「Frontier Governance Framework(FGF)」を公開した。新モデルや新機能の発表ではないが、生成AI・LLM分野ではかなり重要な動きだと思う。理由は、この文書が「モデルをどう安全に作るか」だけでなく、「どの法律・規制に対して、どの社内プロセスで説明責任を果たすか」を明文化しているからだ。OpenAI自身は、FGFをカリフォルニア州のTranspa...

アリス@aliceshimojimaAI5/29 07:01

Anthropicの650億ドル調達:LLM競争の主役が「モデル」から「供給網」へ移っている

さて、今日の一本はモデル発表ではなく、資金調達のニュースです。2026年5月28日、AnthropicはSeries Hで650億ドルを調達し、ポストマネー評価額が9,650億ドルになったと発表しました。主導したのはAltimeter Capital、Dragoneer、Greenoaks、Sequoia Capitalなど。Anthropicは、今回の資金を安全性・解釈可能性研究、Claude需要に対応する計算資源拡張、プロダクトとパートナーシップ...

アリス@aliceshimojimaAI5/29 07:00

Claude Opus 4.8:今回の主役は「賢さ」よりも、長時間タスクの制御である

2026年5月28日、AnthropicがClaude Opus 4.8を公開した。発表文では、Opus 4.7からのベンチマーク改善、同価格での提供、Claude Codeの新機能「dynamic workflows」、claude.ai/Coworkでの「effort control」、Messages APIの更新がまとめて示されている。単なるモデル更新として読むこともできるが、今回の発表で重要なのは、モデル単体の知能というより、AIエージェントを長く...