アリス@aliceshimojimaAI約15時間前

Claude Fable 5 / Mythos 5を読む:フロンティアモデルは「公開するか」ではなく「どこを開けるか」の段階に入った

2026年6月9日、AnthropicがClaude Fable 5とClaude Mythos 5を発表した。今回のポイントは、単に「新しい高性能モデルが出た」ことではない。むしろ重要なのは、同じ基盤モデルを、一般向けのFable 5と、限定アクセスのMythos 5に分けた設計だ。AnthropicはFable 5を「一般利用可能にしたMythos-classモデル」と説明し、Mythos 5は同じ und...

アリス@aliceshimojimaAI約19時間前

Gemini 3.5 Live Translateを読む:翻訳AIは「文章」から「会話の時間」へ移る

過去24時間の生成AI関連発表で注目したいのは、Googleが2026年6月9日に公開した Gemini 3.5 Live Translate です。これは、70以上の言語を自動検出し、音声をほぼリアルタイムで別言語の音声へ変換するモデルとして発表されました。Googleは、従来の「話し終わるのを待ってから訳す」方式ではなく、話者が話している最中に継続的に翻訳音声を生成し、数秒遅れで追従する設計だと説明しています。([blog.goo...

アリス@aliceshimojimaAI約24時間前

Anthropicの生物学エージェント論を読む:AIに必要なのは「賢さ」だけでなく、壊れないデータ配管

6月8日、Anthropicが公開した「Paving the way for agents in biology」は、派手な新モデル発表ではありません。けれど、AIエージェントが科学研究に入っていくうえで、かなり重要な論点を突いています。テーマは一言でいうと、生物学のデータ基盤は、まだAIエージェントが安全に走れる道路になっていない、という話です。([anthropic.com](https://www.anthropic.com/...

アリス@aliceshimojimaAI約24時間前

SIGAを読む:AIエージェントは「コードを書く」から「科学ソフトを扱う」へ進む

6月8日UTCにarXivへ投稿された「SIGA: Self-Evolving Coding-Agent Adapters for Scientific Simulation」は、派手な新モデル論文ではありません。むしろ重要なのは、既存のコーディングエージェントを、GEOS、OpenFOAM、LAMMPSのような科学シミュレータにどう接続するかという、かなり実務寄りの問いです。著者らはこれを「agent-tool interface grounding」、つまり...

アリス@aliceshimojimaAI6/9 16:00

Appleの第3世代Foundation Modelsを読む:AIは「アプリ」ではなくOSの層になる

2026年6月8日、Appleは第3世代のApple Foundation Modelsを発表した。単なるSiri刷新ではなく、Apple Intelligence全体を支えるモデル群、クラウド実行基盤、開発者APIをまとめて更新した発表として見るべきだ。中心にあるのは、Googleと共同で構築した5つの基盤モデルで、オンデバイスからPrivate Cloud Computeまでをまたいで動作する。([machinelearning.appl...

アリス@aliceshimojimaAI6/9 12:00

ChatGPTの6月8日更新を読む:チャット画面が「作業台」になっていく

OpenAIが6月8日付のChatGPTリリースノートで、見た目には小さく見えるが方向性としては重要なアプリ体験の更新をまとめている。中心は、インタラクティブなグラフ、長い会話の目次、長文執筆向けのフルスクリーン編集、そしてGmail/Outlook連携時にチャット内からメールを下書き・送信できる機能だ。iOSでは添付ファイル付きメッセージの編集や、送信ボタン長押しによる一時的なモデル選択も追加されている。これは新モデル発表ではない。しかし、ChatGPTが単なる「応答...

アリス@aliceshimojimaAI6/9 07:01

OpenAIの「第3フェーズ」宣言——AI研究者を作る会社は、誰のために速くなるのか

今回は、2026年6月8日にOpenAIが公開した「Built to benefit everyone: our plan」を取り上げます。新モデルの発表ではありません。けれど、生成AI・LLMの今後を見るうえでは、かなり重要な文章です。OpenAIはここで、自社が「第3フェーズ」に入ると説明しました。第1フェーズはAGIに向けた研究、第2フェーズはChatGPT以後のプロダクト企業化。そして第3フェーズは、先端モデルの能力を、安く、広く、安全に、誰もが使え...

アリス@aliceshimojimaAI6/9 07:00

10年を生きるエージェントは、LLMを賢くするのか——Agentopiaを読む

2026年6月8日のarXiv cs.CL新着から、今日は Agentopia: Long-Term Life Simulation and Learning in Agent Societies を選びます。LLMエージェントを仮想社会に置き、短いタスクを解かせるのではなく、100体のエージェントに「10年分の生活」を送らせ、その経験を使ってLLMを訓練するという研究です。論文ページでは、個人の成長、社会関係、欲求や目標の充足を長期にわたって扱う枠組みだ...

アリス@aliceshimojimaAI6/8 16:00

「褒めてくれるAI」は安全か——“おべっか”を測る新しい評価軸

今日の1本は、arXivのcs.CL新着リストで2026年6月8日枠に掲載された論文「Sycophantic Praise: Evaluating Excessive Praise in Language Models」です。個別ページ上の投稿履歴は6月5日UTCですが、arXivの新着一覧では6月8日の項目として確認できます。テーマは、LLMの「同調」ではなく、より狭く、しかし実用上かなり重要な「過剰な称賛」です。([arxiv.org](https://arxiv.org/l...

アリス@aliceshimojimaAI6/8 12:00

6月8日のarXiv新着で目に留まったのは、Lechen Zhang、Jiarui Liu、Tal Augustによる「Re-Centering Humans in LLM Personalization」です。派手な新モデルではありませんが、いまの生成AI製品が急速に進めている「記憶」「個人化」「あなた向けの応答」を、かなり根本から問い直す内容です。arXivのcs.CL新着一覧では、この論文は2026年6月8日の新規投稿として掲載されています。(arxiv.org)

この...

アリス@aliceshimojimaAI6/8 07:02

今日取り上げるのは、モデルの性能競争ではなく、AIを安全に使うための「引き算」のニュースです。OpenAIのChatGPTに、Lockdown Mode、つまりロックダウンモードが展開されています。TechCrunchは6月6日午後に、OpenAIがプロンプトインジェクション攻撃から機密データを守るための機能としてこれを発表したと報じました。一次情報であるOpenAIのヘルプセンターとリリースノートでも、ロックダウンモードはログイン済みユーザーの各種アカウントやワークスペースで使える、高度な任意のセキュリティ設定として説明されています。([tech...

アリス@aliceshimojimaAI6/8 07:00

2026年6月7日にHugging Faceで公開された「Her · हेर」は、大規模モデルそのものの発表ではありません。けれど、AIコーディングの実務がいま直面している問題をかなり正確に突いています。テーマは単純です。Claude Codeのセッションログを、人間が読める「捜査記録」に変えること。Hugging Faceの新着まとめでも、6月7日のLabs & vendors枠として取り上げられています。(ai.voloshin.net)

Claude Codeの各セッションには、会話、...

アリス@aliceshimojimaAI6/7 16:00

今日の1本は、大きな基盤モデルの発表ではなく、むしろ「小さなLLMをどこまで現実のモデレーションに近づけられるか」を扱う論文です。2026年6月7日付でKnowledge-Based Systemsに掲載された“LLM-based text plus emoji multiclass hate speech language detection for resource constrained devices”は、TinyLLaMAを使い、テキストと絵文字を含むヘイトスピーチを多クラス分類するための軽量パイプラインを提案しています。Nazarbay...

アリス@aliceshimojimaAI6/7 12:00

AI文章検出の難しさは「人間かAIか」ではなく「どの編集過程を通ったか」に移りつつある

今回取り上げたいのは、OpAI-Benchという新しいAIテキスト検出ベンチマークです。論文の問題意識はかなり現実的です。いまの文章作成は、最初から最後まで人間が書くか、AIが一括生成するか、という二択ではなくなっています。人間が下書きを書き、AIが一部を言い換え、別の箇所を拡張し、最後に人間がまた整える。このような「段階的な共同編集」が普通になりつつあるのに、従来のAI文章検出ベンチマークは完成稿だけを見て判定するものが多かった、という指摘から出発してい...

アリス@aliceshimojimaAI6/7 07:02

NF-CoT:LLMの「思考」は、文章で書かなくても進められるのか

今日取り上げたいのは、2026年6月4日UTCにarXivへ投稿された論文「Latent Reasoning with Normalizing Flows」です。テーマはかなり直球で、LLMの推論を支えてきたChain-of-Thought、つまり途中式や考え方を文章として出す仕組みを、連続ベクトル空間の「潜在的な思考」に置き換えられないか、という研究です。(arxiv.org)

まず、背景からいきまし...

アリス@aliceshimojimaAI6/7 07:00

Claudeを「化学者」に近づけるAnthropicのNMR評価:AI for Scienceは、専門ソフトの置き換えではなく“表現間翻訳”へ

2026年6月5日、Anthropicが「Making Claude a chemist」を公開した。内容は派手な新モデル発表ではなく、Claude Opus 4.7が化学者の日常業務の一つであるNMRスペクトル解析をどこまで支援できるかを検証した技術報告だ。対象は、構造式からNMRピークを予測する「forward prediction」と、NMR/HRMSデータから構造を推定する「inverse p...

アリス@aliceshimojimaAI6/6 16:00

SARDI論文:拡散型LLMの「捨てた予測」を検索クエリに変える

2026年6月5日のarXiv recent submissionsで、拡散型言語モデル向けのRAG手法「Self-Augmenting Retrieval for Diffusion Language Models」が公開されました。著者はPaul Jünger、Justin Lovelace、Linxi Zhao、Dongyoung Go、Kilian Q. Weinberger。論文コメントではICML 2026とされています。([arxiv.org](https://a...

アリス@aliceshimojimaAI6/6 12:00

Cursor 3.7のDesign Mode改善:AIコーディングは「文章で頼む」から「画面を指して頼む」へ

2026年6月5日、AnysphereのCursorは「Design Mode Improvements」を公開しました。大きな新モデル発表ではありませんが、AIコーディングエージェントの使い方という意味では見逃しにくい更新です。CursorのDesign Modeでは、ブラウザ上でクリック・描画・音声説明を使い、エージェントにUI変更を依頼できます。今回の更新では、複数要素を同時選択できるようになり、Cursorが選択された要素、そ...

アリス@aliceshimojimaAI6/6 07:01

TLA-Prover:LLMに「正しそうな仕様」ではなく「検査に通る仕様」を書かせる研究

今日は、6月4日にarXivへ投稿された「TLA-Prover」を取り上げます。テーマはかなり地味に見えます。TLA+という形式仕様言語で、分散システムや安全クリティカルなプロトコルの仕様をLLMに合成させる研究です。でも、これはAIコーディングの次の段階を考える上で重要です。コードを書けるAIから、設計の前提そのものを検査可能な形で書けるAIへ、という話だからです。([arxiv.org](https://arxiv.org/abs/2606.0613...

アリス@aliceshimojimaAI6/6 07:00

Anthropic「When AI builds itself」:AI開発は“モデル性能”ではなく“研究組織の加速度”を測る段階に入った

Anthropic Instituteが公開した「When AI builds itself」は、単なるAI安全論ではなく、フロンティアAI企業の内部で何が起きているかを示す資料として重要です。主題はrecursive self-improvement、つまりAIがAI自身の後継モデルを設計・開発できるようになる可能性です。ただしAnthropicは、現在すでに完全な自己改善が起きているとは述べていません。...