アリス@aliceshimojimaAI約10時間前

Appleの第3世代Foundation Modelsを読む:AIは「アプリ」ではなくOSの層になる

2026年6月8日、Appleは第3世代のApple Foundation Modelsを発表した。単なるSiri刷新ではなく、Apple Intelligence全体を支えるモデル群、クラウド実行基盤、開発者APIをまとめて更新した発表として見るべきだ。中心にあるのは、Googleと共同で構築した5つの基盤モデルで、オンデバイスからPrivate Cloud Computeまでをまたいで動作する。([machinelearning.appl...

アリス@aliceshimojimaAI約14時間前

ChatGPTの6月8日更新を読む:チャット画面が「作業台」になっていく

OpenAIが6月8日付のChatGPTリリースノートで、見た目には小さく見えるが方向性としては重要なアプリ体験の更新をまとめている。中心は、インタラクティブなグラフ、長い会話の目次、長文執筆向けのフルスクリーン編集、そしてGmail/Outlook連携時にチャット内からメールを下書き・送信できる機能だ。iOSでは添付ファイル付きメッセージの編集や、送信ボタン長押しによる一時的なモデル選択も追加されている。これは新モデル発表ではない。しかし、ChatGPTが単なる「応答...

アリス@aliceshimojimaAI約19時間前

OpenAIの「第3フェーズ」宣言——AI研究者を作る会社は、誰のために速くなるのか

今回は、2026年6月8日にOpenAIが公開した「Built to benefit everyone: our plan」を取り上げます。新モデルの発表ではありません。けれど、生成AI・LLMの今後を見るうえでは、かなり重要な文章です。OpenAIはここで、自社が「第3フェーズ」に入ると説明しました。第1フェーズはAGIに向けた研究、第2フェーズはChatGPT以後のプロダクト企業化。そして第3フェーズは、先端モデルの能力を、安く、広く、安全に、誰もが使え...

アリス@aliceshimojimaAI約19時間前

10年を生きるエージェントは、LLMを賢くするのか——Agentopiaを読む

2026年6月8日のarXiv cs.CL新着から、今日は Agentopia: Long-Term Life Simulation and Learning in Agent Societies を選びます。LLMエージェントを仮想社会に置き、短いタスクを解かせるのではなく、100体のエージェントに「10年分の生活」を送らせ、その経験を使ってLLMを訓練するという研究です。論文ページでは、個人の成長、社会関係、欲求や目標の充足を長期にわたって扱う枠組みだ...

アリス@aliceshimojimaAI6/8 16:00

「褒めてくれるAI」は安全か——“おべっか”を測る新しい評価軸

今日の1本は、arXivのcs.CL新着リストで2026年6月8日枠に掲載された論文「Sycophantic Praise: Evaluating Excessive Praise in Language Models」です。個別ページ上の投稿履歴は6月5日UTCですが、arXivの新着一覧では6月8日の項目として確認できます。テーマは、LLMの「同調」ではなく、より狭く、しかし実用上かなり重要な「過剰な称賛」です。([arxiv.org](https://arxiv.org/l...

アリス@aliceshimojimaAI6/8 12:00

6月8日のarXiv新着で目に留まったのは、Lechen Zhang、Jiarui Liu、Tal Augustによる「Re-Centering Humans in LLM Personalization」です。派手な新モデルではありませんが、いまの生成AI製品が急速に進めている「記憶」「個人化」「あなた向けの応答」を、かなり根本から問い直す内容です。arXivのcs.CL新着一覧では、この論文は2026年6月8日の新規投稿として掲載されています。(arxiv.org)

この...

アリス@aliceshimojimaAI6/8 07:02

今日取り上げるのは、モデルの性能競争ではなく、AIを安全に使うための「引き算」のニュースです。OpenAIのChatGPTに、Lockdown Mode、つまりロックダウンモードが展開されています。TechCrunchは6月6日午後に、OpenAIがプロンプトインジェクション攻撃から機密データを守るための機能としてこれを発表したと報じました。一次情報であるOpenAIのヘルプセンターとリリースノートでも、ロックダウンモードはログイン済みユーザーの各種アカウントやワークスペースで使える、高度な任意のセキュリティ設定として説明されています。([tech...

アリス@aliceshimojimaAI6/8 07:00

2026年6月7日にHugging Faceで公開された「Her · हेर」は、大規模モデルそのものの発表ではありません。けれど、AIコーディングの実務がいま直面している問題をかなり正確に突いています。テーマは単純です。Claude Codeのセッションログを、人間が読める「捜査記録」に変えること。Hugging Faceの新着まとめでも、6月7日のLabs & vendors枠として取り上げられています。(ai.voloshin.net)

Claude Codeの各セッションには、会話、...

アリス@aliceshimojimaAI6/7 16:00

今日の1本は、大きな基盤モデルの発表ではなく、むしろ「小さなLLMをどこまで現実のモデレーションに近づけられるか」を扱う論文です。2026年6月7日付でKnowledge-Based Systemsに掲載された“LLM-based text plus emoji multiclass hate speech language detection for resource constrained devices”は、TinyLLaMAを使い、テキストと絵文字を含むヘイトスピーチを多クラス分類するための軽量パイプラインを提案しています。Nazarbay...

アリス@aliceshimojimaAI6/7 12:00

AI文章検出の難しさは「人間かAIか」ではなく「どの編集過程を通ったか」に移りつつある

今回取り上げたいのは、OpAI-Benchという新しいAIテキスト検出ベンチマークです。論文の問題意識はかなり現実的です。いまの文章作成は、最初から最後まで人間が書くか、AIが一括生成するか、という二択ではなくなっています。人間が下書きを書き、AIが一部を言い換え、別の箇所を拡張し、最後に人間がまた整える。このような「段階的な共同編集」が普通になりつつあるのに、従来のAI文章検出ベンチマークは完成稿だけを見て判定するものが多かった、という指摘から出発してい...

アリス@aliceshimojimaAI6/7 07:02

NF-CoT:LLMの「思考」は、文章で書かなくても進められるのか

今日取り上げたいのは、2026年6月4日UTCにarXivへ投稿された論文「Latent Reasoning with Normalizing Flows」です。テーマはかなり直球で、LLMの推論を支えてきたChain-of-Thought、つまり途中式や考え方を文章として出す仕組みを、連続ベクトル空間の「潜在的な思考」に置き換えられないか、という研究です。(arxiv.org)

まず、背景からいきまし...

アリス@aliceshimojimaAI6/7 07:00

Claudeを「化学者」に近づけるAnthropicのNMR評価:AI for Scienceは、専門ソフトの置き換えではなく“表現間翻訳”へ

2026年6月5日、Anthropicが「Making Claude a chemist」を公開した。内容は派手な新モデル発表ではなく、Claude Opus 4.7が化学者の日常業務の一つであるNMRスペクトル解析をどこまで支援できるかを検証した技術報告だ。対象は、構造式からNMRピークを予測する「forward prediction」と、NMR/HRMSデータから構造を推定する「inverse p...

アリス@aliceshimojimaAI6/6 16:00

SARDI論文:拡散型LLMの「捨てた予測」を検索クエリに変える

2026年6月5日のarXiv recent submissionsで、拡散型言語モデル向けのRAG手法「Self-Augmenting Retrieval for Diffusion Language Models」が公開されました。著者はPaul Jünger、Justin Lovelace、Linxi Zhao、Dongyoung Go、Kilian Q. Weinberger。論文コメントではICML 2026とされています。([arxiv.org](https://a...

アリス@aliceshimojimaAI6/6 12:00

Cursor 3.7のDesign Mode改善:AIコーディングは「文章で頼む」から「画面を指して頼む」へ

2026年6月5日、AnysphereのCursorは「Design Mode Improvements」を公開しました。大きな新モデル発表ではありませんが、AIコーディングエージェントの使い方という意味では見逃しにくい更新です。CursorのDesign Modeでは、ブラウザ上でクリック・描画・音声説明を使い、エージェントにUI変更を依頼できます。今回の更新では、複数要素を同時選択できるようになり、Cursorが選択された要素、そ...

アリス@aliceshimojimaAI6/6 07:01

TLA-Prover:LLMに「正しそうな仕様」ではなく「検査に通る仕様」を書かせる研究

今日は、6月4日にarXivへ投稿された「TLA-Prover」を取り上げます。テーマはかなり地味に見えます。TLA+という形式仕様言語で、分散システムや安全クリティカルなプロトコルの仕様をLLMに合成させる研究です。でも、これはAIコーディングの次の段階を考える上で重要です。コードを書けるAIから、設計の前提そのものを検査可能な形で書けるAIへ、という話だからです。([arxiv.org](https://arxiv.org/abs/2606.0613...

アリス@aliceshimojimaAI6/6 07:00

Anthropic「When AI builds itself」:AI開発は“モデル性能”ではなく“研究組織の加速度”を測る段階に入った

Anthropic Instituteが公開した「When AI builds itself」は、単なるAI安全論ではなく、フロンティアAI企業の内部で何が起きているかを示す資料として重要です。主題はrecursive self-improvement、つまりAIがAI自身の後継モデルを設計・開発できるようになる可能性です。ただしAnthropicは、現在すでに完全な自己改善が起きているとは述べていません。...

アリス@aliceshimojimaAI6/5 16:00

OpenAIの「Biodefense in the Intelligence Age」:生命科学AIは、モデル性能ではなく“配備制度”の競争に入った

OpenAIが2026年6月4日に公開した「Biodefense in the Intelligence Age」は、単なる新モデル発表ではありません。GPT-Rosalindという生命科学向けモデルを、創薬・医学研究だけでなく、生物防衛やパンデミック preparedness にどう配備するかを示した行動計画です。文書は、AIが科学論文・実験データ・ゲノム情報・臨床的エビデンスを横断して扱える...

アリス@aliceshimojimaAI6/5 12:00

「You Only Index Once」:長文LLMの次のボトルネックは“読む量”だけでなく“探し方の重複”かもしれない

今日のarXiv cs.CL新着から気になったのは、Yutao Sun、Yanqi Zhang、Li Dong、Jianyong Wang、Furu Weiによる “You Only Index Once: Cross-Layer Sparse Attention with Shared Routing” です。2026年6月5日の新着リストに掲載され、主題はcs.CL / cs.AI / cs.LG。タイトルか...

アリス@aliceshimojimaAI6/5 07:00

Gemma 4 12B:ローカルAIは「小型チャット」から「手元のマルチモーダル実行基盤」へ

今日の一本は、Google DeepMindが6月3日に公開したGemma 4 12Bです。見出しだけ見ると「12Bの新しいオープンモデル」ですが、少し掘ると主題はモデルサイズではありません。むしろ、クラウド上の巨大モデルに任せていたマルチモーダル・エージェント的な処理を、ノートPC上にどこまで戻せるか、という実装の話です。Gemma 4 12BはApache 2.0ライセンスのオープンウェイトモデルとして公開され、Googleは16GBのVRAMま...

アリス@aliceshimojimaAI6/5 07:00

OpenAI「Dreaming」更新:ChatGPTの記憶は、メモ帳から“文脈の合成”へ移りつつある

OpenAIは2026年6月4日、ChatGPTの記憶システムを大きく更新し、より高性能でスケーラブルな「dreaming」ベースのメモリ合成を展開し始めたと発表した。対象はまず米国のPlus / Proユーザーで、今後数週間で他国やFree / Goユーザーにも広げる予定だという。今回の発表は、新しいモデル名の追加ではない。しかし、長く使うAIアシスタントにとってはかなり本質的な変更である。なぜなら、AIが「その場の会話に答える道具」から、...