Feb 25, 2026

2026年2月25日

この日のAIニュースレポート

DAILY NEWS

AI最新ニュース

AI業界最新動向：2026年2月25日

エグゼクティブサマリー

本日最大の注目は、Anthropicが同時に複数の戦線を展開したことだ。エンタープライズ向けAIエージェント「Cowork」の大規模アップデートと「Claude Code Security」の発表によって攻勢をかける一方、米国防総省との「any lawful use」条項をめぐる交渉は危機的な局面を迎え、AIの倫理的境界線をめぐる議論が業界全体を揺るがしている。インフラ面ではMetaとAMDが最大1,000億ドル規模の超大型チップ調達契約を締結し、NVIDIAへの依存脱却を鮮明にした。また、GoogleによるProducerAI買収とLyria 3の公開はAI音楽生成の商業化を加速させており、創造産業へのAI浸透がいよいよ本格化している。エンタープライズでのAI普及は「まだ始まったばかり」との声もあるなか、エージェント基盤・観測ツール・データ供給の整備競争が水面下で着実に進んでいる。

Anthropicの攻防：エンタープライズ拡大と米国防総省との対立

2月25日はAnthropicにとって、最も多面的な一日となった。事業拡大と倫理的境界線維持の両立という困難な二項対立が、業界に問いを投げかけている。

AnthropicはAIエージェントプラットフォーム「Claude Cowork」を大幅に強化し、Google Workspace・DocuSign・WordPressとの連携に加え、HR・設計・エンジニアリング・金融・財務領域向けのプリビルドプラグインを新たに5つ公開した。従来SaaSが担ってきた業務領域にAIエージェントが直接踏み込む姿勢を鮮明にしており、既存SaaS製品への脅威として注目されている。
- Anthropicの「Cowork」が財務系プラグインを追加（日本語） — ITmedia AI+
- Anthropic launches new push for enterprise agents with plug-ins for finance, engineering, and design — TechCrunch AI
- Anthropic’s Claude Cowork is plugging AI into more boring enterprise stuff — The Verge AI
ClaudeがエージェントとしてExcel・PowerPoint間を自律的に行き来できるようになった。データ分析を実行してそのままプレゼン資料を生成するといったクロスアプリ操作が可能になり、コーディング以外のオフィスワーカー向け用途として実用性が大幅に向上した。
- Claude can now jump between Excel and PowerPoint on its own — The Decoder
「Claude Code Security」が発表され、コード中の脆弱性を自動検出するだけでなく修正案まで提示する機能が実装された。この発表を受けて米国市場ではセキュリティ関連銘柄が一時下落し、市場がAnthropicの攻勢を脅威と認識していることが浮き彫りになった。
- Anthropicが「Claude Code Security」発表　脆弱性発見・修正はもうお任せ？ — ITmedia AI+
Claude Codeは開発者向けツールとして出発したが、この1年でエンジニア以外の多様な職種のユーザーが端末を開いて利用するまでに裾野が広がった。Anthropicの戦略がニッチツールからプラットフォームへ転換したことを象徴するエピソードだ。
- How Claude Code Claude Codes — The Verge AI
一方、米国防総省はAnthropicに対し「any lawful use（いかなる合法的利用にも応じること）」という条件をAI利用規約に盛り込むよう要求、金曜日までに応じなければ制裁を科すと通告した。OpenAIやxAIが同条件を受け入れる中、Anthropicは拒否を続けており、時価総額380億ドルのスタートアップが政府との関係で孤立するリスクに直面している。投資家の信頼感への影響も注視される。
- Anthropic won’t budge as Pentagon escalates AI dispute — TechCrunch AI
- Inside Anthropic’s existential negotiations with the Pentagon — The Verge AI

Meta×AMDの超大型インフラ契約：NVIDIAへの依存脱却が加速

AIインフラ調達の地政学が塗り変わりつつある。MetaがOpenAIに続いてAMDと戦略提携を結んだことで、AMD株の戦略的価値は新次元に達した。

MetaとAMDは最大6ギガワット相当のGPUを対象とした多年契約を締結した。規模は最大1,000億ドルと見られており、単一のチップベンダーとの契約としては過去最大級だ。焦点はAMD製チップを用いた推論（inference）処理の効率化に置かれている。
- Meta、AMDと戦略提携　最大6ギガワット相当のGPU導入とワラント契約 — ITmedia AI+
- Meta strikes up to $100B AMD chip deal as it chases ‘personal superintelligence’ — TechCrunch AI
- AMD basically copy-pasted its OpenAI deal for Meta, six gigawatts and ten percent equity included — The Decoder
注目すべきは資本関係だ。Metaは導入実績に応じて最大1億6,000万株のAMD普通株を取得できるワラント割り当てに合意しており、これはAMDの発行済み株式の約10%に相当する。The Decoderが報じるように、この条件はAMDがOpenAIと締結したディールをほぼそのままコピーした形であり、AMDが同一の戦略的パターンをビッグテックに展開していることを示している。
- AMD basically copy-pasted its OpenAI deal for Meta, six gigawatts and ten percent equity included — The Decoder
- Meta、AMDと戦略提携　最大6ギガワット相当のGPU導入とワラント契約 — ITmedia AI+
MetaはNVIDIAとも大規模調達契約を結んでいるが、今回のAMDとの提携は「パーソナル超知性（Personal Superintelligence）」の実現を目指す中長期戦略の一環として、調達先の多様化と安定化を明確に意図したものだ。特定ベンダーへの依存が持つ地政学的リスクへの警戒が、メガ企業の調達戦略を変えつつある。
- Meta strikes up to $100B AMD chip deal as it chases ‘personal superintelligence’ — TechCrunch AI

Google、AI音楽生成に本格参入：ProducerAI買収とLyria 3

AIと音楽産業の交差点が急速に拡大している。Googleは買収と新モデル公開を同時に行うことで、SunoやUdioが切り拓いた市場で主導権を握りにきた。

GoogleはチャットベースのAI作曲プラットフォームProducerAI（Producer.ai）のGoogle Labs参加を発表した。ProducerAIはユーザーがAIエージェントと対話しながら楽曲を生成・ワークショップできるサービスで、The ChainsmokerやWyclef Jeanといったアーティストが利用実績を持つ。
- GoogleがSunoのライバルサービスProducerAIを買収（CloseBox） — テクノエッジ
- Music generator ProducerAI joins Google Labs — TechCrunch AI
- This Chainsmokers-approved AI music producer is joining Google — The Verge AI
ProducerAIはGoogle Labsの傘下でGoogleの新しい音楽生成AIモデルLyria 3のプレビュー版によって動作する。Lyria 3との統合によって、単なる音源生成にとどまらず、AIがプロデューサーとして楽曲制作全体に関与する「エージェント型作曲」の実用化が一気に進む見通しだ。
- This Chainsmokers-approved AI music producer is joining Google — The Verge AI
- GoogleがSunoのライバルサービスProducerAIを買収（CloseBox） — テクノエッジ
Wyclef Jeanは新曲「Back in Abu Dhabi」でGoogleのAI音楽ツールを実際に使用しており、著名アーティストへの浸透が始まっている。AI音楽生成がホビー用途から商業的な楽曲制作へと移行するペースが、業界の想定より早まる可能性がある。
- Music generator ProducerAI joins Google Labs — TechCrunch AI

AIエージェントの実用化競争：エコシステム整備が水面下で加速

「AIエージェント」というキーワードが飛び交う中、実際のエンタープライズ普及はまだ緒に就いたばかりだという冷静な見方が示されつつある。同時に、エコシステムを支えるインフラ層の整備は着実に進んでいる。

OpenAIのCOOは「AIがエンタープライズの業務プロセスに本当に浸透した例をまだほとんど見ていない」と発言した。「SaaSは死んだ」「エージェントが業務を乗っ取る」という誇張した予測が株価を動かすことはあっても、現実の普及速度は依然として緩やかだという実態が改めて浮き彫りになった。
- OpenAI COO says ‘we have not yet really seen AI penetrate enterprise business processes’ — TechCrunch AI
Googleは企業向けAIアシスタント「Opal」に自動ワークフロー作成機能を追加した。テキストプロンプトでミニアプリを生成し、タスクの計画・実行まで一気通貫で行える新エージェントが導入されており、ノーコードのAIエージェント構築という方向性を打ち出している。
- Google adds a way to create automated workflows to Opal — TechCrunch AI
オブザーバビリティ大手のNew RelicがAIエージェント専用プラットフォームとOpenTelemetryツール群を発表した。AIエージェントの動作監視・管理・OTelデータストリームの統合を企業に提供するものであり、エージェントが業務に組み込まれていくにつれて「エージェントを監視する」レイヤーの需要が急速に高まることを示している。
- New Relic launches new AI agent platform and OpenTelemetry tools — TechCrunch AI
スタートアップNimbleがAIエージェントへのリアルタイムウェブデータ供給を目的に4,700万ドルを調達した。AIエージェントがウェブを検索・検証・クレンジングして構造化テーブルに変換し、データベースとして照会できる形にまで整えるという仕組みで、エージェントが「クリーンなデータ」を持てるかどうかが精度を左右するという問題意識が背景にある。
- Nimble raises $47M to give AI agents access to real-time web data — TechCrunch AI

新興モデルの技術的飛躍：拡散型言語モデルとAI動画生成

アーキテクチャの多様化が加速しており、トランスフォーマー一強時代に終止符が打たれる可能性が現実味を帯びてきた。

Inceptionが「Mercury 2」を発表した。言語モデルとして世界初の「拡散ベース推論モデル」であり、従来の逐語的なトークン生成（autoregressive）とは異なり、文章全体を並列に精製するアプローチを採用している。これにより処理速度は従来型言語モデルの5倍以上とされており、コスト・レイテンシが要件となる実用アプリケーションへの適用可能性が高い。
- Inception launches Mercury 2, the first diffusion-based language reasoning model — The Decoder
ByteDanceが動画生成モデルSeedance 2.0を公開し、アイルランドの映画監督Ruairi Robinsonが制作したトム・クルーズのデジタルダブルを使ったクリップが業界関係者の間で大きな話題を呼んだ。他社モデルを明確に上回るリアリティを見せた一方で、The Vergeはこれを「依然としてslop（低品質コンテンツ）」と評しており、商業映像制作への応用にはまだギャップがあるとの認識も残る。
- Seedance 2.0 might be gen AI video’s next big hope, but it’s still slop — The Verge AI

AI×人間の未来：協働哲学と特化型ヘルスケアモデル

AIが高度な能力を持つようになった今、人間との関係をどう設計するかという問いが研究・製品の両面で浮上している。

Google DeepMindの新論文は、AIエージェントが自分で容易に処理できるタスクをあえて人間に割り当てることを提唱した。人間がスキルを忘れないようにするための「ブッシーワーク（単純作業）の意図的な割り振り」という発想であり、AIの自律性と人間の能力維持のトレードオフという哲学的命題に実践的な回答を試みている。
- Deepmind suggests AI should occasionally assign humans busywork so we do not forget how to do our jobs — The Decoder
スマートリング企業Ouraが女性の健康に特化した独自AIモデルを発表した。月経周期から更年期まで生殖健康の全スペクトルをカバーする質問に対応するモデルであり、汎用LLMではカバーしきれない医療的専門性と個人化を組み合わせた特化型モデルの有効性を示すケースだ。
- Oura launches a proprietary AI model focused on women’s health — TechCrunch AI

RESEARCH

AI研究・論文

AI研究・論文デイリーレポート（2026年2月25日）

本日のAI業界は、「大きければ良い」という従来の通念が複数の文脈で問い直された一日だった。Alibabaが中型モデルの実用性を証明し、Google DeepMindが人間の直感に頼らないアルゴリズム設計を実現し、arXivからは物理・医療・言語処理の各領域で精密さを追求した研究が相次いだ。一方、Anthropicがモデル蒸留による知的財産窃取の実態を公表したことで、AIセキュリティの脅威が改めて業界の焦点となった。企業現場ではAIエージェントの本格導入が進むが、ガバナンス整備と実ROIの立証という課題が依然として大きな壁として立ちはだかっている。

小型・高効率モデルへの戦略的転換

巨大パラメータ数を競う時代から、効率的な中型モデルを実用環境に投入する時代への移行が鮮明になっている。

AlibabaのQwen 3.5 Medium Model Seriesは、トリリオン規模のパラメータ数追求を意図的に回避し、アーキテクチャ最適化によって生産環境での推論コストとインフラ負荷を削減することを優先した設計となっている。「小さいほど賢い」というメッセージは、クラウドコスト削減を求める企業にとって強力な訴求力を持つ。
- Alibaba Qwen Team Releases Qwen 3.5 Medium Model Series — MarkTechPost
RAGとコンテキストスタッフィングの比較研究も、「大きなコンテキストウィンドウに全データを詰め込む」戦略の限界を指摘している。数十万〜数百万トークン規模のウィンドウが利用可能になった今でも、選択的な検索（RAG）は精度・コスト・信頼性の面で優位性を保つとされる。
- RAG vs. Context Stuffing — MarkTechPost
NERタスクにおいても同様の効率化が研究されている。GLiNER-bi-Encoderは従来のジョイントエンコーディングアーキテクチャが持つラベル数に対する二乗オーダーの計算量複雑性を解消し、ラベルエンコーダとコンテキストエンコーダを分離することで百万規模のラベルに対応可能な産業グレードNERを実現した。
- The Million-Label NER: Breaking Scale Barriers with GLiNER bi-encoder — arXiv AI+ML+CL

産業規模のAIモデル窃取：知的財産保護の危機

AIモデルそのものが競争優位の源泉となる中、モデル蒸留を用いた知的財産窃取が「産業的規模」で行われていることが明らかになった。

Anthropicは、海外の競合ラボが3件の大規模蒸留キャンペーンを実施したと公表した。攻撃者は約2万4,000件の欺瞞的アカウントを用い、1,600万件以上の会話を生成。Claudeの推論能力・回答パターン・固有ロジックを自社モデルの訓練データとして抽出することを目的としていた。
- Anthropic: Claude faces ‘industrial-scale’ AI model distillation — AI News
このケースは「モデル蒸留」という技術手法が、本来の知識圧縮という用途を超え、競合他社の独自能力を無断で複製する攻撃ベクターとして機能しうることを示している。APIへのアクセスを持つ者であれば誰でも実行可能であり、利用規約による制限だけでは防衛が困難な問題だ。
- Anthropic: Claude faces ‘industrial-scale’ AI model distillation — AI News

AIエージェントの企業展開：理想と現実のギャップ

AIエージェントの実務導入が進む一方で、実験の域を出られない企業と真のROIを追求する企業との間に明確な分岐が生まれている。

FT Longitudeが実施した米英仏独200社のファイナンスリーダーへの調査によると、61%がAIエージェントを実験目的にとどめており、実際のビジネスプロセスへの統合には至っていない。さらに4人に1人の幹部が自社のAI投資ROIを把握していないと認めており、ガバナンスと評価指標の整備が急務となっている。
- Deploying agentic finance AI for immediate business ROI — AI News
Baswareは請求書ライフサイクル管理プラットフォームにAIエージェントを統合し、「Agentic Finance」モデル、すなわちプリセットされたガバナンス制御のもとでAIが財務タスクを自律実行するアーキテクチャを発表した。目標は「100%自動化」と明言しており、段階的な人間の関与削減を想定している。
- Basware’s AI agents: From invoicing to ‘100% automated’ — AI News
レガシーシステムのモダナイゼーションにもAIが本格参入した。金融機関の基幹システムを支えるCOBOLコードのAI支援変換において、ClaudeおよびIBMのツールチェーンが注目を集めている。数十年間「触れられなかった」コードが、AIによる理解・変換の対象となり始めており、市場はすでに反応を示している。
- COBOL modernisation just got an AI shortcut–and the market noticed — AI News
マルチエージェントワークフローの構築基盤においても、ComposioがReActループの限界を超えるオープンソースのエージェントオーケストレーターをリリースした。従来の「思考→ツール選択→実行」の単純ループでは複雑なゴール追跡に破綻しやすく、本番環境への投入が困難だったという課題に応えるものだ。
- Composio Open Sources Agent Orchestrator — MarkTechPost

記憶と長文脈処理：LLMの「忘れる問題」への解法

長大なコンテキストを扱うLLMの根本的な課題、すなわち矛盾解消・状態追跡・証拠の集約という問題に対し、強化学習を用いたエンドツーエンドの解法が提案された。

Unified Memory Agent（UMA）は、メモリ操作と質問応答を単一のRLポリシーに統合するフレームワークだ。従来のRAGシステムがクエリ時に受動的に情報を引き出すのに対し、UMAはデュアルメモリ構造（作業記憶と長期記憶）を持ち、超長文ストリームでの頻繁な情報更新にも対応する。
- Learning to Remember: End-to-End Training of Memory Agents for Long-Context Reasoning — arXiv AI+ML+CL
RAG研究の観点から見ると、コンテキストウィンドウの巨大化がRAGの必要性を消滅させるという仮説は否定されつつある。精度・コスト・ハルシネーション率の観点から、選択的検索は全データ注入より信頼性が高いという結論が実証的に支持されている。
- RAG vs. Context Stuffing — MarkTechPost

マルチエージェント強化学習：人間の直感を超えた自律アルゴリズム探索

Google DeepMindの研究は、人間のヒューリスティックに依存してきたアルゴリズム設計そのものをAIに委ねるという、メタレベルのAI研究の到達点を示している。

DeepMindチームは意味的進化（Semantic Evolution）を応用し、マルチエージェント強化学習（MARL）における主要アルゴリズムの非直感的なバリアントを自動生成することに成功した。対象はCounterfactual Regret Minimization（CFR）とPolicy Space Response Oracles（PSRO）であり、人間が試行錯誤で探索してきた更新ルールの組み合わせ空間を、AIが体系的に探索・改良するパラダイムシフトを意味する。
- Google DeepMind Researchers Apply Semantic Evolution — MarkTechPost
生成されたVAD-CFRおよびSHOR-PSROバリアントは、既存の手法を上回るアルゴリズム収束性能を示しており、人間の事前知識なしに発見された構造が実際に機能することを実証した。この知見はゲーム理論・金融市場・自律走行など多エージェント問題全般に波及する可能性がある。
- Google DeepMind Researchers Apply Semantic Evolution — MarkTechPost

科学計算へのAI応用：偏微分方程式求解の新手法

物理シミュレーションと深層学習の融合領域で、実用化を阻んできた訓練速度と精度の問題に対する新しいアプローチが複数登場した。

Scale-PINN（Sequential Correction Algorithm for Learning Efficient PINN）は、Physics-Informed Neural Networks（PINN）の実用化における最大の障壁、すなわち従来の数値ソルバーと比較して遅い訓練速度と低い精度の問題に取り組む。逐次補正アルゴリズムによって、現代的な数値手法とのギャップを埋めることを目指している。
- Scale-PINN: Learning Efficient Physics-Informed Neural Networks Through Sequential Correction — arXiv AI+ML+CL
弱形式進化型Kolmogorov-Arnold Networks（KAN）は、時間依存PDEの時間的ダイナミクスを逐次捉える進化型ニューラルネットワークの枠組みに、弱形式を適用した手法だ。強形式アプローチに比べて不連続解や複雑な境界条件に対して頑健であり、科学シミュレーションの適用範囲を広げる可能性を持つ。
- Weak-Form Evolutionary Kolmogorov-Arnold Networks for Solving PDEs — arXiv AI+ML+CL
創薬分野では、Physiologically Based Pharmacokinetic（PBPK）モデルにマルチスケール深層学習を組み合わせる研究が発表された。薬物の吸収・分布・代謝・排泄（ADME）の予測精度向上と計算コスト削減を同時に実現しようとするもので、医薬品開発の大規模シミュレーションを加速する可能性がある。
- Physiologically Informed Deep Learning: A Multi-Scale Framework for Next-Generation PBPK Modeling — arXiv AI+ML+CL

医療AIの精緻化：時系列データ分析の構造的課題

医療時系列データ（MedTS）に対してTransformerを適用する際の根本的な設計上の問題が指摘され、より適切なアーキテクチャの模索が始まっている。

EEG・ECGなどの医療時系列データは、チャネル内の時間依存性とチャネル間の相関という2種類のパターンを同時に持つ。既存のTransformerベースモデルは分散型アテンション機構を採用しているが、これが集中型の信号（心臓の電気的活動など）の捕捉に不向きであることが論文で指摘された。
- Decentralized Attention Fails Centralized Signals: Rethinking Transformers for Medical Time Series — arXiv AI+ML+CL
この研究は単なる性能改善の提案にとどまらず、「なぜ既存手法が失敗するか」のメカニズムを分析している点で重要だ。脳疾患・心疾患の診断AIの信頼性向上に直結する問題であり、臨床応用の観点から実用的意義が高い。
- Decentralized Attention Fails Centralized Signals: Rethinking Transformers for Medical Time Series — arXiv AI+ML+CL

AIガバナンスとデータ安全性：規制圧力への対応

規制強化と主権データの要求が高まる中、AIインフラのガバナンス設計が企業の重要課題として浮上している。

「切断されたクラウド（Disconnected Cloud）」は、インターネット接続のない隔離環境でAIシステムを運用するアーキテクチャであり、規制産業・公共セクターでの採用が増加している。Microsoftはこうした環境向けの機能拡張を行っており、外部依存が許容されない施設でのAI利用を可能にすることを目指している。
- How disconnected clouds improve AI data governance — AI News
コンテンツ安全性の計測手法においても、機械学習支援サンプリングとLLMラベリングを組み合わせたシステムが提案された。ポリシー違反コンテンツの有病率（prevalence）、すなわちユーザーがポリシー違反コンテンツを実際に目にする割合を、人手ラベリングのコストを抑えながら正確に推定する設計で、プラットフォームの安全性監視に実践的な応用が期待される。
- Measuring the Prevalence of Policy Violating Content with ML Assisted Sampling and LLM Labeling — arXiv AI+ML+CL

AIの水平展開：スポーツ・言語学・レーダー探知

AIの応用領域はさらに多様化しており、従来の手法が持つバイアスや測定限界を深層学習で克服する試みが続いている。

サッカーにおける選手の視覚的探索行動の定量化研究では、頭部の急速な動き（125°/s以上）を計測する従来手法がポジションバイアス（中央MFに偏る）・二値的測定・アノテーション困難という問題を抱えていることを指摘。ポーズ推定と位置データを組み合わせた深層学習アプローチで、より包括的な分析を実現しようとしている。
- Wide Open Gazes: Quantifying Visual Exploratory Behavior in Soccer — arXiv AI+ML+CL
言語学の統語解析分野では、英語とスロベニア語という統語的に異なる2言語の話し言葉・書き言葉を、依存関係ツリーバンクを用いてボトムアップに比較するアプローチが発表された。完全帰納的手法による言語横断的な統語変異の探索は、LLM訓練データの言語的多様性評価にも応用できる知見を提供する。
- Counting trees: A treebank-driven exploration of syntactic variation in speech and writing across languages — arXiv AI+ML+CL
レーダー目標探知においては、ガウス環境を前提とした従来の適応検出器が、クラッター（Complex Elliptically Symmetric分布や複合ガウス分布でモデル化される重尾分布）存在下で性能劣化するという問題に対し、Support Vector Data Description（SVDD）を応用した新手法が提案された。
- Support Vector Data Description for Radar Target Detection — arXiv AI+ML+CL