ペンシルバニア大学のイーサン・モリック教授が、GPT-5 Proシリーズが2025年夏以降、最難関問題の一発解答で一貫してトップを維持しており、実質的に競合モデルが追いつけていないと指摘した。単発の難問を解く能力において他モデルが本質的に追随できていない点を、ベンチマークではなく実使用ベースで観察している点が注目される。
「競合なし」という表現が研究者から出るのは珍しく、モデル間格差が再び開いているサインかもしれない。
OpenAIのGPT-5 Proが競合を圧倒する性能を維持する一方で、エンタープライズ向けAI検索のGleanが「コスト削減ツール」としての訴求で年間収益3億ドルを突破するなど、AIの実用化が加速している。農業やセキュリティといった非デジタル産業への浸透も進む中、北朝鮮系ハッカーがVS Codeを悪用する攻撃や、AIエージェントが経済主体として市場参加する仕組みの実装など、AIの社会的インパクトは拡大と同時にリスクも増大している。AIが自らの出力を評価する段階に達する一方で、攻撃と防御の両面でAIが活用される軍拡競争が本格化しつつある。
ペンシルバニア大学のイーサン・モリック教授が、GPT-5 Proシリーズが2025年夏以降、最難関問題の一発解答で一貫してトップを維持しており、実質的に競合モデルが追いつけていないと指摘した。単発の難問を解く能力において他モデルが本質的に追随できていない点を、ベンチマークではなく実使用ベースで観察している点が注目される。
「競合なし」という表現が研究者から出るのは珍しく、モデル間格差が再び開いているサインかもしれない。
エンタープライズ向けAI検索スタートアップのGleanが、年間収益3億ドルを突破したとTechCrunchが報じた。GoogleやMicrosoftなどテック大手が同カテゴリに参入するなか、Gleanは「AIで他のソフトウェアコストを削減できる」という訴求で企業の予算を獲得し、売上を3倍に伸ばした。AI導入を正当化する新しいロジック――「コスト削減ツールとしてのAI」――が大企業の購買決定を動かし始めている。
「AIを使うとコストが下がる」という説得フレームが、企業内の稟議を通す決め手になりつつある。
北朝鮮国家支援のサイバー攻撃グループ「Kimsuky」が、新たなマルウェア「HTTPSpy」「HelloDoor」とMicrosoftのVS Codeリモートトンネル機能を組み合わせた攻撃キャンペーンを展開していることが判明した。VS Codeトンネルは開発者が日常的に使う正規ツールであり、セキュリティ製品による検知を回避しやすい。主に韓国の政府・研究機関が標的となっている。
VS Codeのような開発者ツールが攻撃インフラに転用される手口は、コード執筆にAIを使う層にとっても他人事ではない。
米オハイオ州の農業メディアが、大豆の発芽不良時に植え直しが必要かどうかをAIが判断支援するツールの普及を報じた。農家は圃場のデータを入力するだけで、収量予測と費用対効果を踏まえた植え直し推奨を得られる。農業分野でのAI活用は専門知識を持てなかった個人農家の意思決定を変えており、「専門家なしで複雑な判断ができる」ユースケースとして注目される。
農業のような非デジタル産業での浸透こそ、AIが「一部の人のもの」でなくなったことの証拠だ。
ペンシルバニア大学のイーサン・モリック教授が、ClaudeにAI学術論文を書かせ、ロバストネスチェック後にClaude自身が「識別スコア1〜10で4.5」と自己評価したエピソードを紹介した。AIがタスクを実行するだけでなく、自分の成果物の限界を定量的に言語化できる段階に来ていることを示す実例だ。研究やレポート作成の補助としてAIを使う際の信頼性評価の参考になる。
AIが自分の出力を採点する時代に、人間は何を確認すればいいかを問い直す必要がある。
Fetch.ai(FET)が、AIエージェントに特化したトークン発行・取引プラットフォーム「Agent Launchpad」を正式ローンチした。エージェントが自律的に経済活動を行うための基盤インフラとして設計されており、エージェント単位でトークンを発行・流通させる仕組みを提供する。AIエージェントが経済主体として市場に参加する「エージェント経済」の具体的な実装が進んでいる。
エージェントが自分のトークンを持って市場に立つ、という概念が実装フェーズに入った。
Google Cloudが、AIを活用して企業のサイバー脅威を継続的に監視・対応する自動化セキュリティシステム「Google AI Threat Defense」を発表した。既存のセキュリティツールに統合可能で、攻撃の検知から対応までを自動化する。AIが攻撃手段に使われる時代に対し、AIで防御も自動化するアプローチを提示している。
攻撃側も防御側もAIを使う、という軍拡競争の構図がクラウド製品レベルで可視化されてきた。