AnthropicがClaude Opus 4.8を公開した。前世代のOpus 4.7から判断精度を向上させ、自分の進捗をより正確に報告する「誠実な自己評価」機能と、前世代より長時間の自律的なタスク遂行能力が特徴だ。研究者のイーサン・モリック氏は早期アクセスでのテストで、twiglで動作するシェーダー生成、RPGルールブック+Webサイト+ソロ冒険の一括制作、過去の研究ファイル群から学術論文の自動執筆などを実証した。今日から利用可能。
「誠実に失敗を認めるモデル」という訴求軸が増えてきた。
AIモデルの自律性向上とインフラ再設計が急速に進む一方で、信頼性と法的課題が深刻化している。AnthropicはClaude Opus 4.8で長時間自律作業と自己評価精度を強化し、650億ドルの大型調達で1兆ドル評価額に迫る。同時にAWSやCloudflareはインターネットをエージェント向けに再設計し、Webの主役が人間からAIに交代しつつある。一方、LLMは虚偽情報を警告後も信じ込む根本的な問題が判明し、CNNがPerplexityを著作権侵害で提訴するなど、AI検索の法的・倫理的課題が顕在化している。能力拡張と信頼性確保のギャップが業界の最大の課題だ。
AnthropicがClaude Opus 4.8を公開した。前世代のOpus 4.7から判断精度を向上させ、自分の進捗をより正確に報告する「誠実な自己評価」機能と、前世代より長時間の自律的なタスク遂行能力が特徴だ。研究者のイーサン・モリック氏は早期アクセスでのテストで、twiglで動作するシェーダー生成、RPGルールブック+Webサイト+ソロ冒険の一括制作、過去の研究ファイル群から学術論文の自動執筆などを実証した。今日から利用可能。
「誠実に失敗を認めるモデル」という訴求軸が増えてきた。
Nous ResearchがオープンソースAIエージェントフレームワーク「Hermes Agent」のv0.15.0を公開した。「Velocity Release」と銘打たれた今回のアップデートは、エージェントの処理速度と応答精度の向上が中心。Hermes Agentは開発者が自律タスクを組むために使うフレームワークで、商用APIに依存せずローカルや自社インフラで動かせる点が強みだ。詳細な変更履歴は公式GitHubで確認できる。
オープンソース側のエージェント競争も静かに加速している。
AnthropicがシリーズHで650億ドル(約9.5兆円)の資金調達を完了し、ポストマネー評価額は9,650億ドルに達した。IPO前の最終ラウンドになる可能性が高いとされる。今年だけでClaude Opus 4.7、4.8と立て続けにモデルをリリースしており、調達資金は計算インフラとモデル開発の加速に充てられる見通しだ。競合OpenAIとの差を縮める一方、評価額1兆ドルという節目が現実味を帯びてきた。
資金調達ラウンドが企業の存在証明になりつつある時代。
AWSやCloudflareなどのクラウド大手が、AIエージェントを主要トラフィック源として想定したインフラ再設計を進めている。人間ではなく機械が読み取れるAPIエンドポイント、エージェント間認証、リクエスト課金モデルなどが整備されつつある。TechCrunchの分析では、Webの構造そのものがブラウザを使う人間ではなく自律エージェントを前提にシフトしており、今後数年でインターネットの使われ方が根本的に変わると予測している。
Webの主役がブラウザからエージェントに静かに交代しつつある。
Waymoが新型ロボタクシー「Ojai」を発表した。薄青色のボディを持つOjaiは中国製で製造され、数週間以内にカリフォルニア州とアリゾナ州で一般向けの配車サービスを開始する予定だ。Waymoはすでに複数の都市でサービスを展開しているが、Ojaiは中国製造という点で注目される。自動運転タクシーが日常の選択肢として広がりつつある現状を示している。
中国製車体で米国の公道を走るという構図が今後どう扱われるか。
複数のLLMに対し「以下の情報は虚偽です」と明示した上でテストした研究によると、モデルは警告後も誤情報を事実として自信を持って提示する傾向があることが判明した。ファインチューニングで改善を試みたが「誤情報を自信を持って真実として表現しようとするバイアス」は残存したという。これはAIチャットボットやAI検索ツールを実務で使う際の精度評価に直結する問題だ。
「嘘だと教えても嘘をつく」は、信頼設計の根が深い問題だ。
CNNがAI検索スタートアップのPerplexityに対し著作権侵害訴訟を起こした。訴状では、Perplexityのツールがニュース記事を「逐語的」に複製して表示していると主張しており、これはCNNが独自報告した内容を含む。PerplexityはすでにNYT、AP通信など複数のメディアとの衝突が続いており、今回の訴訟でAI検索と報道機関の著作権問題がさらに激化する見通しだ。
AI検索の「便利さ」が成立してきた構造に、正面からメスが入る。