週間情報通信ニュースインデックスno.1506 2025/12/13


1.AIエージェントにオフィス業務はまだ難しい、ベンチマークに見る高い壁 (12.12 日経XTEC)
 AI(人工知能)が自律的に業務を遂行する「AIエージェント」は、実際のオフィス業務に活用できるのか。その能力を測るベンチマークの整備が米国で始まった。最先端のLLM(大規模言語モデル)を使っても、ビジネス的に価値のある難問に正答するのは難しい現状が明らかになった。

 既にソフトウエア開発業務に関しては、AIエージェントが高い生産性を発揮できることがベンチマークによって明らかになっている。代表例がソフトウエアに存在するバグの修正能力を測る「SWE-bench」だ。

 SWE-benchは2023年秋に米プリンストン大学の研究者らが提案したベンチマークだ。ベンチマークを通じてAIエージェントのソフトウエア開発能力が可視化され、AIエージェントにソフトウエア開発という業務を任せられるという確信が高まったからこそ、AIエージェントにソフトウエア開発を任せる「Vibe Coding」が2025年、一気に広まったわけである。

 AIエージェントの能力を測るベンチマークとしては、数学の能力を測る「AIME 2025」や、学術分野での論理推論能力を測る「Humanity's Last Exam」、知識だけでは解けない視覚的なパルズ問題などを解く能力を測る「ARC-AGI-2」などがあり、米OpenAI(オープンAI)や米Google(グーグル)といったLLM提供企業は最新モデルを発表する度に、これらのベンチマークの成績を公表している。

 オープンAIは2025年9月25日(米国時間)に、GDP(国内総生産)の拡大に資するような経済的に価値のある実世界の業務についてのAIエージェントの能力を測ることを目指したベンチマークである「GDPval」を発表した。

 GDPvalでは、法務や設計、カスタマーサポート、看護といった44職種の業務に関する専門知識が必要な質問(タスク)を1320件用意し、それに対するLLMの回答を評価する。質問にはテキストに加えてドキュメントなどの参照用ファイルも添付されており、LLMによる回答についてもテキストの出力だけでなく、ドキュメントやスライド、表計算シートなど「成果物」の作成が求められている。

 オープンAIがWebサイトで公表しているスコアによれば、勝率はGPT-4oでは12.4%に過ぎなかったのに対して、最新鋭のモデルである「GPT-5 high」は38.8%、「Claoude Opus 4.1」は47.6%に達する。それでもまだLLMの業務文書作成能力は、人間には及ばないことがベンチマークからは分かる。

2.ZTEなど、ISACで飛行物体の検出を高度化 (11.25 日経XTEC)
中国・中興通訊(ZTE)と中国聯合網絡通信(China Unicom)遼寧支社は、中国・大連長海空港にて5G-Advanced対応プライベートネットワークの運用を開始した。

基地局にはミリ波周波数帯を使ったISAC(Integrated Sensing and Communication、通信とセンシングの統合)機能が搭載されており、送信した5G信号が反射される際の到達時間や特性をリアルタイムに分析することで、低高度空域でのドローンや鳥などを迅速に発見できるという。

小型で軽量なRedCap(Reduced Capability)対応装置を活用することで、以前は設置が困難だった場所にもカメラやセンサーを配備できるようにした。大連長海空港では、これらを常時稼働させることによって、これまで7割だったターゲットの検出率を9割以上に改善し、発見時の応答時間も87%短縮できるようになったとしている。

3.アサヒのランサム記者会見に多くの学び、攻撃は「高度かつ巧妙」だったのか(12.10 日経XTEC)
 アサヒグループホールディングス(GHD)はどのようにしてランサムウエア攻撃の被害に遭ったのか。多くの人が疑問に思っていただろう。同社はセキュリティー対策に力を入れていると考えられていたからだ。その答えの一部が、2025年11月27日の記者会見で明らかにされた。ランサムウエア攻撃に備える企業にとって、学びの多い内容だったといえる。

記者会見の冒頭、勝木敦志社長自身から攻撃の概要が語られたからだ。大まかな内容は次の通り。
・アサヒGHDにおいてシステム障害が発生。調査により暗号化されたファイルを確認した
・約10日前、攻撃者がグループ内拠点のネットワーク機器経由で侵入していたことが判明した
・攻撃者は主要なデータセンターに侵入後、パスワードの脆弱性を突いて管理者権限を奪取。そのアカウントを使ってネットワーク内を探索し、複数のサーバーへの侵入と偵察を繰り返した
・侵入されたアクセス権を認証するサーバーからランサムウエアが一斉に実行され、起動中の複数のサーバーやパソコン端末の一部のデータが暗号化された
・従業員に貸与している一部のパソコン端末のデータが流出した
 以上から、典型的なランサムウエア攻撃だったことがうかがえる。

2025.12.01  問題は、侵入された「ネットワーク機器」が何なのかだ。VPN装置である可能性が極めて高いものの、勝木社長は「非常に重要なリスクにつながる情報」として回答を避けた。当然の対応である。絶対に言ってもらえないだろうと諦めた。

 だがその後、「(対策として)VPNは廃止した」「(報道陣の)想像とそれほど違わないものと思う」と発言。さらに、悪用されたのが既知の脆弱性だったことも匂わせた。以上から、VPN装置の既知の脆弱性を悪用されて侵入されたと考えてよいだろう。

4.場当たり的なAI導入の末路、戦略の欠如に潜む3つの落とし穴 (12.8 日経XTEC)
2022年にAIチャットサービス「ChatGPT」が登場してから、生成AI(人工知能)は急速に進化・普及し、企業のIT戦略に革命的なインパクトを与えている。既にAIの可能性を探るPoC(概念実証)の段階は終わり、今や実際の業務やサービスへAIを本格的に組み込んでビジネス成果につなげることが求められつつある。

 一方で「PoCで終わってしまう」「部門ごとにAIが乱立し、コストとリスクが増大する」といった新たな課題に直面している企業は少なくない。これらの課題の根源にあるのは、戦略的にAIアーキテクチャーを導入できず、場当たり的にAI導入を推進してしまったことにある。

期待を胸にAI導入を進めたものの思うような成果が出ない、AI導入で新たな問題を引き起こしている――。あなたの会社は次の3つの「落とし穴」に陥ってはいないだろうか。

落とし穴1:PoC止まりで実証実験の成功がゴールになっている
 「今回のPoCは大成功でした。現場からも高評価です」――。このように意気揚々と報告したものの、その成果は本番システムに組み込まれることなく塩漬けになっている。時間と予算を投じたにもかかわらず、ビジネス価値を生まないPoCの残骸だけが積み上がっていく。これはAI導入プロジェクトでよく聞く失敗談の1つである。

5.AWSが独自CPU「Graviton5」で25%性能向上、AIチップ「Trainium4」も発表 (12.8 日経XTEC)
 米Amazon Web Services(アマゾン・ウェブ・サービス、AWS)が、AI(人工知能)半導体で一強が続く米NVIDIA(エヌビディア)からの依存脱却に布石を打った。米ネバダ州ラスベガスで2025年12月1日?5日(米国時間、以下同)で開催した年次イベント「AWS re:Invent 2025」で、独自設計のCPU(中央演算処理装置)「AWS Graviton」やAIチップ「AWS Trainium」の次世代版を相次いで発表。自社製チップへの傾倒をより強めた。

 AWSは12月4日、Armベースの独自設計CPU「Graviton5」を発表。同日から、AWSの仮想サーバーサービス「Amazon EC2」で、Graviton5を搭載する「M9g インスタンス」のプレビュー版の提供を開始した。

 Graviton5は、前世代版となるGraviton4と比較してコア数を96から192に倍増。コア間通信のレイテンシー(遅延)は最大で33%低減し、コア自体の処理性能も25%向上したという。CPU性能の向上に伴って、M9g インスタンスの処理速度はAWS Graviton4ベースの「M8g インスタンス」に比べて、AWSの計測では25%高速化した。テストユーザーである米Airbnb(エアビーアンドビー)は25%、米Snowflake(スノーフレイク)は30%の高速化を確認したという。

ホームページへ