1.富岳の後継機「富岳NEXT」の開発にエヌビディアが参加、理化学研究所が発表(8.22 日経XTEC)
理化学研究所は2025年8月22日、スーパーコンピューター「富岳」の後継機「富岳NEXT」の開発に、米NVIDIA(エヌビディア)が参加すると発表した。エヌビディアがGPU(画像処理半導体)基盤に関する設計を主導する。
富岳NEXTを巡っては、開発に富士通が参加することを理研が2025年6月に発表済み。富岳NEXTの開発は今後、理研と富士通、エヌビディアの3社で協力して進めることになる。富士通は主に全体システムや計算ノード、CPU(中央演算処理装置)の基本設計などを担う。
2.「高コスパ」の呪縛に苦しむPixel 10シリーズ、価格からAIに関心をシフトできるか(8.22 日経XTEC)
米Google(グーグル)はスマートフォン「Pixel」シリーズの最新モデルを発表した。新開発のチップセット「Tensor G5」を搭載し、得意とするAI(人工知能)関連機能をさらに強化した。その一方で同シリーズの人気を支えてきた高いコストパフォーマンスに、グーグル自身が苦しんでいる様子が見えてくる。
AI技術のカメラへの活用としては、「カメラコーチ」機能も挙げられる。被写体にカメラを向けてカメラコーチを呼び出すと、よりよく撮影できる構図や撮影方法などをアドバイスしてくれる。
「マイボイス通訳」という機能も用意した。これは電話アプリで音声通話をする際、自分の声と相手の声を自動的に通訳する機能。異なる言語を話す人同士での通話を可能にする。
同様の機能は、他のスマホも既に実現している。マイボイス通訳の大きな特徴は、話の内容を通訳するだけでなく、話した人に近い声色で相手に伝える点である。その分発売当初は、日本語で会話できる相手は英語に限られる。今後、対応する言語を増やす予定だという。
日本の消費者はこれまでの経緯から、Pixelシリーズに対してグーグルが力を注ぐAIより、高いコストパフォーマンスを求めている。それだけに、グーグルがスマホ市場で再浮上するには、消費者の関心をいかにして価格からAIにシフトできるかが大きく問われるだろう。
3.Google検索の「AIによる概要」でメディアは大打撃、クローラー課金は救世主となるか(8.22 日経XTEC)
生成AI(人工知能)革命の最初の「犠牲者」は、残念ながら我々メディア企業になりそうだ。Google検索に「AIによる概要(AIオーバービュー)」が搭載されたことで、検索エンジンからの訪問者が減少しているからだ。米国の業界団体の調査によれば、2025年5〜6月の期間中、米メディアにおける検索流入は前年比10%減少したという。
ピュー・リサーチ・センターが米国の成人900人を対象に調査したところ、Google検索の結果ページに表示される外部サイトへのリンクをクリックする割合は、通常の検索結果ページの場合は15%であるのに対して、AIオーバービューが表示されたページの場合は8%になるという。
AIオーバービューは、Webサイトの情報に基づいて生成AIがユーザーの質問に直接回答するという仕組みだ。生成AIの回答結果には、その根拠となるページへのリンクも表示されているのだが、そうしたリンクをクリックするユーザーの割合はわずか1%に過ぎないという。
今後、検索結果ページにAIオーバービューが表示される割合が高まれば、メディア企業への検索流入はさらに減少する恐れがある。DCNのリポートによれば、DCN加盟企業におけるデジタル収益の78%を広告収入が占める。検索流入の減少はデジタル収益の減少に直結するため、AIオーバービューがメディア企業にとって打撃になるのは間違いない。
CDN(コンテンツ・デリバリー・ネットワーク)の米Cloudflare(クラウドフレア)は2025年7月、生成AIの事業者がWebサイトから情報を収集(スクレイピング)するボット(bot)のAIクローラー(AI crawler)に対して課金を請求する仕組みである「pay per crawl」を発表した。
クラウドフレアのアレン氏によれば「pay per crawlを発表して以降、メディア企業からの問い合わせは増加している」という。果たしてAIクローラー課金の仕組みは、メディア企業を救えるのだろうか。
4.パナソニックコネクトの「質問を分解する」映像認識AI、CVPR 2025のコンペで首位に(8.21 日経XTEC)
パナソニックコネクトはAI(人工知能)エージェントを応用した映像認識技術「DIVE(Deep-search Iterative Video Exploration)」を開発した。動画に関する質問を入力すると、幾つかのサブ質問に分解することで難しい質問にも答えられるようにしている。
2025年6月に開催されたコンピュータービジョンのトップカンファレンス「CVPR(Conference on Computer Vision and Pattern Recognition)」で初開催されたワークショップ「VidLLMs Workshop」。そこで開かれた、複雑な動画を認識するコンペティション「Complex Video Reasoning & Robustness Evaluation」で、DIVEは7チーム中首位の成績を収めた。
まず、動画の要約を生成する。マルチモーダルLLM(大規模言語モデル)と物体検出モデルを組み合わせることで、動画中の物体をより正確に把握した要約を生成できる。
次に、質問の意図を推定する。その上で、分割したサブ質問と回答の検証を繰り返す。AIエージェントがAPI(アプリケーション・プログラミング・インターフェース)経由でAIモデルを呼び出し、ループの中で最も優先度の高いサブ質問に回答する。
パナソニックコネクトはこのプロセスを「長時間思考」と呼んでいる。AIの論理的推論(Reasoning)モデルに着想を得たという。映像認識AIに論理的推論を組み合わせる手法はまだ数として多くはないものの、近年注目を集めている。
5.DX推進で職員の作業が増加する? 疲弊する自治体の実態(8.18 日経XTEC)
自治体においてもDX(デジタルトランスフォーメーション)が進行中だ。しかし、各種デジタルサービス導入の裏で職員の作業負荷は増加。業務の複雑化・高度化に加え、職員数減少、新卒採用の困難さにより、必要な専門人材の不足が深刻化している。この課題の解決策となりそうなのが、業務改革や、デジタル技術を利用したアウトソーシングである。DX推進に伴う自治体現場の実態について、総務省 大臣官房 デジタル統括アドバイザーの三木浩平氏が解説する。
「オンライン申請」「電子決済」「書かない窓口」「ワンストップ窓口」「手続きナビ」「チャットボット」――。これらは、近年の自治体サービスのトレンドを表すキーワードである。DX関連の展示会を訪れると、これらのツールを提供するベンダーのブースが林立し、入り口には「〇〇市様事例」というパネルが展示されている。最も多いと感じたのは「書かない窓口」のためのツール。特にマルチカードリーダーやOCR(光学文字認識)は、展示スペースの3分の1を占めるかと思われるほど数が多い。
「オンライン申請により、利用者は便利になり、窓口職員の負担は減る」
オンライン申請を導入する際には、このような触れ込みだった。ところが、自治体の職員と話をしていると、窓口に来る利用者の数は、それほど減ったように思えないばかりか、それ以上にオンライン申請の処理に関わる作業が追加されたように感じている職員が多い。つまり、オンラインで受け付けた内容に間違いがないか職員が目視で確認したり、オンライン申請とそれを引き継ぐ業務システムが異なるため、データの移し替えを手作業で行ったりしている。これは、オンライン申請と窓口申請が並走する「ダブルトラック問題」である。
自治体の窓口には、カードリーダーやタッチパネル端末が並び、アクションの度に、どの端末に何をかざしてほしいと利用者に伝える。一方で、職員は複数のツールの画面を交互に見比べながら作業をしている。プリントアウトした紙を職員が回覧したり、紙を見ながら再びキーパンチしたりする姿も見られる。このような状況下で、職員から「DXが始まって、作業負荷が増した」という声が聞かれるようになった。これは、システム処理と紙の処理が混在する「デジタル・アナログ混在問題」である。
これらは、業務改革を伴わないDXの失敗例と言える。業務フローを見直さず、新たなツールだけ加えた場合、ツールを使う分、作業量が増加する。新ツールが従来のツールと連携していない場合、職員がマンパワーで補完する(キーパンチやUSBメモリーカードを使ってデータを移し替える)ことになる。一方、「書かない窓口」と称して、職員が聞き取ってキーパンチするような、最初からマンパワーのみに依存するサービスは持続性があるサービスとは言い難い。
ホームページへ