1.ソフトバンクが5G基地局と衛星通信地球局の「電波干渉キャンセラー」を屋外実証(2.21 日経XTEC)
ソフトバンクと東京科学大学は2025年2月21日、5G(第5世代移動通信システム)と衛星通信の下り回線との電波干渉を低減する「システム間連携与干渉キャンセラー」について、屋外で実証実験に成功したと発表した。2023年には屋内で試作装置を使った実験に成功しており、今回実用化に向けて歩みを進めた形だ。同装置が実用化すれば、衛星通信の周辺の周波数帯であっても同社が5G基地局を設置・運用しやすくなる可能性がある。
ソフトバンクが5G向けに総務省から割り当てられている3.9GHz帯は、衛星通信の地球局が通信衛星から受け取る下り回線と同じ周波数帯に当たる。そのため同社が5Gの3.9GHz帯の基地局を設置する場所によっては、衛星通信の信号に電波干渉を与えてしまうという課題がある。
キャンセラーは同課題の対策となり得るものだ。5G基地局がスマートフォンなどの端末に向けて発する下り信号(5G干渉信号)と同じ信号を、地球局に設置したキャンセラーへ光ファイバー経由で送る。キャンセラーを使って衛星信号と5G干渉信号が混在した信号から5G干渉信号を打ち消し、衛星信号だけを取り出す。
2.IOWN APNによる5G基地局内の動的経路変更、NTTが実証(2.21 日経XTEC)
NTTは2025年2月20日、5G(第5世代移動通信システム)基地局内の通信経路を動的に変更する実証実験に成功したと発表した。IOWN構想におけるAPN(オールフォトニクス・ネットワーク)技術を用いて、RAN(Radio Access Network)基地局におけるRU(アンテナ側装置)とDU(制御側装置)の間の経路を変更する。実験では動的な経路制御により、消費電力を約20%削減できると確認した。今後、モバイルトラフィックの変動や障害が発生した際、消費電力を削減したり、サービスへの影響を低減したりできるとする。
3.LLM開発は「スパコンの故障との戦い」、Metaが明かした驚くべき実態と対策(2.21 日経XTEC)
大規模言語モデル(LLM)の開発は、高価なAI(人工知能)用GPU(画像処理半導体)を数千個以上搭載するAIスーパーコンピューターで発生する様々なハードウエア故障との戦いである。米Meta(メタ)が最近発表した論文で、その実態を明らかにした。
まず当たり前のこととして、クラスターに含まれるサーバーの台数が増えれば増えるほど、部品などが故障するまでの平均時間を示すMTTF(平均故障時間)は短くなるものだ。ハードウエア故障は確率的に発生するため、1台ごとのサーバーの故障率は低かったとしても、クラスターの規模が大きくなると、常にどこかしらで故障が発生するという状況になる。「下手な鉄砲も数打ちゃ当たる」という理屈である。
大規模なLLMのトレーニングで悩ましいのは、クラスターの一部が故障するだけで、全体のジョブをやり直す必要が生じることだ。大規模なLLMは1台のサーバーのGPUメモリーには収まりきらないため、複数台のサーバーのGPUメモリーにまたがるかたちで稼働させている。
もしLLMが小さく、1台のサーバーのGPUメモリーに収まるサイズであれば、壊れたサーバーが担っていたジョブだけをやり直せば済む。しかしLLMのサイズが大きく、複数台のサーバーのGPUメモリーにまたがっている場合は、1台のサーバーが故障すると、ジョブ全体をやり直す必要が生じる。
しかも大規模なLLMのトレーニングジョブは、数日から数十日もの時間を要する。10時間に1回、故障が発生するような状況では、ジョブがいつまでたっても終わらなくなる。そこでLLMのトレーニング中は、GPUメモリーのデータをストレージに適時バックアップして、ハードウエア故障などに備える。これを「チェックポイント」の作成という。故障が発生した場合は、チェックポイントにまでサーバーの状態を巻き戻して、ジョブを再開する。
メタがRSCにおける故障の原因を分析したところ、ハードウエア故障の中で最も多かったのは、GPUサーバー同士を相互接続するInfiniBandネットワークにおけるリンク障害だった。外部ストレージのファイルシステムやGPUに関する故障がそれに続いたという。
そこでメタは2024年3月、RSCの後継機として、エヌビディアのGPU「H100」をそれぞれ2万4576個搭載するAIスパコンを2系統稼働させた際に、1系統のAIスパコンではInfiniBandを、もう1系統のAIスパコンではEthernetを採用し、InfiniBandとEthernetのどちらが優れているのか検証することにした。つまりInfiniBandをEthernetに切り替えることで故障を減らす可能性を探ったのである。
メタがEthernetベースのAIスパコンの方を信頼していることがうかがえる。
つまり新しいAIスパコンにおいては、全体の故障件数が減っていると考えられるだけでなく、ネットワークに起因するハードウエア故障も減っていることが分かる。InfiniBandからEthernetへの切り替えは、ハードウエア故障の削減に寄与しているようだ。
4.LLMの急速な進化と選択肢増に多くの企業が苦悩、決め打ちしないで常にアップデート(2.20 日経XTEC)
大規模言語モデル(LLM)の選択に関する課題を取り上げる。LLMは進化が著しく、新しいモデルやバージョンが短期間で次々と出てくる。多くの企業が頭を悩ませており、先進企業への取材から選択と運用のヒントを探った。
本特集の20社調査では、米OpenAI(オープンAI)の「GPT-4o」と米Anthropic(アンソロピック)の「Claude 3.5 Sonnet」を採用している企業が目立った。
どちらも両社の主力モデルであり、回答精度は「申し分ないレベルに達している」との評価が多い。このため、企業は自社環境との親和性や利用料金など精度以外の観点から、選択肢を絞り込んでいる。
モデル選びにおける重要な要素が利用料金だ。LLMの利用料金は、文章を単語や文字で分割した「トークン」という単位による従量課金が一般的である。入力及び出力したトークン数の合計で利用料金が決まる。
GPT-4oは米Microsoft(マイクロソフト)の生成AI基盤「Azure OpenAI Service」から利用できる。入力データをLLMの学習に使用しないなど、安全性を担保した生成AI環境を構築できるサービスとしていち早く提供を開始したため、現在でも引き続き利用している企業が多い。
5.未来に向けイーサネットはまだまだ進化、注目技術は「SPE」と「Ultra Ethernet」(2.19 日経XTEC)
イーサネットの進化は止まらない。ここでは、注目すべき新技術を2つ解説しよう。
メタルケーブルを使って伝送距離を伸ばしたり、1対の信号線で電力を供給できるようにしたりする方向で進化している。一方でイーサネットの高速性をAIの処理に生かそうという動きもある。
1つがメタルケーブルによるネットワークをより広範に使えるようにする「SPE(Single Pair Ethernet)」だ。10BASE-T1、100BASE-T1、1000BASE-T1として規格化されている。同技術は監視カメラをはじめ、ネットワークにつながる機能を持つIoT(Internet of Things)機器などを接続する用途を想定している。「今までつながっていなかったものをネットワークにつなげる」(日本製線の浅香芳晴取締役開発部Manager)ことを目指す。
もう1つが、イーサネットの特徴である低遅延・高速性をHPC(High Performance Computing)*1やAI(Artificial Intelligence)の処理に生かす「Ultra Ethernet(ウルトラ イーサネット)」だ。データセンター内での利用を想定する。
もう1つの目標が、1対(2本)の信号線で給電も同時に実現することだ。SPEは2芯1対のSPEケーブルを使い、電力と信号をやり取りする。これをPoDL(Power over Data Line)と呼ぶ。
イーサネットケーブルを使って給電する規格は、一般的なイーサネットケーブルにもある。PoE(Power over Ethernet)だ。SPEはPoEよりも必要とする信号線の本数が少なく、ケーブルが細くしなやかである。加えてコネクターも小さい。そのため取り回しがしやすく、従来配線が難しかった場所でも使いやすいのが特徴だ。
ホームページへ