週間情報通信ニュースインデックスno.1204 2019/12/14


1.グーグルの最新AI「BERT」が誇る驚異の学習法、文章を次々と飲み込んで理解(12.13 日経XTECH)
 文章読解の分野でもAI(人工知能)が人間の平均レベルを超え始めた。米グーグル(Google)の新AI技術「BERT」が壁を突き破り、検索や情報収集などの効率が飛躍的に高まる可能性が出てきた。BERTの驚異の仕組みを解説する。

 米グーグル(Google)が2018年10月に発表した新しいAI技術「BERT」やその改良版によって、AIが文章読解の分野でも高い性能を発揮するようになった。驚くべきその仕組みを解説しよう。

 BERT以前の言語モデルは前にある単語から後ろに続く単語を予測したり、文章の中で近い距離にある単語同士の関係を把握したりするだけだった。それに対してBERTは文章中の遠い距離にある単語同士の関係を把握したり、文脈を基に文章の各所にあるべき単語を予測したりできるようになった。

 遠い距離にある単語同士の関係も把握するので、言語モデルの規模は大きくなる。BERTに大きな影響を与えた言語モデルで2018年2月に米ワシントン大学が発表した「ELMo」は「LSTM」と呼ぶニューラルネットワークを2層重ねていた。それに対してBERTは「Transformer」と呼ぶニューラルネットワークを24層重ねる。

 BERTにおける学習は言語モデルそのものを学習する「事前学習」と、翻訳や読解、質問応答、換言、含意関係認識といったタスクごとに学習する「ファインチューニング」の2本立てだ。

 BERTの事前学習には、人間が正解データをタグ付けした「教師データ」は不要である。人間が書いた文章が大量にあればいい。BERTは文章の一部を機械的にマスクしたうえでその箇所の内容を予測する穴埋め問題や、ある文に続く文を予測する問題などを自分で作って解いて「言語らしさ」を学習する。AIが教師データを自ら用意する「自己教師あり学習」だ。グーグルはウィキペディアなどから集めた16Gバイト(3300万単語)の文章データを使用してBERTを開発した。タスクごとのファインチューニングには教師データが必要だが、「ファインチューニングに使う教師データは少量で構わない」(自然言語処理の研究者である、NTTの西田京介NTTメディアインテリジェンス研究所特別研究員)

 BERTはニューラルネットワークの規模を大きくすると同時に、事前学習に使用するデータ量を増やす「力業」によって言語モデルの精度を高められると示した点で画期的だった。BERTの改良版もネットワークの規模やデータ量をさらに大きくして、BERTを上回る成果を出している。

 

2.AWS EC2で構築したホストの6割以上に脆弱性、パロアルトが2019年を振り返る(12.13 日経XTECH)
パロアルトネットワークスは2019年12月13日、説明会を開催し同年のサイバー攻撃の傾向を振り返った。パロアルトネットワークスの林薫Field CSO(最高セキュリティー責任者)は「2018年12月〜2019年11月の間に8300万以上の新たなマルウエアを発見し対応した」と説明する。中でも目立ったマルウエアが「Emotet(エモテット)」だ。

 林CSOは「2018年以降、Emotetを利用して別のマルウエアをインストールさせる活動が活発化している」と説明する。2014年に不正送金を目的としたマルウエアとして猛威を振るったEmotetはモジュール型のマルウエアである。攻撃者が新たなモジュールを導入することで、様々な悪意のある処理を実行できる。

 2019年10月以降は国内でも多く検知され、「調査したところ、ある製造業の企業のメールアドレスが40以上抜き取られていた。そのアドレスを基に差出人を詐称した630通のメールを発見した」(林CSO)と感染の拡大に警鐘を鳴らす。

 またパブリッククラウドにおけるリスクの高まりを林CSOは指摘する。「ユーザーがAmazon EC2上に構築したホストの約62%に何らかの脆弱性を発見した」と説明する。同様にGoogle Compute Engine(GCP)では約59%、Microsoft Azureでは約39%のホストに脆弱性があったという。林CSOは多く脆弱性が見つかった理由を「古くに立ち上げたサーバーなどがそのまま残されているからではないか」と推測する。 

 

3.「別クラウドで再構築」、10日目突入の50自治体システム障害に進展(12.13 日経XTECH)
 2019年12月4日に日本電子計算の自治体向けIaaS「Jip-Base」および、それを利用していた50自治体でシステム障害が発生した問題で2019年12月13日、複数の自治体が本番環境とは別のクラウド環境によるシステムの再構築を進めていることが分かった。

 その一つである大阪府和泉市は、「現在はバックアップ用システムで稼働しているが処理能力に限界があるため、業務に支障が出ている。12月14日の土曜日に作業をして、週明けの12月16日から再開できる見込み」とコメントした。

 千葉県浦安市や愛知県東浦町も同様に別クラウド上での再構築の検討を始めており、例えば浦安市ではまだ再開できていない要介護認定などの介護保険業務システムを別クラウドで再構築する方向で進めている。いずれの自治体も「日本電子計算に本番環境とは別のクラウドの領域を用意してもらい、そこに業務システムを立て直す」(和泉市)という。日本電子計算は再構築に関し、「現状のお客様の個別システムの復旧状況についてはコメントできない」と回答した。

 和泉市によると、日本電子計算と結んだ契約ではシステム障害から再開までの時間は4時間だったが、障害発生からすでに10日目に達している。「クラウド上では本番機とバックアップ機など2重化の構成にしていた」(東浦町)という複数の自治体の証言からすると、なぜ日本電子計算のクラウド内部で冗長化機能が働かなかったかに注目が集まる。しかし同社は、自治体にも対外的にも詳細な説明を行っていない。ある自治体担当者によると、「障害の発生箇所であるストレージ装置も冗長化していたが、冗長化の機能がうまく動かなかったとの説明しか日本電子計算から受けていない」という。

 

4.ロボットがエレベーターに乗り荷物を運ぶ、三菱電機がスマートビルディングのデモ(12.14 日経XTECH)
 三菱電機はサービスロボットの運用を支援するサービスを開発している。ロボットとエレベーターなどを連携するシステム基盤を構築し、ビル管理の省人化を狙う。東京ビッグサイトで開催中の「スマートビルディングEXPO 東京展」(12月11日〜13日)でデモを披露した。

 披露したデモンストレーションはロボットがビル内を移動して荷物の搬送を想定したものだ。まず荷物を載せたロボットがセキュリティーゲートを抜け、エレベーターを呼び出してカゴ内に乗り込む。最終的に指定した階でカゴ内から出て荷物を渡すという内容だ。

 デモ内容は人との協調に重点を置く。人がセキュリティーゲートを通ろうとしている場合、ゲートが人を検知してロボットが後退する。アニメーションライティングでエレベーター内にロボットが存在することなどを示して、周囲の人を驚かせないように配慮するようにしていた。

 三菱電機はビル内でのロボット運用を支援するシステム基盤「スマートビルサービスプラットフォーム」を開発する。ロボットは同システム基盤を介し、セキュリティーゲートの開閉、通信モジュールを設置するエレベーターの呼び出しなどを実行できる。ロボットがアームなどを用いて設備を操作するのは技術的に難しい。ただロボットと設備の通信環境を個別に整えるのは煩雑だ。そこで同社は同システム基盤を用いてロボットと設備の間で多数の接続を簡単にできるよう目指している。今後同社はロボット、接続できる設備の種類を増やしていく計画である。

 

5.AIとカメラ96台で来店客「解剖」、サツドラが得たPOSでは見えない真実とは(12.9 日経XTECH)
 北海道のドラッグストア「サツドラ」がカメラを張り巡らせた店舗を作った。POSデータではつかめなかった来店客の属性や動向を把握できるようにした。取得した新たなデータに基づき、品ぞろえを充実させたり、装飾を変えたりする。

 札幌市郊外の住宅地にあるドラッグストア「サツドラ月寒西1条店」。外観はごく普通の平屋建ての店舗だ。売り場面積は約380坪と東京都内のスーパー並み。多店舗展開する同社の「標準フォーマット店舗」の1つである。

 店内で天井や商品棚の上を注意深く見ると、監視カメラとは別に、正方形の小さな箱状の「AI搭載カメラ」が店内を網羅するように取り付けられている。その数96台。サッポロドラッグストアー(サツドラ)は2018年10月、サツドラ月寒西1条店にAI搭載カメラを稼働させた。2019年9月までに計3店舗に設置した。

 同社はAI搭載カメラを来店客の属性や店内での動向の把握に活用している。例えば入り口付近にあるAI搭載カメラで来店客の属性を把握する。このカメラだけは黒い望遠レンズ付きで、来店客の顔の映像をより詳細に捉えられる。AI搭載カメラ側で性別や年齢を判定し、判定結果だけをクラウド側のサーバーに送る。通信量を減らしつつ、個人情報の漏洩を未然に防いでいる。判定の精度は100%ではないものの、クラウド経由で判定プログラムを随時更新して精度を高めている。

     ホームページへ