週間情報通信ニュースインデックスno.1067 2016/12/03


1.機械学習で精度向上、グーグルがGoogle翻訳の裏側明かす(12.2 ITpro)
 グーグルは2016年12月2日、「機械学習を活用した新製品や取り組み 説明会」を東京・六本木の同社オフィスで開催した。同社の徳生裕人氏(製品開発本部長)らが、各サービスにおける機械学習の取り組みについて、特に11月に精度が大幅に向上した翻訳サービス「Google翻訳」に焦点を当てて披露した。

 米Googleは機械学習の手法の一つであるディープラーニングの適用を増やしている。ディープラーニングは、大量のデータを学習するために、人間の神経回路の構造をモデル化したニューラルネットワークを活用するもの。主に音声認識、画像認識、言語処理などの分野で応用が進んでいる。徳生氏は活用例として、雑音環境下での音声認識の誤認識が減少したなどの成果を披露した。

 さらに、ニューラルネットワークを取り入れたことで11月に新たな成果を上げたのがGoogle翻訳だ。翻訳の品質を0から6の7段階で表す調査をグーグルが実施したところ、新たに新しいGoogle翻訳は従来版よりも有意に品質が高く、人間の翻訳の品質に迫ったという。

 Googleは、従来版にも機械学習の手法を取り入れていた。ただし従来版では 文章を単語ごとに区切り、それぞれの単語を訳して組み合わせる「フレーズベース」のモデルを採用していた。ニューラルネットを採用した新モデルは、同じ文の他の単語とのつながりを基に文脈を学習し、「全体を見てそれぞれの単語をどのように訳したらよいのかを決める」(シニアエンジニアリングマネージャー 賀沢秀人氏。例えば「A、B、Cの順で単語が来た場合は、Aの意味は○○だ」と認識する。この仕組みによって、従来版よりも正確度の高い訳語の候補を見つけ出せるようになった。賀沢氏は 「Google翻訳を長年担当しているが、その中でも飛び抜けて大きな成果だ」と胸を張る。

 この精度が向上した翻訳サービスの技術は、Googleの企業向けサービスにも応用が進んでいる。具体的には、クラウドサービス「Google Cloud Platform」で、翻訳エンジンを呼び出せるAPIサービス「Google Translation API」のメニューの一つとして、ユーザー企業も利用できるようになる。Googleは11月、既存のGoogle Translation APIに「プレミアムサービス」を、ベータ版として11月に追加した。ただし現状はベータ版ということもあり、Google Translation APIの既存顧客に限定した提供という。

2.ジャストシステム、ディープラーニングを取り入れた「ATOK 2017」(12.2 ITpro)
ジャストシステムは2016年12月1日、ディープラーニング技術を搭載した日本語入力システム「ATOK 2017」を発表した。変換エンジンにディープラーニングの仕組みを取り入れたことで、自然な文字変換が可能となったほか、誤変換率を30%引き下げることに成功したという。

 都内で開催された新製品発表会の席上で、ジャストシステムの田食 雅行CPS事業部長は、「一太郎は様々な職種のユーザーが利用しているが、ユーザーごとに求める機能は異なる」と語った。同社の調査によると、チラシなどを制作するユーザーは一太郎のレイアウト機能を、小説家や物書きは創作の邪魔にならないシンプルなUIのエディター機能を利用している、といった利用状況が見えたという。

 田食氏は「一人ひとりに合わせた一太郎を作れないかと考えた」と開発コンセプトを語り、「その実現のために搭載された機能が、『一太郎オーダーメイド』だ」という。

 「一太郎オーダーメイド」には、いくつかの選択肢の中から目的に合う操作環境を選ぶ「かんたんオーダー」と、使用するパソコン、利き手や視力といった身体特性などを細かく設定できる「こだわりオーダー」がある。田食氏は「これらの機能を利用することで、世界に一つだけの一太郎を利用することが可能」と語った。

 「一太郎2017」には、チラシなどの作成に役立つ「きまるフレーム」や、通常の文書校正機能に加えて小説用の文書校正機能なども搭載されている。

  CPS事業部開発部の下岡 美由紀氏は、「ATOKが長年培ってきたアルゴリズムと、ディープラーニングによって抽出した日本語の特徴を組み合わせることで、従来よりも自然な日本語変換技術を開発した」と解説。この技術によって「ATOK 2016」と比べて、誤変換率を約30%引き下げることに成功したという。

3.資生堂子会社で個人情報流出の疑い、最大42万件 脆弱性突かれる(12.2 ITpro)
資生堂は2016年12月2日、子会社の「イプサ」が運営する「イプサ公式オンラインショップ」から、最大42万1313人分の個人情報と5万6121件のクレジットカード情報が流出した可能性があると発表した。資生堂は「システム上の脆弱性を突かれ不正アクセスを受けた」としている。

 流出の可能性がある個人情報は、氏名、性別、生年月日、年齢、職業、電話番号、メールアドレス、住所、ログインパスワード、購入履歴。同サイトに登録している全ての会員データに流出の可能性がある。このうち、2011年12月14日〜2016年11月4日に同サイトでクレジット決済で商品を購入した会員については、上記の他にカード番号、名義、住所、有効期限も流出した可能性がある。

 2016年11月4日に決済代行会社から「クレジットカード情報が流出しているのでは」との連絡を受けたことで発覚。同日に同サイトのクレジット決済機能を停止したうえで、第三者機関への調査依頼や警察・経済産業省などへの報告を順次行ったとしている。対象者に対しては、12月2日から電子メールと郵送で連絡を開始。同日付で電話相談窓口(0120-62-9020)も開設した。「本件対応でクレジットカードを再発行する場合、手数料はイプサが負担する」(資生堂)としている。



4.フィンランド航空が企業向けiOSアプリ導入でIBMと提携、まず整備部門から(12.1 ITpro)
米IBMは現地時間2016年11月30日、フィンランドFinnair(フィンランド航空)の全社的なデジタル移行に向けたiOSアプリケーションの導入で協力すると発表した。

 IBMは、2014年7月に米Appleと企業分野における広範な協業で合意して以降、様々な業界・職種に向けたiOSアプリケーション「MobileFirst for iOS」を展開している。

 Finnairは複数のMobileFirst for iOSアプリケーションを採用する予定で、まず2017年初期に「Inspect & Turn」と「Assign Tech」を航空機整備部門の従業員向けに導入する。

 Inspect & Turnは、航空整備士がiOS端末でデジタルのタスクカードと書類を確認し、分析に基づいたアドバイスの提示によって作業を完了できるようにする。Assign Techは、航空機整備の管理者がフライトスケジュール、メンテナンスプロセス、整備士の作業可能な時間などを把握し、高度な分析によって各スタッフのスキルや資格を考慮した最適なシフトを組めるようにする。

 IBMによると、FinnairはIBMの新たなアプリケーション設計および開発モデル「Mobile at Scale for iOS」を採用する最初の企業となる。同モデルは、複数年にわたって複数のiOSアプリケーションを利用する企業に向けたもので、アプリケーションのライフサイクル全般における設計、開発、導入、保守の速度、効率、品質を向上できるとしている。



5.通信すら飲み込むAmazon、ルーター用半導体も自社開発と公表(11.30 ITpro)
「全世界を100Gビット/秒の専用光ファイバー網で接続」「ルーター/スイッチ用半導体は自社開発」「一つのアベイラビリティゾーンで30万台のサーバーを運用」――。米Amazon Web Services(AWS)でデータセンター(DC)戦略を統括するJames Hamiltonバイスプレジデントは2016年11月29日(米国時間)、「AWS re:Invent 2016」の基調講演で同社のクラウドの衝撃的な内部仕様を明らかにした。

 Hamilton氏はこれまでもAWSの内部仕様を明らかにしているが、同社の大陸間ネットワークの詳細やネットワーク機器用半導体を開発している事実、自社開発サーバー/ストレージの詳細を明らかにしたのは今回が初めて。ライバルである米Googleも最近、DCや自社開発サーバーの詳細を明らかにし始めている。大手クラウド事業者がコンピュータメーカーを上回るハードウエア開発能力を持っているという「公然の秘密」が、いよいよ秘密では無くなってきた。

 Hamilton氏はまず、AWSが運営するDCの成長速度を明かした。それによれば2015年の時点でAWSは、「2005年に『Amazon.com』を運用していたサーバーのキャパシティ」に相当する規模のサーバーを、毎日AWSのDCに追加しているのだという。その結果AWSのDCは、とんでもない規模にまで拡大している。

 AWSは現在、いくつかの「アベイラビリティゾーン(AZ)」において1カ所につき30万台のサーバーを運用しているという。AZはAWSにおけるDCの単位で、一つのAZは複数のDC建屋で構成する。AWSは現在、全世界14カ所の「リージョン」でクラウドサービスを提供しているが、一つのリージョンにつき3〜5のAZが存在する。全てのAZに30万台のサーバーがあるわけではないが、AZが30以上あることを考えると、AWSが数百万台規模のサーバーを運用しているのは間違いない。

 全世界に14カ所あるリージョンに加え、60カ所以上あるCDN(コンテンツ・デリバリー・ネットワーク)などのネットワーク拠点は、100Gビット/秒の専用光ファイバー網によって相互接続している。光ファイバー網は冗長構成になっていて、海底ケーブルが切断したり、中継拠点が使えなくなったりしても通信を継続できる。光ファイバー網は通信会社から借りるだけでなく、ハワイ・ニュージーランド間海底ケーブルなどは、AWSが出資もしている。

 DC間ネットワークだけでなく、DC内ネットワークも強烈だ。AWSはDC内で使用するルーターやスイッチも自社開発しているが、それらは通信パケットを制御する「スイッチングチップ」と呼ばれる半導体(ASIC、特定用途半導体)のレベルまでAWS特注だったのだ。

 最近は台湾のODM(相手先ブランド設計製造業者)から「ホワイトボックス」のスイッチを調達するネット企業も増えているが、AWSの自社開発スイッチはそれらと大きく異なる。一般的なホワイトボックスのスイッチは、米Broadcomなどの半導体メーカーが販売する「マーチャントシリコン(商用半導体)」と呼ばれる市販のスイッチングチップを採用している。それに対してAWSは自社開発スイッチのために、ブロードコムに特注のスイッチングチップを作らせていた。

 BroadcomがAWSの特注で製造したカスタムチップ「Tomahawk」は、70億個のトランジスタを集積し、25Gビット/秒のイーサネット通信を128ポート分処理できるという「モンスターチップ」(Hamilton氏)だった。

 AWSはそれだけでは飽き足らず、2016年にはスイッチングチップを完全に自社開発もしている。同チップは2016年1月に米Amazon.comが買収したイスラエルのAnnapurna Labsが開発したものだ。

 しかしMSやグーグルなどはIEEEとは別に「25G Ethernet Consortium」を立ち上げ、25Gビット/秒や50Gビット/秒の規格を作った。その目的は40Gビット/秒の規格よりもコストを下げることにあった。実際にHamilton氏は「25Gビット/秒の通信を二つ束ねた50Gビット/秒のイーサネット規格を採用した方が、40Gビット/秒のイーサネット規格を採用するよりもコストが安くなった」と語っている。通信規格の主導権すら、ネットワーク機器メーカーなどから大手クラウド事業者に移っていることが明白になった。

 Hamilton氏はAWSのDC内ネットワークが「(2006年に)Amazon EC2を始めたときからSoftware Defined Network(SDN)だった」と明かす。当初は一般的なスイッチとソフトウエアを組み合わせることで仮想的なネットワークを作り出していたが、2012年からそうしたソフトウエア処理を自社開発ハードウエアにオフロードし始めていたという。同社によるネットワーク機器の自社開発はそれ以来のことで、それから4年で半導体開発にまで至ったわけだ。

 Hamilton氏は自社開発のストレージやハードウエアについても詳細を公表した。2014年に開発したストレージは、高さ42Uのラック1本に880台のハードディスクが搭載可能だった。さらに次期モデルの自社開発ストレージでは、1ラック当たりのハードディスク台数が1100台になり、1ラック当たりのストレージ容量は8.8ペタバイト、将来は11ペタバイトにまで増える予定だ。

     ホームページへ