HOME > 研究活動 > 研究レポート > 「ビッグデータ」を世界最速で転送する

平成30年3月14日
「ビッグデータ」を世界最速で転送する
-青森県六ヶ所村にある研究センター等との共同研究-
大学共同利用機関法人 自然科学研究機構
核融合科学研究所
 

 大型ヘリカル装置(LHD)は、核融合科学研究所だけでなく、全国の大学の多くの研究者にも共同で利用されています。また、現在、南フランスに建設中の国際熱核融合実験炉(ITER)が完成して運転を開始すると、全世界の研究者がITERを共同で利用することになります。このような大規模装置を用いた共同研究では、遠く離れた地点からでも実験に参加できる環境を整えることが重要です。そこで必要になるのが、生産される膨大な量のデータ、つまり「ビッグデータ」を高速に遠隔地まで転送することです。今回は、ビッグデータを世界最速で遠隔地まで転送して、遠く離れた地球の裏側からでも共同実験を可能にしようという取組みを紹介します。
まずは、現在のネットワーク技術の問題点を説明しましょう。現在のネットワークは、多くのユーザが同時に通信を行うと、通信同士が衝突を起こして、転送途中のデータが壊れたり失われたりするため、必ずデータの送信元と送信先で、データの受信確認を行っています。この受信確認は、送信先からデータ受信完了のメッセージを受け取ることで行われるので、送信元と送信先の間の距離が長くなるほど時間がかかります。例えば日本~ヨーロッパ間では0.2秒ほどです。受信確認ができるまで次のデータが送れないため、結果としてデータの転送速度は大きく低下します。この問題は、世界に1台といった超大型装置を世界中の研究者が共同利用する加速器・素粒子、天文、核融合など「ビッグサイエンス」の各分野で、特に顕著になっています。
核融合科学研究所では、核融合分野の量子科学技術研究開発機構とITER機構、情報ネットワーク分野の国立情報学研究所と協力して、この速度低下の問題を解決すべく研究を進めています。新たに国立情報学研究所により開発されたデータ転送プログラムMMCFTPでは、数百~数千のアクセスを同時に行い、全体として通信速度が一定になるよう常に調整することで速度低下を克服しました。現在、遠距離データ通信速度の世界記録を更新し続けており、2017年12月には毎秒231Gb(ギガビット)の新記録を達成、これはスマートフォン契約の月々30ギガ(バイト)とほぼ同量を1月でなく1秒で送ったことになります。今回、このMMCFTPを活用して、実際にビッグデータを遠隔地に転送する2つの実験を行いました。
一つめは、南フランスにあるITERから、青森県六ヶ所村にあるITER遠隔実験センター(REC)まで、実際のITER運転を模擬してデータを送信する実験です。ITERから得られるデータ量は、運転開始当初で実験1回あたり約1TB(1テラバイト=1000ギガバイト)、最盛期にはおよそ50TBにのぼると見積られています(なお、LHDでは、平成25年度に実験1回あたり約0.9TBのデータを収集しました。ITERに迫るこの値は、現在もこの分野の世界最高記録です。バックナンバー233をご参照ください)。ITERでの実験がおよそ30分に1回行われると想定して、連続で8時間、16時間、50時間(2日間3交替に相当)の運転を行った場合にデータ転送が可能かどうか検証するため、実際にLHDの実験データ1TBを転送して実験しました。結果は大成功で、あらかじめ設定した毎秒8Gbの上限速度に対して、南フランス(ITER)から六ヶ所村(REC)まで約1万kmの長距離にも拘わらず、平均7.2Gbでほぼ安定した転送速度を得ることができました。連続50時間の試験では、1日あたり50TBのデータ転送量となり、大陸をまたぐ長距離における1日あたりのデータ転送量の世界最高記録を樹立しました。
もう一つの実験は、LHDで毎回得られる全ての実験データを遠隔地の共同研究先まで速やかに転送する試みです。平成29年に行ったLHDのプラズマ実験において、土岐市(LHD)から六ヶ所村(REC)に向けて全ての実験データを即座に転送し、3分に1回の実験周期に対して、2分以内に十分転送が完了できることを確かめました。その後、平成30年2月までかけて、1998年のLHD実験開始から蓄えてきた過去の全データ、およそ430TBの転送も完了しました。こうした長期間の転送実験によって、MMCFTPのような高速データ転送プログラムだけでなく、データを読み書きする保存装置や中継機器の速度も重要であることが、改めて明らかになりました。
これら2つの実証実験で得られた成果は、ITERとRECにおける研究のみならず、LHDをはじめとする国内外の大規模装置の遠隔実験・共同研究に貢献することが期待されています。

以上

図1. ITER実験開始時を模擬したITER(フランス南部)→ REC(青森県)の長時間連続データ転送実験では、30分に1回の周期で8時間、16時間、50時間の連続転送を行い、1日あたり50TBの世界記録を達成しました。