<E-Mailによる情報 No173>
HOME > 研究活動 >> 研究活動状況 >> 膨大な量の実験データを扱う −実験データ集録システム−  

平成24年4月9日

膨大な量の実験データを扱う −実験データ集録システム−

 

 

  大学共同利用機関法人 自然科学研究機構
 

核融合科学研究所

 大型ヘリカル装置(LHD)では、大量の実験データを取り扱います。実験装置や計測器から出てきた膨大な量の実験データを適切に集録・解析することによりはじめて、実験結果を研究成果に結びつけることができます。今回は、コンピュータを使って実験データをどのように取り扱うかについての研究を紹介します。

 LHDから出てくる膨大な量の実験データを扱っているのは、じつは大型のスーパーコンピュータではありません。LHDでは多くの計測器が動いていて、実験によりプラズマを生成するのに合わせて、一斉に計測されたデータを出します。計測器の数は毎年少しずつ増えてきており、平成23年度にはついに100台の大台を突破しました。1台の計測器にも平均して40個程度の計測素子(チャンネル)がついており、また、それぞれ千分の1秒から百万分の1秒毎に高速で計測しているので、どんな大型コンピュータでもとても処理しきれない膨大なデータ量となります。そのため、計測器1台ごとにコンピュータを1台つないで、実験と同期をとりながら、多数のコンピュータが並行してデータを収集・保存します。こうした方式を「並行分散処理」と呼び、LHDでは現在、100台以上のコンピュータを用いて行っています。台数は多いですが、使用しているのは一般家庭で使われているのと同じパソコン(PC)です。
 さて、100台以上のPCをすべて把握して、毎日約8時間、連続して運転を行うのはとても神経がすり減る作業です。こうした状況に対して、最近、たくさんのPCを雲(クラウド)状の集団として運用する「クラウド技術」が注目されています。そこで、LHDでもこうした最新のコンピュータ技術をデータ収集・保存に応用する研究を進め、平成23年度には、データ計測だけではなく、データ保存装置のクラウド化にも世界に先駆けて成功しました。
 データ集録システムの基本となるコンピュータ技術は、一般に、扱うデータ量が一桁上がるたびに、新しい世代に移行するといわれます。LHDの実験開始から15年を経て、今回の「クラウド技術」を基本とした新システムは、ちょうど第三世代にあたります。およそ5年ごとにデータ量が一桁増え、それに追随するように第二、第三世代へと技術を刷新してきました。
 現在、収集したデータは圧縮して、ブルーレイディスク(BD)に長期保存していますが、実験データは増え続けているため、平成23年度には、ついに1日分のデータが50 GBのBDで約50枚分となり、24時間で書ききれなくなってしまいました。これは、翌日の実験に影響を与えかねないばかりか、状況が悪化すれば、LHDの実験スケジュール全体に遅れをもたらすおそれもあります。大切な実験データを今後どのような技術で長期保存していくのか、早急な技術開発と重大な決断に迫られています。こうした絶えまない技術革新の積み重ねが、LHDのプラズマ実験における数々の研究成果を支えています。


以上