PICK UP!
2023.02.21
スーパーコンピュータとデータサイエンス【データサイエンスの未来】
コロナ禍の中、スーパーコンピュータ「富岳」による飛沫のシミュレーションがマスコミに多く取り上げられ、スパコンという名称もよく知られるようになりました。さて、「スーパー」なコンピュータということですが、何がスーパーなのでしょうか?(理化学研究所計算科学研究センター 副センター長 佐藤三久)
コンピュータの性能は、1秒間に何回の演算ができるかという速度で測りますが、今のパソコンは普通のものでも100億回の演算ができ、数十年前のスパコンに匹敵する性能になっています。「富岳」は、50京回の演算速度を誇り、パソコンの数十万倍の速度です。明確にスパコンの定義があるわけではありませんが、同時代の普通のコンピュータよりはるかに計算が速いコンピュータのことです。
では、スパコンとはどのようなコンピュータなのでしょうか?実は、現在のスパコンは通常のパソコンに使われているチップをたくさん集めて高速のネットワークで繋いだものです。どのくらいたくさんかというと、「富岳」の場合は16万個のチップを結合したものになっています。一つ一つのチップは、通常のパソコンに使われているものと大して違いません。膨大な計算をたくさんのコンピュータチップに振り分けて計算するのですが、全部のチップの計算性能を合わせれば1秒に数十京回の演算にできるというわけです。
たくさんのコンピュータチップからなるスパコンは、演算性能だけではありません。データを処理するためには演算だけでなく、メモリからデータを読み書きする必要がありますが、一つ一つのチップでメモリからデータを読み書きして、全体としては膨大なデータを処理することができるようになります。
データサイエンスは、コンピュータを用いて大量のデータを解析し、知識を獲得、それを活用する科学です。コンピュータの進歩がこれまで時間がかかってできなかった計算を可能とし、現在のデータサイエンスを生み出す大きな力になってきました。AIの代表的な技術である深層学習はもともとグラフィックス処理に使われていた技術を使って高速化することで可能になりました。グーグルに代表されるインターネットの検索は、世界のどこかにあるデータセンターで処理されていますが、実はこのシステムは大量のコンピュータが結合したもので、スパコンと同じ技術を用いて大量のデータ処理が行われています。コンピュータの更なる高性能化・高機能化が、新たな未来のデータサイエンスを生み出す力となることを期待したいと思います。
【健康データサイエンス学部HPはこちら】