ストレージについて考える

久々の投稿、日々の手帳のはずが月々の手帳になっていますね。少しずつ時間が取れるようにしていきたいと思います。

 

今日はあるセミナーに参加をして共有ストレージを中心に話を聞く事ができました。

VMwareのストレージ周りの話が主な内容なのかと思っていましたが検証自体はHyper-VでClusterを組んで構築するHP Lefthandという内容でした。LefthandについてはHPのサイトを見てもらった方がよっぽど分かりやすい記事があると思いますのでここでは書きません。

が、共有ストレージの基礎知識というところでは色々と勉強する事ができました。

講師の方もおっしゃっていましたがストレージってなかなか個人のレベルで検証という訳にも行かず一度構築したらなかなかやる機会が無いと思うので貴重なセッションだったと思います。

 

色々と聞く中でも特に残ったのがRAIDを組んだ際にHOTスペアを自動で組み込まないようにという点。HOTスペアを組むという事はディスク障害が起こったときにスペアへ自動回復が実行される。これが結構時間がかかる事がある。最近はディスクの容量が増えてきているので余計に時間がかかるようでその点が結構問題になる事があるようです。

そういえば過去に・・・

実際のところRAID5ってどれだけ使われてるのかなと疑問に思う事はある。ディスクの本数は稼げるけど復旧するときディスクへの負荷がかかる訳でそれが元で逝ってしまうなんてことも。

かといってRAID6で組んで2本あるから大丈夫とか。。。でも結局同じ時期に購入したディスクだと仲良く逝ってしまうなんてこともあるのかもと考えるとどうしてもRAID1+0と考えてしまう訳ですが。

 

そうそう、あとデータセンターにある色々なラックを見ると組んだ人の思想が分かって面白いっていのが残ってる。確かにそうですね。

 

ここからはメモ調で

ストレージとはデータをためておくところ。

共有ストレージとは一つの場所にあるデータを複数のホスト(サーバー)からアクセスして使う仕組み。

 

複数台ある各サーバーにディスクを山盛り積んで各サーバーでRAID組んで障害が起こったら交換、台数が増えれば増える程ディスクの本数は増えるわラックスペースは取るわと効率が悪くなる。だからデータをストアする専用のストレージを用意してそこでRAID組んでサーバー側はディスクを減らして処理だけをしてもらうといった分業作業にするといいよねという考え方がひとつある。

あとはデータを統合する事で必要なデータの容量が増える。当然データが増える。増えたら増設したい。そこで増設するための仕組みがある。

もっと言うとロードバランス負荷分散、もっともっと、とりあえず形式上のサイズきめといて後で足りなくなったら追加するよっていう機能(シンプロビジョニング)とか。重複排除まではいいですね。

 

では、ストレージを組む際に何を考えたら良いのか。結論から言うとケースバイケース。

ポイントはディスク容量、IOアクセスの速度、耐障害性、の3つ。用途によってこのバランスが変わってくる。

そのサーバーは何に使うのか。そのサーバーは障害時に止める事ができるのか。そのデータにはどのようにアクセスし読み書きするのか、によってどの接続方式が良いのかどのディスクを使うのが良いのかが決まってくる。例えばHDD一つとっても15rpmと7.2rpmでどれだけの性能差があるか。単純に考えれば倍です。rpm(回転数)を多くしようと思えば当然データの容量は小さくなる。

 

色々な方法や仕組みがあるけれど、大事なのはデータをいかに保護するかという事が最大の目的。データを守って、障害が起きたら迅速に安全に復旧するこれが一番。

 

ストレージだって壊れることはある。

 

だからこそ用途次第ではストレージを使わないで一つのサーバーにディスクを積んでその構成にあった役割で使うという手もある。最近はハードの単価も下がりスペックもいいので特に小規模であればこれで十分というところもある。

結局、コストと要件に見合ったところ、どこで落とすかを考えて選定する事が大事なんですね。