ZFS on Linuxの話 - Adwaysエンジニアブログ

こんにちは、チーフSEの孟です。

今日はファイルシステムについて、お話したいと思います。

ZFSっていうファイルシステムですが、これは非常に素晴らしいファイルシステムです。もっと使われても良いんじゃないでしょうか！？

ZFSの何が素晴らしいかと言うと、PCパーツ販売店で買った数万円のパーツで、商用で販売している数百万円、数千万円のストレージサーバーと同じ機能を持つ高性能、高冗長性ストレージサーバーを作ることが出来るんです。

まず、ZFSの優れた機能の１つにRAIDがあります。

LinuxではよくLVMが使われています。LVMもソフトウェアRAIDが組めますが、RAID 0、RAID 1、 RAID 01に限られてます。

ZFSではRAID 0、RAID 1、 RAID 01はもちろんRAID 5、RAID 6、RAID Z、RAID Z2も組めます！（RAID-ZはRAID 5の書き込みホールをソフトウェアだけで解決する、世界初のソリューションです。RAID 5 アルゴリズムの弱点を克服したのがRAID-Zです）

ZFSのメリットRAIDだけではありません、ほかにも沢山のメリットがあります。

①重複排除機能＋ RAID Z

このZFSで組んだ共有ストレージサーバにファイルを保存しても、容量は殆ど増えません。

例えば営業さんのメールをバックアップしようとした場合。１人分のデータが１０ＧＢとすると、１００人分をバックアップした場合１ＴＢの要領が必要です。メールのデータはメーリングリストやCC、BCCで配信されたメールが殆どです。ということは重複率が高いですよね。全員分のデータを圧縮すればいいかもしれませんが、圧縮ファイルはよく壊れるのであまり使いたくありません。

ここでZFSで組んだ共有ストレージを使ってみましょう。１００人のバックアップを重複率70%で想定して計算すると、なんと300GBまで集約できるんです。

700GBの差はすごいですね！

こういう機能をＰＣパーツ販売店で購入した数万円のハードでも実現できるなんて、魅力的ですね。パーツに不安を感じるかもしれませんが、まぁRAID 01かRAID 6を組めば大丈夫でしょ。

②圧縮機能

上の例で話したケースでは、さらにZFSの圧縮機能をONにすることで、ディスクの使用率をさらに高めることができます。ZFSが自動的に保存されたファイルを圧縮するので、ユーザの操作は一切必要ありません。圧縮機能を使うとCPUを食いますが、アーカイブデータ等の長期的な保存には適してます。

③その他

・チェックサム64ビット化

・ホットスペア（動いてるままディスク交換が可能）

・コピーオンライト（大きいファイルをコピーする途中で、ソース元のデータ変更したとしても大丈夫）

・クローンプロモーション

今まで高価な商用ストレージでしか実装されてない機能が、ローコストで実装できるようになります。そこが素晴らしいです。

さて、ここから話が変わります。