増大を続ける企業データだが、その内容は変わりつつある。非構造化データが占める割合が構造化データを上回り、今後もさらに伸びていく見込みだ。メール、文書、画像などファイルベースの非構造化データは、種類が多様、作成者や管理者が不定など、構造化データとは特徴が異なり、管理が難しい。
ビッグデータ時代に新しいビジネスチャンスを創出するには、構造化データはもちろんのこと、非構造化データも効率的に管理することがポイントとなる。IDCの調査を基に、ファイルデータ管理のソリューションを考察する。
(注) 本連載ではIDCのレポートを基に、中小規模の企業=1~999人以下、大規模の企業=1,000人以上と定義している。
企業ではどのようにファイルデータを管理しているのだろうか。まずはファイルデータ管理に使われるストレージに着目したい。 IDCは「ファイルデータ管理で利用しているストレージインフラ」という調査を行っている。
結果を見ると、ファイルサーバとそこに接続しているストレージを利用するか、NASを利用するかに大きく分かれる。NAS(Network Attached Storage)はネットワークに直接接続可能なストレージで、NFSやCIFSなどのファイルシステムを備えている。ファイルサーバを別途用意しなくてもファイルデータを管理できることから、近年導入する企業が増えている。中堅中小企業はPC周辺機器ベンダーのNAS製品、大企業は容量が大きく高機能なストレージベンダー製品を選ぶ傾向にあるようだ。
では、企業はこれらのストレージをどのような基準で選択しているのだろうか。「ファイルストレージの選択基準」という調査の結果を見てみよう。
「システム価格」との回答が圧倒的に多く、次が「大容量」である。さらに「セキュリティ」「運用/管理コスト削減効果」が続くが、これらの回答は企業がファイルデータ管理に関してどのような課題を抱いているかを表している。すなわち、企業がファイルデータを管理するためのストレージに求めている条件は、限られた予算内で導入できること、増え続けるデータを格納できる容量、ファイルデータ管理の課題を解決できる機能であると言える。
ファイルデータを効率的に管理するためにはどのような課題を克服しなければならないのか。次は、「ファイルサーバ/NAS管理の課題」の調査結果である。
「データ量増大への対応」「バックアップの効率化」「セキュリティ対策の強化」の回答が多い。昨年の同課題に比べ災害対策も上位に挙げられるなど、一見すると「ストレージ管理の課題」と同じようだが、非構造化データの特徴を考えると同じ課題でも異なる側面が浮き彫りになる。
ファイルベースの非構造化データは多種多様であり、企業内のあらゆる場所で生成される。そのため、情報システム部が管理するデータベースなどの構造化データと異なり、データが増える容量や時期などを予測しにくく、ストレージの容量計画を立てるのが難しい。データ量増大の課題については、企業で扱うデータの種類を把握し、データ容量を計画するほか、容量の拡張が容易なスケールアウト型のストレージの導入を検討するといった対策も必要になる。
災害対策のひとつ、バックアップについても同様のことが言える。生成されたすべてのデータを同じ方式、頻度でバックアップすると容量コストの問題や、時間超過で業務への影響も生じる。データの重要度に応じてバックアップの頻度を変えたり、更新差分のみを取得するなどの方式の検討も必要である。また、データ重複を排除する技術を利用して保管効率をあげることや、オフラインストレージと組み合わせて重要度の低いデータを保管するなどの対策が必要である。
セキュリティについても十分な配慮が必要だ。ファイルデータを一元管理しているファイルサーバやNASでウイルスチェックを行っていても、ウイルスに汚染されたファイルが利用者によって書き込まれるとすべてのデータに感染する危険がある。利用者によるファイルデータの漏洩のリスクも否定できない。アンチウイルスソフトや認証システムの導入といった技術的な対策だけでなく、セキュリティを確保するためのポリシーを作成し、利用者に対して順守を徹底する必要がある。
ファイルデータ管理を効率化するソリューションの1つに、ファイルサーバ統合がある。ファイルサーバやNASを部署ごとに導入している状況では、管理が煩雑になり手間とコストがかかる。バックアップやセキュリティの課題を抱える場合も多い。そこで高機能・高性能な専用NASを導入してファイルサーバ機能を統合し、ファイルデータ管理を一元化して効率化しようというのがファイルサーバ統合である。
IDCの調査「ファイルサーバ統合の実施状況」では、「ファイルサーバ統合を実施した」と回答した企業は中堅中小企業で17.7%、大企業で28.1%、「統合を計画している」と回答した企業は中堅中小企業で34.9%、大企業で20.9%に上った。この結果からファイルデータ管理の効率化に効果を発揮すると思われるが、ファイルサーバ統合を行うにあたり次のような課題がある。
既存システムからの移行の難しさ、統合やデータ移行にかかるコストなどを課題とする企業が多い。ファイルサーバ統合は、複数の部署、場合によっては距離の離れた複数の拠点間での調整が必要であるため、導入が容易であるとは言い難い。しかし、ファイルサーバ統合の結果、
といった成果を得られたとの調査結果(IDC「ファイルサーバ統合の成果」)もあることから、検討に値するソリューションと言える。
ファイルベースの非構造化データは、構造化データとは特徴が異なり、管理が難しい。雪だるま式に増え続けるファイルデータを効率的に管理するには、どこでどのようなデータが生成されるのかを認識し、データの重要度に応じてバックアップの頻度や保管方法を変更するといった対策が必要である。1つの汚染ファイルがファイルサーバやNAS上のファイルに影響を及ぼす可能性があるため、ポリシーを定めてウイルスチェックや認証をしっかりと行い、セキュリティを確保する必要もある。
ファイルデータ管理を効率化するためには、容量を柔軟に拡張できるスケールアウト型ストレージの導入、複数のファイルサーバを統合するファイルサーバ統合、複数のストレージを仮想的にまとめて大容量のストレージとして扱うファイル仮想化といったソリューションも検討するとよいだろう。
富士通は増え続けるファイルデータを効率的に管理し、運用するためのソリューションを提供しています。
ETERNUS NR1000 seriesは、ファイルサーバに特化し、高速な処理を実現したネットワークディスクアレイです。容量の拡張性はもちろん、リアルタイムにウイルスを検索・駆除するセキュリティ機能、バックアップ、災害対策に有効な機能などを豊富に備えています。
また、セキュリティを重視するお客様に「機密情報保護&共有ソリューション」を提供しています。ファイルサーバに保存した共有ファイルをDRM(Digital Rights Management)技術で利用権限を設定し、暗号化することで、ファイルデータを保護するソリューションです。利用者や管理者の負担を増やさずに導入することができます。
掲載日:2014年2月14日