データベース2.0?低コスト高スペックなデータベースの世界

投稿者:chikunai 投稿日時:2010-06-16(水) 00:41

ムーアの法則どおり、IT技術の向上は目まぐるしいものがあります。

データベースもその一つ。より身近で、低コストで、高機能で、高いパフォーマンスのデータベースが手に入るようになりました。

良い時代だなと、最近つくづく思います。

 

1.2.5インチHDDの普及でコンパクトなデータベースサーバ誕生

iPodが採用した2.5インチHDDが、サーバの機器にも普及してきました。

サン・マイクロシステムズのSun Fire X4170 Serverは、1Uでありながら2.5インチHDDが8個も搭載できます。

IBMのIBM System x3650 M3は、2.5インチHDDが16個も搭載できます。

データベースのボトルネックの1番は、今も昔もHDDのI/Oです。HDDの本数を増やして、I/O負荷を分散させるのが常套手段です。一昔前(5年前)であれば、1UはHDD 4個、2UはHDD 6個が限界でした。データベースサーバとして考えると、1Uでは能力不足、せいぜい2Uからです。中規模・大規模になるとSANなどを使った外付けストレージが必要でした。

1Uであれば、8個中2個をRAID 1でOS、残り6個をRAID 5またはRAID 6にして、データベースの領域として使えます。1個はホットスペアかな。

2Uであれば、16個中2個をRAID 1でOS、残りをデータベースの領域として、データ用HDD、ログ用HDDなどとして、14個を割り振れます。

 

2.メモリがさらに格安

メモリは以前からも安いですが、データベースサーバには充分すぎるほど、たくさん搭載できるようになりました。

データベースのボトルネックの2番目は、メモリです。利用用途にもよりますが、HDDのデータをキャッシュさせる役割を担います。I/O負荷を下げます。

純正でなければ、8GBが10万円を軽く切ります。

64bitのCPUと64bitのOSであれば、安いメモリが大量にサーバに搭載できます。

 

3.オープンソースのデータベースが高機能化

MySQL、PostgreSQLが、かなり高度な機能を実装してきました。

MySQLは、4.xからサブクエリーの追加、5.xからビューの追加。

PostgreSQLは、古くからトランザクションをサポートしていましたが、8,2から、8.4からWindows関数の追加。

OracleやDB2など、商用データベースに引けを取らない機能を実装してきています。
 

4.格安のデータウェアハウス用データベース

データウェアハウス用データベースって高価です。

Teradata、Hyperion、Oracle Exadata、Infosphere Warehouse、Red Brick、Sybase IQなどなど。

噂によると、Teradataは5億円以上するらしいです。

MySQLやPostgreSQL自身でもデータウェアハウス向け機能として、テーブルパーティショニング機能を実装しています。前述のハードウェアと組み合わせても充分パフォーマンスが出せます。

さらに、オープンソースをベースにしたデータウェアハウスが出てきました。

PostgreSQLベースのGreenplum。MySQLベースのInforbright。少なくとも1億以下から始められそうです。

 

良い時代になったなと、最近つくづく思います。

一方で、データベース管理者・技術者という職業は、変化を迎えていると思います。

今までは、低スペックのサーバをチューニングして、いかに効率よくデータを管理するか、それが仕事でした。

レコメンドとか、併売分析とか、

これからは、大量のデータを効率よく蓄積しつつも、BIやマイニングを利用してデータをいかにビジネスに結びつけるか。ではないでしょうか。

データベースのアプライアンスの登場で、細かいチューニングに気にしなくても、パフォーマンスの出せるようになってきているようです。(売るほうにとっても、アプライアンスの方が売りやすいという側面もありますが)

そして、その次に来るのはリアルタイム処理。リアルタイム・コンピューティングか。