”データの洪水”を解決し、
リアルインテリ
ジェンスを導きだす礎になる
MarkLogicとMarkLogicのロゴは、
MarkLogic Corporationの商標です。
MarkLogicとは
MarkLogic(マークロジック)は
NoSQL(ノーシーケル)という
分野の新しいデータベースです。
NoSQLの定義は非常に広く「RDBではないデータベース」はすべてNoSQLに分類されます。NoSQLは大きく、キー・バリュー型(KVS)、ドキュメント型、グラフ型の3つに分類されますが、MarkLogicはドキュメント型データベースとして出発し、グラフ型やRDBとしての機能も追加していきながら、マルチモデル・データベースとして非常にユニークなポジションを確立しています。
従来型のRDBの制約を超え、多様なデータを即時に取り込み、自在に高速に検索する。変化に富んだ時代にあって、目まぐるしく変化するビジネスニーズに、リードタイムを限界まで極小化して対応させることが可能です。
スキーマレスが可能にする
アジリティ
MarkLogicの最大の特徴は
「スキーマレス」だといえます。
従来型のRDBでは、データを登録するに先立って、カラム名、データ型、データ長、NOT NULLやUNIQUEなどの各種制約といったスキーマの定義が必要になります。これにより、定義に矛盾したデータの登録を排除してくれるメリットがあります。一方でMarkLogicは、スキーマの事前定義が不要で、まるでファイルサーバのディレクトリにファイルを格納するかのように、気軽にデータを登録することが可能です。
この「スキーマレス」のパワーにより、ソースデータの追加やレイアウト変更、アプリケーションの仕様追加等に対する柔軟性が飛躍的に向上、「名寄せ」や「コードの標準化」も「優先度の高いものから段階的に実施する」という現実的な方法を採用できます。ビジネスの変化にリードタイム無しでの即時対応を可能とするのです。
インデックスが実現する
多様な検索
MarkLogicでは、データ登録と同時に
ユニバーサル・インデックスなど
多様なインデックスが張られます。
このインデックスのパワーにより、
多様で多軸なリアルタイム検索を
実現します。
多様な検索とは、「完全一致検索」のほか「あいまい検索」「以上・以下のレンジ検索」「東京駅から半径3km圏内の地点」などのバリエーションです。多軸な検索とは、「どのような項目(RDBでいうカラム)でも検索できる」「様々な項目を組合せられる」という意味です。
「スキーマレス」と「多様で高速な検索」
を両立する、数少ない選択肢のひとつが
MarkLogicです。
「スキーマレス」を標榜するNoSQL製品、データレイク製品の中には、そもそも検索機能を持たないもの、検索機能に重要な制約があるもの、ACIDがサポートされておらず登録直後のデータが検索ヒットしないものなどがあります。
セマンティクスによる
データの関係性理解
MarkLogicはセマンティクスを活用した
トリプルストアとしての機能も
有しています。
セマンティクスとは、すべてのデータを「主語・述語・目的語」の形式で保持し、RDBでいう「エンティティ間の結合(JOIN)」を意識せずに自在にデータ抽出できる技術です。このデータ形式を「セマンティクス・トリプル」と呼びます。MarkLogicは、XMLやJSONといったファイルを検索するドキュメント型DBとしての側面の他、セマンティクス・トリプルの形式のデータを自在に検索するトリプルストアの機能も有しています。
セマンティクス技術を活用することで、
格納したデータ間の関係を把握し、
より高度なデータ検索を可能にします。
例えばNTTデータでは、「DWH」で検索した場合に「データレイク」についてのデータも関連情報としてヒットさせるようなソリューションを独自に開発し、実現しています。
セマンティクスによるデータ間の
関連付け
シェアード・ナッシングで
リニアにスケール
データベースの分散システム構成方法
として、
MarkLogicはシェアード・
ナッシング方式を
採用可能です。
これにより、サーバ台数の追加に応じて
リニアに
性能がスケールします。
データベース製品の分散システム構成は「共有ディスク方式」と「シェアード・ナッシング方式」に大別できます。
共有ディスク方式は、一般的なOLTPデータベース製品で採用されているアーキテクチャで、複数台構成を構築してもディスクI/Oがボトルネックとなり性能向上が頭打ちになります。
一方で、シェアード・ナッシング方式はサーバの追加に応じてリニアに性能がスケールします。MarkLogicはどちらの方式も採用可能ですが、データレイクとして活用する場合は、上記の理由からシェアード・ナッシングの採用を推奨します。
米国・国防総省で採用される
高いレベル
コモン・クライテリア認定を取得した
唯一のNoSQLデータベース
大量のデータを収集した場合、そのセキュリティは非常に重要です。
機密データを限定されたメンバにのみ参照可能とするアクセス制御、万が一ディスクが持ち出されても情報が抜き取られない暗号化、社内や当局または業界の要求水準に応じた監査証跡、正確な本人確認のための外部認証との連携、権限に応じた特性のデータ項目のマスキング…
これら多くの機能が要請されるセキュリティについて、各国のバラバラだった認定基準を共通化・標準化したものが「コモン・クライテリア認定」であり、MarkLogicはこの認定を取得した唯一のNoSQLデータベースです。
NTTデータ×MarkLogic
NTTデータは、MarkLogicの
パートナー(販売代理店)です
NTTデータは、2012年にマークロジック社とパートナー(販売代理店)契約を締結しています。MarkLogicの特長を活かし、社内外のデータをデジタルトランスフォーメーションするソリューション、あるいは情報系システム更改のデータ統合ソリューションといったさまざまなサービスを提供しています。
活用方法
本連載では「MarkLogic 」について、
必要最低限のクエリを例示しながら
機能面の概観を見ていきます。
-
- MarkLogicを購入したい場合どうずればよいでしょうか?
- 弊社を含むパートナー(代理店)にご相談ください。弊社であれば、こちらまで。
-
- MarkLogicの価格は?
-
MarkLogic社Webサイトをご参照ください。
弊社を含むパートナー(代理店)にお問い合わせいただければ詳細なお見積もりを提示させていただきます。
-
- クラウド環境でも使えますか?
- はい、利用可能です。
-
- 誰がMarkLogicを使っているの?
-
業態、業界を問わず様々なユーザにお使いいただいております。
詳細はMarkLogic社Webサイトをご参照ください。