データ活用を妨げている3つの原因と課題

 では、データ活用の本来あるべき姿とはどんなものでしょう。もっとも重要なポイントは、「データソースと使い手の間を、どれだけシンプルにできるか」にかかっています。保健所ならば、データをファックスで送ったり、手入力するプロセスをデジタルで効率化すること。

 一方ではアナリストや医師、研究者が最新のデータをすぐに利用できる仕組みを構築すること。この成否こそが、データに基づいた新型コロナ対応のカギとなると言っても過言ではありません。

 しかし現状はコロナ対応だけでなく、ビジネスのあらゆる場所で「データを使いたい時に使えない」ケースに遭遇します。それには、以下の3つの原因と課題があります。

①データの出自:データはみんな生まれてくる場所がバラバラ
 店舗の購買履歴やWebのアクセスログ、はたまた人の移動情報など、あらゆるデータは生まれてくる場所が違う。出自も形式や特性も異なる膨大なデータを集約し、一元的に利用できるようにするには、高性能サーバーや大容量ネットワークなど大きなコストが掛かる。

②サイロ化:生まれる場所が違えば、必然的にデータはサイロ化する
 よく見られるのが、企業の各部門や拠点のデータが個別に蓄積され、統合しようとしても技術的、費用的な問題が山積みというケース。この状態が長年続いたまま、必要だとわかってはいても、全社でのデータ連携や活用などは夢のまた夢。

③共有のハードル:データの共有は技術的にも費用的にも困難だらけ
 システムを超えたデータの共有と口で言うのは簡単だが、実現しようとするとAPI開発などが避けられない。何とかつなげても、更新頻度などの運用ポリシーや、データ転送の帯域不足、セキュリティの問題などでうまくいかない。

 近年のクラウドの登場は、こうした問題を一掃するかに見えました。たしかにクラウドならば容量不足は心配ありません。にもかかわらず、上の三つの問題が解決できないのは、次々に発生するデータと、それを格納するインフラ間のプロセスが、依然として複雑だからです。ここを一気にシンプルにして、データソースから利用者までを最短距離で結ばなくてはなりません。

データの民主化を可能にするデータ・クラウド

 そうした課題を一挙に解決するのが、Snowflakeのデータ・クラウドです。ここではクラウド上に構築された専用のデータウェアハウスに、あらゆるデータが一つに統合・格納されています。ここには、さまざま場所からデータが集められ、利用者はパソコンやモバイル端末などさまざまな端末からアクセス可能です。

 プラットフォームを選ばないのも、Snowflakeの大きな特長です。GoogleやAWS、Microsoft Azureなどのクラウドを自由に選択でき、どれでもまったく同じに動くよう設計されています。これまでのように、プラットフォームの仕様や機能にデータの活用が制限される懸念はまったくありません。まさにデータドリブンな世界が実現されています。

 また、プラットフォーム連携も自由です。たとえばデータ連携しようとする相手の環境がGoogleで自社がAWSでも、違いを意識する事なく連携できるため、ユーザーにとっては、データセントリック(データを中心に置いた)で、なおかつ無限のコンピューティングリソースが提供されます。

 そしてもう1つのSnowflakeの提供する価値が、マルチクラウド/マルチリージョンです。現代のビジネスには、国や地域をまたいだシームレスなデータ環境が不可欠です。地球上のあらゆる地域で利用できるデータ・クラウドが、グローバルビジネスに大きな価値をもたらしてくれます。