
本コンテンツは、2020年8月31日に開催されたJBpress主催「Digital Innovation Forum 2020 <夏>〜デジタル変革によるイノベーションの実現〜」での講演内容を採録したものです。
Snowflake株式会社
シニアセールスエンジニア
K T 氏
人々を煩雑なデータ処理から解放するには?
企業や組織によるデータ活用がますます加速する中、データドリブンの文化が拡がりつつあります。近い将来、データこそは世界でもっとも貴重な資源になると言われており、この先もデータは急速に増え続けていくのは確実です。ある調査によると2025年には、全世界のデータ量は163ゼタバイト(1,630テラバイトに相当)に達すると予想されています。
にもかかわらず、データをビジネスに活用する試みは、これまで決して順調とは言えませんでした。ガートナーの調査では、ビッグデータプロジェクトの85%は序盤で失敗しています。
エンタープライズデータの60~73%は利用されておらず、72%の企業はデータドリブン文化に達していません。さらにデータ分析から得られた洞察の80%は、2022年までビジネス上の利益をもたらすことができないと予測されています。
こうしたジレンマが端的に現れたのが、今回の新型コロナウイルス禍です。この数カ月間、公的機関やボランティアも含めた世界中の人々が感染状況などを全力で分析し、そのデータを広く共有してきました。
しかしその成果は余りにも膨大な、そして地道な努力の上に成立しています。ある人は手動で毎日データの可視化グラフなどを更新したり、突然データソースの集計方法が変更されて、これまでの処理ができなくなったりと苦労の連続でした。
ここでの問題は、そうしたデータを収集・処理する作業が、そのデータを活用する人々のより本質的な仕事の妨げになっているという事実です。東京都の保健所では、新型コロナの情報をいまだにファックスと手入力で行っています。
この労力が、コロナ禍への対応のエネルギーを大きく削いでいるのは間違いありません。こうした人々を、データの単純な処理作業から解放することが、真のデータドリブンな世界を実現する第一歩なのです。
データ活用を妨げている3つの原因と課題
では、データ活用の本来あるべき姿とはどんなものでしょう。もっとも重要なポイントは、「データソースと使い手の間を、どれだけシンプルにできるか」にかかっています。保健所ならば、データをファックスで送ったり、手入力するプロセスをデジタルで効率化すること。
一方ではアナリストや医師、研究者が最新のデータをすぐに利用できる仕組みを構築すること。この成否こそが、データに基づいた新型コロナ対応のカギとなると言っても過言ではありません。
しかし現状はコロナ対応だけでなく、ビジネスのあらゆる場所で「データを使いたい時に使えない」ケースに遭遇します。それには、以下の3つの原因と課題があります。
①データの出自:データはみんな生まれてくる場所がバラバラ
店舗の購買履歴やWebのアクセスログ、はたまた人の移動情報など、あらゆるデータは生まれてくる場所が違う。出自も形式や特性も異なる膨大なデータを集約し、一元的に利用できるようにするには、高性能サーバーや大容量ネットワークなど大きなコストが掛かる。
②サイロ化:生まれる場所が違えば、必然的にデータはサイロ化する
よく見られるのが、企業の各部門や拠点のデータが個別に蓄積され、統合しようとしても技術的、費用的な問題が山積みというケース。この状態が長年続いたまま、必要だとわかってはいても、全社でのデータ連携や活用などは夢のまた夢。
③共有のハードル:データの共有は技術的にも費用的にも困難だらけ
システムを超えたデータの共有と口で言うのは簡単だが、実現しようとするとAPI開発などが避けられない。何とかつなげても、更新頻度などの運用ポリシーや、データ転送の帯域不足、セキュリティの問題などでうまくいかない。
近年のクラウドの登場は、こうした問題を一掃するかに見えました。たしかにクラウドならば容量不足は心配ありません。にもかかわらず、上の三つの問題が解決できないのは、次々に発生するデータと、それを格納するインフラ間のプロセスが、依然として複雑だからです。ここを一気にシンプルにして、データソースから利用者までを最短距離で結ばなくてはなりません。
データの民主化を可能にするデータ・クラウド
そうした課題を一挙に解決するのが、Snowflakeのデータ・クラウドです。ここではクラウド上に構築された専用のデータウェアハウスに、あらゆるデータが一つに統合・格納されています。ここには、さまざま場所からデータが集められ、利用者はパソコンやモバイル端末などさまざまな端末からアクセス可能です。
プラットフォームを選ばないのも、Snowflakeの大きな特長です。GoogleやAWS、Microsoft Azureなどのクラウドを自由に選択でき、どれでもまったく同じに動くよう設計されています。これまでのように、プラットフォームの仕様や機能にデータの活用が制限される懸念はまったくありません。まさにデータドリブンな世界が実現されています。
また、プラットフォーム連携も自由です。たとえばデータ連携しようとする相手の環境がGoogleで自社がAWSでも、違いを意識する事なく連携できるため、ユーザーにとっては、データセントリック(データを中心に置いた)で、なおかつ無限のコンピューティングリソースが提供されます。
そしてもう1つのSnowflakeの提供する価値が、マルチクラウド/マルチリージョンです。現代のビジネスには、国や地域をまたいだシームレスなデータ環境が不可欠です。地球上のあらゆる地域で利用できるデータ・クラウドが、グローバルビジネスに大きな価値をもたらしてくれます。
Snowflakeと共にデータ活用の近未来へ
最後に、データ・クラウドがもたらす未来像についてお話ししましょう。この未来は、すべてのデータがつながっていく世界です。あらゆるデータは生まれた瞬間からクラウド上の1つの場所に統合され、他のデータと容易に連携・結合して分析・活用されていきます。
この近未来を、すでに実現している企業があります。Snowflakeのお客さまである、イギリスの大手スーパーマーケット「セインズベリーズ」では、事業会社間のデータのサイロ化が原因となって、リアルタイムのデータ利用ができない悩みを抱えていました。
しかしSnowflakeのデータ・クラウドを利用することで、事業会社間のデータのシェアが可能になり、組織横断的なデータの民主化が実現。さらに以前は6時間かかったクエリが3秒で返ってくるという、大幅なレスポンス向上を達成しました。
また米国カリフォルニア州では、Snowflakeのデータ・クラウドを使って、新型コロナ関連の情報を、民間企業からの情報提供なども含めて集約。どこでクラスターが発生しそうかといったことを分析して、データドリブンな感染予防対応を実現しています。
こうした実績を背景に、すでに世界で4000社を超える企業がSnowflakeのデータ・クラウドを自社のデータ基盤として利用し、柔軟かつ多彩なデータコラボレーション、データ活用を実現されています。
クラウドの価値は、アカウントを作成してログインすれば、すぐにすべての機能の利用が可能な点にあります。誰もが思い立ったその日から、無尽蔵ともいえるポテンシャルをフルに活用して、場所や時間の制約を受けることなく、新たなビジネスの創造に向かうことができるのです。
もう待つ必要はありません。次は皆さんの番です。ぜひ私たちSnowflakeと一緒に、新しいデータコラボレーションの世界に向けて進んでいきましょう。

<PR>