簡単ではありますが、SnowflakeのドキュメントベースでSnowflakeを導入する前に確認、検討すべきところを見ていきたいと思います。
※本エントリは予告なく更新することがあります
デプロイ可能なクラウドについて
参考URL:サポート対象のクラウドプラットフォーム
Snowfloakeはいわゆる3大クラウドであるAmazon AWS、Google GCP、Microsoft Azureにデプロイ可能となっています。ただ、ベースはAWSのようで、GCP、AzureではPrivate Linkなどで制限を一部受けるようです(GCPはそもそもPrivate Linkできない。Azureはできそうですが、設定が結構面倒そうな感じで書かれています)。それ以外の基本的な機能はどこを選択しても変わりません。
なお、デプロイ可能なクラウドはやはりAWSが多く、GCPは非常に少ないです・・・。
デプロイ可能なクラウドのリージョンについて
参考URL:サポートされているクラウドリージョン
様々なリージョンをサポートしていますが、デプロイ先のクラウドとリージョンで金額が若干異なっているようです。クラウドやリージョンをまたぐとデータ転送料がかかるため、なるべくよく使うサービスのリージョンにデプロイすることをおすすめします。ただ、東京は高いです・・・。
エディションの違い
参考URL:Snowflake Edition
Snowflakeには4つのエディションがあります。Standard、Enterprise、Business Critical、Virtual Private Snowflake(VPS)の4つです。VPSは専用のサイトで一般のSnowflakeから切り離されている環境となります。それ以外のエディション間の主な違いはセキュリティ面です。Standardは列/行レベルセキュリティに対応していないなどあるので、実質企業で使う場合はEnterpriseくらいがが良いと考えられます。
なお、ある程度規模を持ってDWHとして利用するのであれば、マルチクラスターDWHなどが使えるEnterpriseがおすすめです。これが使えないと、処理が溜まってきた際にスケールアップしかできず、非効率な運用となってしまいます(複雑なクエリはスケールアップでカバーしますが、単純なクエリが多い場合はスケールアウトが推奨されています)。
また、セキュリティに厳しい組織の場合、Private Linkなど活用したいと想定されるため、そのような場合はBusiness Criticalになると思います(しかも、その場合はAWSかAzureを選択することになります)。
なお、Editionによってコスト計算の単価のクレジットあたりの費用が異なります。
機能一覧
参考URL:主な機能の概要
そもそもSnowflakeでできること・できないことを機能一覧を見て抑えておきましょう。
データのロード方法について
データのロード方法についても検討を行っておくべきです。Snowflake単体では、AWS S3/Azure BlobObject等/GCP GCSなどの各クラウドベンダーのオブジェクトストレージからのデータロードに対応しています。それ以外のデータソースがあるようであれば、一旦オブジェクトストレージに保存するか、データ連携ツール・サービスを検討する必要があります。
コメント