サイト内の現在位置
Point1 インフラ基盤
Tableau(タブロー)構築環境の検討
- お客様の要件に応じて、オンプレミス/クラウドの選択が可能です。
- 仮想環境への構築もサポート
(Microsoft Hyper-V/VMware/Citrix/Amazon EC2など)
サイジングの考え方
環境検討の際に合わせて確認しておきたいのがサイジングの考え方です。
Tableauの性能を「1.Desktopでの利用か?」「2.Serverでの利用か?」、
「A.ライブ接続での利用か?」「B.抽出ファイルでの利用か?」の組み合わせ(4パターン)で解説します。
Tableau Desktop&ライブ接続での利用の場合
TableauからSQLが発行され、データベースで処理された結果(データ)が戻され、Tableauで描画されます。
この時、性能のポイントは、以下のふたつです。
1. データベースでの処理時間
これは、データベースの処理性能(レコード数)に依存します。
2. 描画の処理時間
Tableauの描画性能は非常に優れています。ただし、描画の処理時間は、画面仕様(マーク数)に影響を受けます。
数万~数十万件程度であれば、問題ありませんが、数百万件以上描画する場合は、それなりに時間がかかります。
なお、性能に課題を感じた場合、Tableauのデータソース設定において以下の点を見直してみると、改善される可能性があります。
- 列数、行数
- カーディナリティ
- 結合の方法
Tableau Desktop&抽出ファイルでの利用の場合
抽出ファイルを利用する場合、初回の抽出ファイルの作成には少し時間がかかりますが、その後の検索性能は非常に高速です。
例えば、レコード数が1億件あった場合でも、売上合計などは数秒で返ってきます。
また、抽出ファイルは、カラム型メモリDBですが、全データをメモリに乗せる訳ではありません。最初はWindowsのファイルとしてディスクに保存され、使用するデータセットをその都度メモリに展開します。
よって、描画する件数が少なければ使用するメモリはわずかです。この点、非常に優れたアーキテクチャーです。
なお、抽出ファイルのレコード数は、仕様上は制限がありませんが、経験上、1億件程度に収めるのが無難です。
Tableau Server&ライブ接続での利用の場合
基本的に、考慮するポイントは「1-A」と同じですが、Tableau Server利用の場合は多重度がポイントになります。
多重性能は、Tableau Serverがインストールされているマシンの性能(CPU、RAM)に依存します。
一般的に、64 GBのRAM のインストールで、最大 60 のアクティブな同時ユーザーに対応できます。
Tableau Server&抽出ファイルでの利用の場合
基本的に、考慮するポイントは「1-B」+「2-A」と同じです。
その上で、抽出ファイル利用の場合は、運用設計が重要です。
- 抽出ファイルを更新する際、サーバに高負荷がかかるため、サービス時間以外に実行する必要がある
- バックアップを取得する際、抽出ファイルごとファイルにバックアップされるため、ディスク容量を考慮する必要がある など
まとめ
今回の内容を簡単にまとめると、Tableauの性能のポイントは、次の通りです。
1.データベースの性能(ライブ接続の場合)
2.多重度に応じたTableau Serverのサイジング
3.レポート/ダッシュボードの画面仕様(マーク数)
性能でお困りのことがあれば、お気軽にお声掛けください。
Tableau(タブロー)・導入ポイント
- Point1 インフラ基盤
構築環境の検討 - Point2 認証方式
ユーザの認証方式 - Point3 権限設定
権限設定 - Point4 ガバナンス
データソースの共有