Serverless Operations, inc

>_cd /blog/id_sjsj6jnt21g

title

Amazon QuickSightで実現する高度なデータ可視化とリアルタイム分析の具体例

Amazon QuickSight とは

Amazon QuickSightは AWS のデータ可視化サービスで、信頼できる情報源からあらゆるユーザーのさまざまな分析ニーズに答えたダッシュボードと分析のための機能を提供します。例えばサードパーティ製品の「Tableau」に該当するようなソリューションになります。Tableau の方が表現力には優れ、Salesforce との親和性が高く、広く一般的なユースケースがカバーできるという利点がある一方、Amazon QuickSight は AWS サービスとの親和性やパフォーマンス、コスト面において優位性を持ちます。ですが、基本的にソリューション選定においてはこのような優劣ではなく、ケースバイケースでおすすめするソリューションは変わってきます。

Amazon QuickSight 構成と特徴

Amazon QuickSightにはSPICE と言われるインメモリデータ保存領域があり、データソースを連携後、分析(可視化)画面を作成して SPICE にデータをロードしておきます。これにより、都度クエリーを発行しなくても、複雑かつデータ量が多い画面を描画することが特徴です。データソースとダッシュボード両方において負担の少ない形になります。

デフォルトで表現できる可視化の種類や表示上の細かいところの設定などは Tableau などの方がやや優れているのではないかと思いますが、標準的な機能は一通り揃っています。続いて、サンプルデータを投入して実際に可視化を行ってみます。具体的な業務や分析要件は含めていないので、出典から取得したCSVデータを JSON に変換し、必要な項目を Select して S3 に投入、連携を行いました。弊社は戸田建設様のような建設業界のお客様が何社かいらっしゃるため、今回は建設業界でしばしばみられるパターンで可視化を行いました。

データ可視化の参考①:建設工事受注動態統計調査

政府統計ポータルサイト(e-stat) 「建設工事受注動態統計調査ー施工地域別請負契約額」よりサンプルデータを抜粋しました。

https://www.e-stat.go.jp/dbview?sid=0003126183

# データソースの CSV
tab_code,表章項目,cat01_code,建築主,cat02_code,用途,area_code,地域,time_code,時間軸(月次),unit,value
12,建築物の数,11,計,11,計,02000,青森県,2011000202,2011年2月,棟,190
12,建築物の数,11,計,11,計,02000,青森県,2011000101,2011年1月,棟,222
12,建築物の数,11,計,11,計,03000,岩手県,2024000202,2024年2月,棟,339
12,建築物の数,11,計,11,計,03000,岩手県,2024000101,2024年1月,棟,353
# ...

上記の図は都道府県ごとの合計施工請負契約額の合計を可視化したグラフとなります。単位は百万円で、2011 - 2024年のうち、2020年のデータのみフィルタリング、施工都道府県別に GROUP BY して表示した形になります。都道府県ごとにどの程度の規模の工事が年々行われているのかを把握することが出来ます。

さらに施工都道府県別に金額の多い時期や地域ごとに金額の差異をわかりやすくするために、Heat map で表示してみた例になります。他にも、目的や意図に合わせて様々な表現が可能です。

データ可視化の参考②:建築物着工統計

政府統計ポータルサイト(e-stat) 「建築物着工統計ー用途別、建築主別/建築物の数、床面積、工事費予定額」よりサンプルデータを抜粋しました。

https://www.e-stat.go.jp/dbview?sid=0004000400

# データソースの CSV
tab_code,表章項目,cat01_code,建築主,cat02_code,用途,area_code,地域,time_code,時間軸(月次),unit,value
12,建築物の数,11,計,11,計,07000,福島県,2011000202,2011年2月,棟,604
12,建築物の数,11,計,11,計,07000,福島県,2011000101,2011年1月,棟,668
12,建築物の数,11,計,11,計,08000,茨城県,2024000202,2024年2月,棟,1082
12,建築物の数,11,計,11,計,08000,茨城県,2024000101,2024年1月,棟,959
# ...

こちらでは、時間を横軸に 2011 年 - 2024 年の間の着工件数をフォルターを通さずにまとめて表示しています。このサンプルの特徴としては、全体でちょうど400,000レコード、JSON 展開時に 109.8MB のやや大きいデータソースを利用しても、パフォーマンスにブレがなく、画面がカクカクすることもなく(クライアントの性能によってはある可能性があります)スムーズに表示できることです。

上記は表示の仕方を変えて、フィルターの掛け方と都道府県別にボリュームがわかりやすいような表現にしたものです。

データ可視化の参考③:大阪ビジネス地区のオフィスビル市況

三木商事が公開しているオフィスビル市況データをデータソースにしました。

https://www.e-miki.com/rent/

# データソースの CSV
期間,延床面積(坪),貸室面積(坪),ビル数/合計(棟),ビル数/新築ビル,ビル数/既存ビル,空室のあるビル比率(%),空室率/平均(%),空室率/新築ビル,空室率/既存ビル,平均賃料/平均(円/坪),平均賃料/新築ビル,平均賃料/既存ビル,空室面積/合計(坪),空室面積/新築ビル,空室面積/既存ビル,供給量(延床面積:坪),供給棟数(棟)
2024年04月,"3,721,911 ","2,259,015 ",813 ,6 ,807 ,55.60 ,4.47 ,28.27 ,4.02 ,"12,061 ","27,333 ","12,002 ","100,914 ","11,862 ","89,052 ",-,-
2024年03月,"3,699,743 ","2,250,759 ",811 ,5 ,806 ,56.72 ,4.77 ,39.75 ,4.21 ,"12,017 ",-,"11,991 ","107,285 ","13,964 ","93,321 ",-,-
2024年02月,"3,638,984 ","2,235,592 ",811 ,5 ,806 ,57.58 ,4.35 ,37.56 ,4.08 ,"11,990 ",-,"11,974 ","97,347 ","6,823 ","90,524 ",-,-
# ...

延床面積に対する空室面積の可視化に加え、別軸で空室率を表現するような可視化のサンプルです。データ項目は画面左側「Data」のサイドバーから表示されるので、クリックとドラッグ&ドロップ操作で直感的に編集することが可能です。

このようにAmazon QuickSightを使用することでAWS内で貯めたデータを可視化して様々なデータ分析ニーズに答えることが出来ます。上記の例のようにバーチャートやラインチャート、パイチャートなどの基本的なグラフだけでなく、複合チャートやヒートマップ、ゲージチャートなど、さまざまな可視化オプションが使用可能であり、様々な角度からの可視化が可能となります。データソースとしてもAmazon S3、Amazon Redshift、RDS、AuroraなどのAWSサービスから直接データを取り込むことができるため、AWSを中心として社内のインフラを整えている方には一番親和性の高い選択肢となるのでは無いでしょうか。

Written by
CEO

堀家 隆宏

Takahiro Horike

  • Facebook->
  • X->
  • GitHub->

Share

Facebook->X->
Back
to list
<-