【データ分析】PowerBIの散布図の使い方
PowerBIの散布図

散布図とは?
散布図は英語で『Scatter Chart(スキャッターチャート)』と言います。
PowerBIの散布図は、2つの数値の関係性を視覚化するためのグラフ(ビジュアルコンポーネント)で、
- データのパターン
- 傾向
- 相関関係
- 外れ値
などの有無を把握し識別することに役立ちます。
散布図の機能
散布図の主な機能としては、
- ポイントの表示
- 軸とデータの配置
- データのグループ化と色分け
- 相関関係の表示
- インタラクティブな機能
などがあります。
ポイントの表示
散布図では、各データをポイントとして表示します。
ポイントは通常、『円(丸)』や『四角形』などのマーカーで表され、データの位置を示します。
この表示されたポイントをPowerBIでは、
- データポイント
- データプロット
などと言います。
この『データポイント』と『データプロット』は、少しややこしいというか分かり難いというか、データポイントが配置されることを「データポイントがプロットされる」と言ったりします。
データプロット
データプロットは、データポイントの位置や形状を定義し、その位置からデータの特徴や関係性を視覚化します。
データポイント
データポイントは、数値やカテゴリなどのデータ要素を表し、プロットされた位置に応じて表示されます。
データの個別の値や識別情報をツールチップやデータラベルとして表示することもできます。
など、少し難しい感じで言いましたが、「データが丸や四角のポイントとして表示される」という程度の認識でも大丈夫です。。
軸とデータの配置
散布図では、データの2つの数値変数をx軸とy軸に配置します。
各データポイントは、x軸とy軸の値の組み合わせで表され、これにより2つの変数の関係性を直感的に表現することができます。
データのグループ化と色分け
PowerBIの散布図で、データポイントは色やサイズを設定することができます。
色やサイズは、追加の変数やメトリックを表すために使用されることがあり、これによりデータの追加の情報を視覚的に表現することができます。
またデータをグループ化し、異なるグループを色分けして表示することができます。
これにより、さらに多くの変数を視覚的に表現し、データの比較や分析が可能になります。
相関関係の表示
この散布図というグラフは、2つの変数の相関関係を可視化するのに適しています。
データポイントが集中している箇所や、傾向がある線(トレンドライン)を追加することで、相関関係を把握することができます。
インタラクティブな機能
上記の他に散布図では、インタラクティブな機能を提供します。
ユーザーはポイントを選択したり、ズームやパン機能を使用したりすることで、データの詳細情報にアクセスしたり、特定のデータポイントを強調表示したりすることができます。
また、各データポイントに関連する追加情報を表示するためのツールチップを設定することができます。
ユーザーが特定のデータポイントにカーソルを合わせると、そのデータポイントに関連する詳細情報が表示されます。
散布図の使用例
PowerBIのサンプルデータに「Financials」というものがあります。
日本語にすると売り上げや財務という意味になるのですが、売上財務データという感じです。
このサンプルデータセットを利用して散布図を作ります。
散布図の目的と説明
例えば、上記のような散布図を作りました。
この散布図は、『国と製品』の『売り上げと利益』の相関関係を見る目的で作成したものです。
スライサーを使い連動させ、バーティカルリストで製品が選択できるようになっています。
そして、中央に十字の破線が引かれているが利益と売り上げの平均値で、製品ごとにポイントが表示され、国ごとにポイントが色分けされています。
散布図の見方
単価が同じであれば、通常は売り上げが高ければ高い程、利益も高くなります。
上記の散布図ならアメリカ(United States of America)のような状態が、売り上げと利益が比例しているものという感じです。
しかし上記の図では、国によって製品単価が違うので、売り上げによる利益率が大きく変わっています。
例えば、スライサーで『VTT』を選択すると、
という散布図に切り替わります。
国別の色分けは、
ポイント色 | 国 |
---|---|
水色 | カナダ(France) |
紺色 | フランス(France) |
オレンジ | ドイツ(Germany) |
紫色 | メキシコ(Mexico) |
ピンク | アメリカ(USA) |
となっています。
フランスは、売り上げが平均値以下なのに、利益がめちゃくちゃ高いですよね。
逆にカナダは、売り上げが平均値より少し高いのに、利益がほとんどありません。
どちらの国で『VTT』を売ることがベストか、一目瞭然ですよね。
どの国で、何を売れば、利益が出しやすい、というデータ分析ができたわけです。
こんな感じで、あきらかな違いが視覚的に分かってしまう、簡単に見えてしまうのが、散布図の最大の利点とも言えます。
まとめ
PowerBIの散布図は、数値データの相関関係やクラスタリングの可視化によく使用され、データのパターンや相関関係を理解するために広く使用されるビジュアルです。
異なる変数の関係性を視覚的に把握することで、
- データのパターンや傾向の把握
- 異常値の検出
- 変数間の関係性の理解
などに役立ち、散布図を使用することで、データ分析や洞察の獲得を容易にし、データへの洞察力を高めることができるのです。