【データ分析】PowerBIの散布図の使い方

注目記事

PowerBIの散布図

散布図とは?

散布図は英語で『Scatter Chart(スキャッターチャート)』と言います。

PowerBIの散布図は、2つの数値の関係性を視覚化するためのグラフ(ビジュアルコンポーネント)で、
 

  • データのパターン
  • 傾向
  • 相関関係
  • 外れ値

 
などの有無を把握し識別することに役立ちます。
 

散布図の機能

散布図の主な機能としては、
 

  • ポイントの表示
  • 軸とデータの配置
  • データのグループ化と色分け
  • 相関関係の表示
  • インタラクティブな機能

 
などがあります。
 

ポイントの表示

散布図では、各データをポイントとして表示します。

ポイントは通常、『円(丸)』や『四角形』などのマーカーで表され、データの位置を示します。

この表示されたポイントをPowerBIでは、
 

  • データポイント
  • データプロット

 

などと言います。

この『データポイント』と『データプロット』は、少しややこしいというか分かり難いというか、データポイントが配置されることを「データポイントがプロットされる」と言ったりします。
 

データプロット

データプロットは、データポイントの位置や形状を定義し、その位置からデータの特徴や関係性を視覚化します。
 

データポイント

データポイントは、数値やカテゴリなどのデータ要素を表し、プロットされた位置に応じて表示されます。

 
データの個別の値や識別情報をツールチップやデータラベルとして表示することもできます。

など、少し難しい感じで言いましたが、「データが丸や四角のポイントとして表示される」という程度の認識でも大丈夫です。。
 

軸とデータの配置

散布図では、データの2つの数値変数をx軸とy軸に配置します。

各データポイントは、x軸とy軸の値の組み合わせで表され、これにより2つの変数の関係性を直感的に表現することができます。
 

データのグループ化と色分け

PowerBIの散布図で、データポイントは色やサイズを設定することができます。

色やサイズは、追加の変数やメトリックを表すために使用されることがあり、これによりデータの追加の情報を視覚的に表現することができます。

またデータをグループ化し、異なるグループを色分けして表示することができます。

これにより、さらに多くの変数を視覚的に表現し、データの比較や分析が可能になります。
 

相関関係の表示

この散布図というグラフは、2つの変数の相関関係を可視化するのに適しています。

データポイントが集中している箇所や、傾向がある線(トレンドライン)を追加することで、相関関係を把握することができます。
 

インタラクティブな機能

上記の他に散布図では、インタラクティブな機能を提供します。

ユーザーはポイントを選択したり、ズームやパン機能を使用したりすることで、データの詳細情報にアクセスしたり、特定のデータポイントを強調表示したりすることができます。

また、各データポイントに関連する追加情報を表示するためのツールチップを設定することができます。

ユーザーが特定のデータポイントにカーソルを合わせると、そのデータポイントに関連する詳細情報が表示されます。
 

散布図の使用例

PowerBIのサンプルデータに「Financials」というものがあります。

日本語にすると売り上げや財務という意味になるのですが、売上財務データという感じです。

このサンプルデータセットを利用して散布図を作ります。
 

散布図の目的と説明

例えば、上記のような散布図を作りました。

この散布図は、『国と製品』の『売り上げと利益』の相関関係を見る目的で作成したものです。

スライサーを使い連動させ、バーティカルリストで製品が選択できるようになっています。

そして、中央に十字の破線が引かれているが利益と売り上げの平均値で、製品ごとにポイントが表示され、国ごとにポイントが色分けされています。
 

散布図の見方

単価が同じであれば、通常は売り上げが高ければ高い程、利益も高くなります。

上記の散布図ならアメリカ(United States of America)のような状態が、売り上げと利益が比例しているものという感じです。

しかし上記の図では、国によって製品単価が違うので、売り上げによる利益率が大きく変わっています。

例えば、スライサーで『VTT』を選択すると、

という散布図に切り替わります。

国別の色分けは、
 

ポイント色
水色 カナダ(France)
紺色 フランス(France)
オレンジ ドイツ(Germany)
紫色 メキシコ(Mexico)
ピンク アメリカ(USA)

 
となっています。

フランスは、売り上げが平均値以下なのに、利益がめちゃくちゃ高いですよね。

逆にカナダは、売り上げが平均値より少し高いのに、利益がほとんどありません。

どちらの国で『VTT』を売ることがベストか、一目瞭然ですよね。

どの国で、何を売れば、利益が出しやすい、というデータ分析ができたわけです。

こんな感じで、あきらかな違いが視覚的に分かってしまう、簡単に見えてしまうのが、散布図の最大の利点とも言えます。
 

まとめ

PowerBIの散布図は、数値データの相関関係やクラスタリングの可視化によく使用され、データのパターンや相関関係を理解するために広く使用されるビジュアルです。

異なる変数の関係性を視覚的に把握することで、
 

  • データのパターンや傾向の把握
  • 異常値の検出
  • 変数間の関係性の理解

 
などに役立ち、散布図を使用することで、データ分析や洞察の獲得を容易にし、データへの洞察力を高めることができるのです。