【データ分析】PowerBIのツリーマップの作り方と特徴
ツリーマップの作り方
ツリーマップとは?
PowerBIのツリーマップ(Tree Map)は、階層的なデータを視覚化するためのグラフの一種で、矩形の領域を使用してデータの階層構造を表現し、各領域の大きさで数値データを示します。
ツリーマップ機能を利用することで、データの情報から有用な情報やパターンを発見し理解するプロセスで、隠れた傾向や関係性、異常値、重要な要素などを見つけ出すことができます。
ツリーマップを知らないと、Windowsのツリーやサイトのツリー構造やクリスマスツリーのような形状をイメージしてしまいますが、実際はタイル状なんですね。
日本人からすると、ちょっと紛らわしいですね。。
ツリーマップの特徴
ツリーマップの特徴には、主に3つの要素があります。
- 階層構造の表示
- 面積でデータの相対的な重要度を表現
- 色やラベルの活用
その他にもフィルターやドリルダウン機能など特徴はあるのですが、この3つがツリーマップの醍醐味的な要素となります。
階層構造の表示
ツリーマップは、階層的なデータを表現します。
上位のカテゴリやグループが大きな矩形で表され、下位の要素やサブカテゴリはその矩形内で相対的な大きさを持ち、データの階層構造や構成比を視覚的に把握することができます。
面積でデータの相対的な重要度を表現
ツリーマップでは、各領域の面積がデータの相対的な重要度や割合を表現します。
大きな領域は重要なデータを示し、小さな領域は相対的に重要度が低いデータを示し、データ要素の相対的な重要度や割合を視覚的に比較することができます。
色やラベルの活用
ツリーマップでは、領域の色やラベルを活用して、さらに情報を伝えることができ、色は別のカテゴリやグループを示すために使用され、ラベルはデータの詳細情報を提供するために使用されます。
ツリーマップの作り方
上記は、サンプルデータとして、都道府県別に郵便番号一覧から多い順にツリーマップを作成したものです。
PowerBIでは、『カテゴリ』と『値』を設定するだけで、簡単にグラフが作成できます。
ツリーマップの見方
本来のツリーマップの作り方としては、正方形のグラフにした方が良いのかもしれません。
上記のサンプルデータのグラフでは、長方形で作成したので、左から、
縦 ⇒ 縦 ⇒ 縦 ⇒ 横 ⇒ 縦 ・・・・・
という並びになっており、途中から縦(列)と横(行)にデータが交互に表示されていきます。
正方形でグラフを作ると、
縦 ⇒ 横 ⇒ 縦 ⇒ 横 ・・・・・
という感じで列と行が最初から順番に並ぶようになります。
なのでツリーマップの見方としては、
- 左の縦列
- 上の横列
- その下に左の縦列
- その右の上に横列
- ・・・・・
という順番で表示され、最初の左上のデータが一番大きい値、最後の右下のデータが一番小さい値となります。
ツリーマップの活用
ツリーマップの活用で、実際にどんなデータ分析が出来るのかというと、
- 階層的なデータの構造
- データ要素の相対的な重要度や割合
- パターンや傾向の発見
というものを視覚化することが主な目的という感じです。
階層的なデータの構造
階層的なデータの構造とは、簡単に説明すると『親子関係』や『上位と下位の関係』という感じです。
例えば、最上位の階層が「食品」で、その下に「野菜」と「果物」の2つのカテゴリがある場合、「野菜」の下には「葉物野菜」と「根菜」があり、「果物」の下には「柑橘類」と「ベリー類」があり、上位の階層(食品)と下位の階層(野菜、果物、葉物野菜、根菜、柑橘類、ベリー類)の間には階層的な関係があるわけです。
データ要素の相対的な重要度や割合
ツリーマップでは、各領域の大きさが数値データの相対的な重要度や割合を表現します。
大きな領域はより重要なデータを示し、小さな領域は相対的に重要度が低いデータを示し、データ要素の相対的な重要度や割合を視覚的に比較することができます。
例えば、営業件数に比例して営業コストが上がると言われたとします。
実際にデータを見た時に、
- 営業費の額がより大きくなる
- 営業費の額はそれほど変わらない
というようなケースが出てくると思いますが、視覚化されることで一目瞭然で理解でき、「営業件数を増やすだけで良いのか?」、「営業コストを抑える必要があるのか?」、という選択がしやすくなるわけです。
パターンや傾向の発見
ツリーマップを使用することで、データの階層構造やデータ要素の大きさを視覚的に比較することができ、異なる階層間のパターンや傾向を発見することができます。
特に、大きさの異なる領域や比率の異なる領域を比較することで、データの特徴や傾向を把握するのに役立ちます。
ツリーマップのメリットデメリット
メリット
- データの階層的な構造を視覚的に理解できる。
- データ要素の相対的な重要度や割合を面積で表現しやすい。
- 大量のデータをコンパクトに表示できる。
- 階層的な探索やドリルダウンが容易。
デメリット
- 領域の面積で比較するため、領域の比較が難しいことがある。
- 階層の深さに制限があり、深い階層では可読性が低下する可能性がある。
- 小さな領域や長いラベルの表示に制約があることがある。
まとめ
ツリーマップは、データの階層構造や相対的な重要度を視覚的に理解し、データの組織や傾向を把握するための有用なツールで、データの探索や分析において、特に階層的なデータやカテゴリの比較が必要な場合に活用されます。
ツリーマップを使用する際には、デメリットを考慮しながら適切なデータや目的に合わせて活用する必要があり、データの性質や可視化の目的によって、ツリーマップの利用の適否を判断することが重要です。
データの性質や情報の特徴に合わせて、他の視覚化手法との比較や複数の視覚化手法の組み合わせを検討することも推奨します。