シーズンが終わって、「アタック決定率50%の選手」がいたとします。なかなか悪くない数字です。でも、ちょっと想像してみてください。
- A選手: 毎試合、必ず「45%〜55%」の間で安定して決めてくれる選手。
- B選手: 「70%」で大爆発する日もあれば、「20%」で全く決まらない日もある選手。
この2人は、シーズンを通せば同じ「平均50%」になります。監督として試合のスタメンを決めるとき、この2人の扱いは全く別物になるはずです。
平均値という平らな数字の奥にある「選手の調子の波(ばらつき)」を見抜くこともアナリストにとって重要なタスクです。今回は、無料のデータ分析ツール「R(アール)」を使って、データのばらつきを視覚化するグラフを作ってみましょう。
プログラミング未経験でも全く問題ありません。順番にコピペするだけで完成します。
Step1:Rにデータセットを読み込む
今回は、Volleyball Data roomさんのデータセットをお借りして、分析していきます。
ここではセリエA男子の昨年のデータセットにしてみます。データセット(csvファイル)をダウンロードしておいてください。
https://github.com/volleyballdataroom
ここから、Rにこのデータセットを読み込んでいきます。
他にもいろんなカテゴリのデータをまとめてくださっているので、気になるカテゴリから試してみてもよいでしょう。
