Exploratory コミュニティ

カジュアルユーザーのレンタル自転車の使用傾向に関する探索的データ分析

#1

wasabiさんが一番乗りで、今月のEDA Salonの投稿をしてくれました!

コメントやフィードバックはこちらのトピックかTwitterでお願いします!

#2

ヒートマップの使い方が面白いと思いました!

Uniteして列同士の値を集約することによって「曜日」と「季節」で掛け合わせた列ができるため、ヒートマップでも3つのカテゴリデータの値を使えますね。

Rスクリプトをみたんですが、季節を変更する際のcase_whenですが、
between関数を使うともっと短くなると思います!

case_when(
 between(Month,3,5) ~ "Spring",
 between(Month,6,8) ~ "Summer",
 between(Month,9,11) ~ "Fall",
 TRUE ~ "Winter")
1 Like
#3

コードチェックありがとうございます!

これは私の癖で、探索している最中はラベルの対応関係を頻繁にいじって可視化するので、
実はこのコードのbetween(Month,3,5) ~ "Spring"の部分のところも、この手の時系列データであれば、
4月は新生活が始まる(アメリカもそうかはわからない…)ので、別のカテゴリに割り当てて可視化したい、
みたいなことを考えているのですが、その場合にbetween()は割とコードを直すのが面倒だと個人的に思ってまして…こんな感じですね

Month == 3 ~ "hoge",
Month == 4 ~ "fuga",
Month == 5 ~ "hoge",
…

あとは月のカーディナリティは絶対12個なので、1行づつ書いてもいいかな、と思いこの形になっています。

ご指摘の通り、最終的には、確定したラベルでcase_when()のコードは、between()を使って、
リファクタリングする方がすっきりして見やすいですね!

1 Like