グループごとに年の範囲を指定して集計したい

例えば、下記のように日付やマーケットの列がある売上データがあったとします。

57

このデータを元に、マーケット(グループ)ごとに年の範囲を指定して売上の平均値や標準偏差を求めたいとします。

04

まず、メインのデータフレームからブランチを作成します。

36

次に、メインのデータフレームで集計します。

54

グループ化には、マーケット、そして年を割り当てます。

値には、売上の合計値を割り当てます。

12

これで元となるデータを作成することができました。

26

次に、ブランチのデータフレームに移動して、集計を選択します。

29

グループ化にマーケットを割り当てます。

02

次に、年度の範囲を指定して集計するため、値にカスタムを選択します。

20

平均値を求めたい場合、計算式に下記を入力します。

mean(<値>[between(<年>,最初の年, 最後の年)])

24

今回の場合は、mean(Sales[between(Order Date_year, 2016,2017)])となります。

実行すると、マーケットごとに2016年から2017年までの売上の平均値を求めることができました。

45

次に、標準偏差を求めたい場合、計算式に下記を入力します。

sd(<値>[between(<年>,最初の年, 最後の年)])

値の中に角括弧 [ ]と中に条件式や関数を入れることで、値を絞り込むことができます。

詳しくはExploratory Hourで紹介しているので、こちらをご覧ください。

14

今回の場合は、sd(Sales[between(Order Date_year, 2016,2017)])となります。

年の範囲を変えたい場合は、between関数の中にある、最初の年と最後の年に任意の値を指定することで変えることができます。

集計でカスタム機能を利用して、2016年から2017年までの売上の平均値と標準偏差の列、2016年から2018年までの売上の平均値と標準偏差の列を作成しました。

10

実行すると下記のようになります。

55

メインのデータフレームに戻ります。

マーケットの列ヘッダメニューから結合を選択します。

36

結合先にブランチのデータフレームを選び、キーにはマーケットを選択して実行します。

06

これにより、マーケットごとに年の範囲を指定して値を集計することができました。

04

「いいね!」 1