興味の源泉

自分が興味を起こせるようなネタを雑多に書き綴るブログ

【Excel】95%信頼区間を計算する方法

今回はExcelで95%信頼区間を計算する方法です。

使うデータ

まずデータは、あるお菓子を均等な大きさに作ったときのお菓子の重さとします。

f:id:nanami_yamato:20201129191855p:plain
※下記は生データ
100.4,104.1,95.8,109,99.4,94.3,112.5,109.9,98.9,99,102.7,91.7,91,96.7,119,105.2,103.4,99.7,106.4,96.8,100.5,100.2,94.7,118.2,108.3,117.7,90.2,90.8,100.4,118.1

平均

まずは信頼区間を計算したい平均の値を出します。

平均といえばAVERAGE関数。

102.5でした。

信頼区間を計算する関数

Excelで信頼区間を計算する関数は今回はCONFIDENCE.T関数を使います。

この関数はスチューデントの T 分布を使用して、母集団に対する信頼区間を求めます。

引数には有意水準標準偏差と標本数を指定します。

有意水準

95%の信頼区間を計算したいので、有意水準は5%の0.05です。

標準偏差

標準偏差はSTDEV.S関数を使います。

引数にはデータを指定します。

今回はB5:D14の範囲です。

標準偏差は約8.48でした。

標本数

標本数とはデータの個数なので、COUNT関数でデータ数を出します。

データ数は30です。

計算してみる

以上踏まえてCONFIDENCE.T関数に算出した有意水準標準偏差と標本数を渡して計算します。

値は約3.16でした。

平均が102.5なので、それに3.16…にプラスマイナスします。

95%信頼区間は105.66…~99.33…になります。

f:id:nanami_yamato:20201129194738p:plain

まとめ

今回はExcelで95%信頼区間を計算する方法を簡単に紹介しました。

99%も有意水準の値を変えれば算出できます。

有効活用していきたいですね。

【EXCEL】1%排出のガチャ100回で2回以上当たる確率は?

f:id:nanami_yamato:20201116191147p:plain

データ分析周りの勉強がてら、EXCELを使うことが増えてきてきました。
二項分布の確率を求める関数を見て、ガチャで疑問に思ったことに使えると思い記事にします。

二項分布

コインを4回投げて、表が2回出る確率を出す場合などに使うのが二項分布の確率の計算ですが、EXCELではBINOM.DIST関数一つで出せます。

BINOM.DISTについての引数は以下です。

BINOM.DIST(成功数、試行回数、成功率、関数形式)

例として「コインを4回投げて、表が2回出る確率を出す場合」を考えます。

試行回数は例ではコインを投げる回数なので4です。

成功数は成功回数を指定します。例では表を成功とみなし2です。

成功率は試行1回で成功(表)になる確率なので0.5です。

関数形式は関数の種類を設定します。今回はFALSEの確率質量関数を設定します。

f:id:nanami_yamato:20201116193642p:plain

計算結果は0.375で37.5%ですね。

1%排出のガチャで100回実行でN回当たる確率

早速、本題のガチャに対してこの関数を当てはめてみます。

試行回数は100回とします。

成功確率は成功を1%の排出のものを当る確率として0.01です。

成功回数を1%の排出のものが当たった回数として0~9まで変えていきます。

実際に当てはめた表

試行回数と成功確率は変わらず、成功回数を0~9で変動させて、確率の部分に関数を書けばいいだけですね。

=BINOM.DIST(C2,A2,B2,FALSE)
…
=BINOM.DIST(C11,A11,B11,FALSE)

ただ関数に当てはめるだけなので、一気に全部入れた表を張ってしまいます。

f:id:nanami_yamato:20201116195302p:plain

グラフ

視覚的に見てわかりやすいようにグラフにしました。

f:id:nanami_yamato:20201116194958p:plain

確率の部分がちょっと見づらいですが、0回と1回がほとんどで、意外に2回の確率も18%とまあまああるように見えます。

3回は7%で4回で1.5%、5回から先はほぼ確率としてはありえない感じになっています。

ここで注目したいのは、0回と1回がほぼ同じ確率で7割ほどを占めていることです。

ほとんどの人はここになるわけです。

2回以上の確率は合算値なので約26%です。

まとめ

意外に2回以上出る確率も計算してみると、思っていたよりは多い感じがします。

これを高いととるか低いととるかは人それぞれでしょう。

とはいえ、0回の確率も結構な割合であるのは間違いないです。

ご利用は計画的に。


ちなみに蛇足ですが、1%排出のガチャで100回実行で1回も出ない確率は以下で簡単に求められます。

= POWER(0.99, 100)

POWERはべき乗の計算で、上記は1回の外れる確率を100回かける結果を求められます。

Excelで回帰分析

前回に続いてExcelでデータ分析です。

 

あるユーザーのプレイヤーレベルと所持しているキャラレベルの平均が以下のようなものだったとします。

 

プレイヤーLv キャラレベル平均
50 80
42 74
20 40
35 65
48 77
10 28
50 78
47 78
31 59

 

上記から散布図を作成します。

 

プレイヤーLv~キャラレベル平均の最後のセルまで選択してメニューの挿入のグラフから散布図を選びます。

f:id:nanami_yamato:20201024013236p:plain

 

自動で以下のような散布図ができます。

なんとなく直線ぽい比例の位置に並んでいるようにみえます。

f:id:nanami_yamato:20201024013525p:plain

 

回帰直線を引いてみます。

プロットされているいずれかの点を右クリックして、「近似曲線の追加」を選択します。

そうすると直線が引かれます。

 

直線をクリックして表示される近似曲線の書式設定で「グラフに数式を表示する」と「グラフにR-2乗値を表示する」にチェックをいれます。

 

f:id:nanami_yamato:20201024014744p:plain

 

そうすると、回帰式と決定係数のR2乗値が表示されます。

f:id:nanami_yamato:20201024015009p:plain

 

式が出ているので予測ができます。

例えばプレイヤーレベル25ではキャラのレベル平均は50あたりであると予測できます。

 

こんなに簡単にできるとは驚きです。

活用していきたいですね。

Excelでヒストグラムを作成する

https://cdn-ak.f.st-hatena.com/images/fotolife/n/nanami_yamato/20201011/20201011205010.png

Excelにはデータ分析を簡単にできるようになるツールがあります。

今回はそれを使って上記のようなヒストグラムを表示しようと思います。

分析ツールの有効化

これから使おうとする分析ツールは最初は有効でないので有効にする必要があります。

まずメニューの「ファイル」を選択、左のバーの一番下の「オプション」を選択して「Excelのオプション」を表示します。

f:id:nanami_yamato:20201011210047p:plain

Excelのオプション」のダイアログが表示されたら「アドイン」を選択して「設定」ボタンを選択します。

f:id:nanami_yamato:20201011210238p:plain

「分析ツール」にチェックをつけてOKをを選択します。

f:id:nanami_yamato:20201011210526p:plain

これでメニューの「データ」に「データ分析」が追加されます。

基本統計量の出力

今回例としてあるグループ12人の身長をデータとして使います。

まずは基本統計量を算出します。

Excelのシートの一行目にラベル、2行目以降に12個のデータを入れます。

f:id:nanami_yamato:20201011210935p:plain

メニューの「データ」の「データ分析」を選択して出たダイアログで「基本統計量」を選択して「OK」を選択します。

f:id:nanami_yamato:20201011211119p:plain

出てきた基本統計量のダイアログで、「入力範囲」を入力し、「先頭行をラベルとして使用」にチェック、「統計情報」にチェックして「OK」を選択します。

f:id:nanami_yamato:20201011211423p:plain

そうすると以下のように平均や中央値、最頻値、標準偏差などが出力されます。

f:id:nanami_yamato:20201011211453p:plain

ヒストグラムを表示する

同じ身長のデータでヒストグラム表示をしてみたいと思います。

まずはどのまとまりでまとめて表示するかの設定(身長階級)を追加します。

以下のように5cmきざみでまとめることにします。

f:id:nanami_yamato:20201011211611p:plain

メニューの「データ」の「データ分析」を選択して出たダイアログで「ヒストグラム」を選択して「OK」を押します。

f:id:nanami_yamato:20201011211801p:plain

「入力範囲」に身長データを選択し、「データ区間」に5きざみで入力したデータを選択し、「ラベル」と「グラフ作成」にチェックをつけて「OK」を選択します。

f:id:nanami_yamato:20201011212112p:plain

すると以下のように出力されます。

f:id:nanami_yamato:20201011212147p:plain

この身長階級の値は上限です。

なので、例えば165は160より大きく165以下の値が含まれます。

このままだと見にくいので以下の設定をしました。

  • 出力された身長階級のセルを変更してとグラフの横軸のラベルを変更
  • グラフの部分を右クリック、データ系列の書式設定で0%で間隔をなくす
  • タイトル、横軸ラベル、縦軸ラベルの変更
  • グラフエリア全体のサイズ調整

f:id:nanami_yamato:20201011212618p:plain

まとめ

今回ざっとやってみたましたがどうでしょうか。

割とぱぱっとできたのではないでしょうか。

ただ、グラフの見栄えの部分を調整するにはちょっと手がかかるかもしれません。

データ分析をExcelでも簡単にできるということがわかって、色々便利な機能が追加されていたんだなと改めて思いました。

他のツールなども色々使ってデータを扱っていきたいですね。

データサイエンス・オンライン講座

あっという間に10月になってしまいましたが、いかがお過ごしでしょうか。

 

私は相変わらずのテレワークで、いい加減この仕事の仕方にも慣れてきたところです。

 

最近は通勤が浮いた時間で機械学習を勉強しよう!と意気込んで、勉強しています。

新しいことを学ぶことは刺激になるんですが、まだ勉強の域を出ないので早く実践レベルで使えるようになりたいなーと思っているこの頃です。

 

機械学習と切っても切り離せないのが大量のデータの取り扱い。

そういうのもあって、Pythonを使ってデータ分析周りを学習していくことも必要なことなのではと思い始めました。

 

前置きが長くなりましたが、最近見つけてやろうと思っているのが以下です。

 


登録は必要ですが、無料で受けれるそうなので興味ある方は受けてみるのもいいかと思います。

 

私はそもそものデータサイエンスとは何ぞやのところがわかっていないので入門編を先にやっています。


全部やってみて感想を書くかなって思ったんですが、それだといつになるかわからないし、公開期間があるので先に紹介することにしました。

 

あと、やってるってのを宣言しておいてちゃんとやろうという自分へのプレッシャーにもしようという算段でもあります。

 

全部やってみての所感はまたいずれの機会に。

テレワークの運動不足を解消しようとした話

7月もあっという間に終わり、暑い日が続いている今日この頃いかがお過ごしでしょうか。

 

6月末に発覚した運動不足。

これはいけないと対策を考えこの一か月実践してきました。

 

(発覚したときの記事はこちら)


どういうことをしてきたか、どうなったか振り返りのためにまとめてみます。

 

問題点

・テレワークで通勤がなくなり、日平均6000歩以上だったところが2000歩いかに減っていたこと

・ジムに行けなくなり、筋肉が落ちていたこと

・肩こりがはんぱないことになっていたこと

 

日平均6000歩以上だったところが2000歩いかに減っていた

テレワークで通勤がなくなったため、日平均2000歩以下になっていました。

自粛も相まって外で歩くこと自体が少なくなっていました。

 

そこで、目標として立てたのが「4000歩以上毎日歩く」です。

なぜ4000歩なのかというと、いきなり6000歩とかだと続かないと思ったからです。

継続できなければ意味がないのでその目標設定にしました。

 

しかし、やってみると毎日4000歩以上歩くというのは結構つらい。

例えば雨の日だったり、体調がすぐれないときもある。

なので、「日平均4000歩以上歩く、ただし毎日2000歩以上は歩く」に変更しました。

これで晴れた日、体調の良い日に多めに歩くことで歩数を稼げるようにしてかつ、無理のない範囲で歩けるようになりました。

 

結果は

f:id:nanami_yamato:20200805093117j:plain

 

平均4000歩は超えることができました。

なにより、毎日歩いています。週2、3日しか歩いていなかった6月と比べて雲泥の差です。

歩くことは気分転換になったり、足回りの運動不足の解消など良いことがあります。

目標の歩数を少しずつ増やして6000に近づけていきたいです。

 

ジムに行けなくなり、筋肉が落ちていたこと

ジムに行くのは怖い。

そんな気持ちで週1は行っていたジムに2月あたりからずっと行っていませんでした。

そうすると筋肉は当然落ちていきます。

 

体重は毎日計っているんですが、2か月で2、3キロ減りました。

運動不足になるほどなので、どう考えてもこれは脂肪が減ったわけではなくて筋肉が落ちたのだとわかります。

 

ともかく筋肉を増やさなくても、減らさない努力はしないといけないと思い立って対策を考えました。

 

なかなかいい案が思い浮かばない中、同僚から教えてもらった動画で

「これだ!」

っていうのがありました。

www.youtube.com

 

ジム通いで一番難しかったことは継続することでした。

その経験から、毎日できるくらいの内容で効果のある内容が私にはあっていると感じていました。

なのでこの動画を見たときに、これならできると感じました。

 

上記動画以外にも以下のような動画など複数を組み合わせてやっています。

【自宅で筋トレ】世界で一番楽な筋トレ&有酸素運動で全身10種目の10分間です。楽に脂肪燃焼、肩こり解消、腰痛解消、運動不足解消したい方におすすめです。

 

肩こりがはんぱないことになっていたこと

デスクワークなので、もともと肩こりは慢性的で結構こっていました。

しかし、テレワークになってからさらにコリがひどくなっていました。

多分要因は色々あるのだろうけど、今まで以上にディスプレイを見る時間が増えたせいでしょう。

 

この際だから肩こりを和らげたいと思い対策を考えました。

 

一つは筋トレ。

筋肉が落ちていた対策でやっているものは肩こり腰痛にも効きます。

もう一つはラジオ体操やストレッチ。

仕事の始業前、終業後にラジオ体操、風呂上りや休憩時間にストレッチをしています。

 

動かさないのが原因なわけだから動かしてやればいい。そういうことです。

 

意識してやるようになってから肩こりは徐々に改善しています。

 

まとめ

これらを意識的に行うことで、運動不足や筋力低下を防げていると思います。

肩こりも和らぎました。

また、体を動かすことで気分が良くなったり、眠る時間や質も改善したと思います。

 

体を動かすのが面倒くさいと思っても、日課にまでできたことなら割と苦なく取り組めます。

継続させる仕組みを作ることだったり取り組めるようにハードルを下げるのはすごく大事だと実感しています。

 

これからも続けていこうと思います。

【ヘルスケア】テレワークの運動不足が数値化されてた話

f:id:nanami_yamato:20200705193049p:plain

テレワーク継続中

テレワークも3か月になろうとしています。

運動不足をずっと感じながら、「運動しなきゃな~、面倒くさいな~」なんて言ってあまり積極的にはしてきませんでした。

事件

事件が起こったのは先月の下旬。

仕事が終わってごはんも食べてゆっくりしてたときです。

ニュースでテレワークで運動不足みたいなのをやってて、そういや自分ってどうなんだっけと思い何か計測できるものってあったっけと思いを巡らせました。

iPhoneにはヘルスケアという歩数を記録してくれているアプリがあるということに思い当たり、起動してみました。

f:id:nanami_yamato:20200705203329p:plain


「え、これやばくね?」


考察と対策

f:id:nanami_yamato:20200705203618p:plain

この画像は年間のですが、8月までは平均6000歩以上だったのに、4、5、6月が明らかに歩数が下がっています。

どう見ても2500歩以下になっていました。

「そもそも歩いてなくね?」

そうです。テレワークで通勤が0になり、なおかつ買い物はまとめて済ますことが多くなったせいで外を歩くこと自体が一気に減ったのでした。


じゃあ急に走ろう!みたいなことをすると長続きしないのは自分の性格上明白なので、いけそうな目標を立てました。

それは、最低一日4000歩を毎日歩く、です。

今まで多くても4000未満だったのに、いきなり8000とかは厳しいだろうと思い、まずは4000にしました。

測ってみると近くのコンビニまでは2000歩、スーパーに買い物に行くと3000歩。

なので、スーパーに買い物に行く日は朝や昼や夜いずれかに1000歩、そうでないときはコンビニに一回行って、その他で2000歩歩けばよいということです。

これならいけそうかも。

私の場合は1000歩は10分くらいでしたので、朝仕事前か昼休憩中、または仕事終わってごはん食べてちょっとしてから歩くようにしました。

まとめ

これは始めてまだ一週間しか経ってないので何とも言えませんが、歩き始めて体調が良くなった気がします。(気がするだけかもですが)

また、積極的に体動かすという気持ちになっているので、良いかなと思います。

あわせて、朝と夜にラジオ体操、仕事の日も2時間に一回ストレッチや筋トレをやっています。

朝天気が良くて歩いた日は仕事に向かう気持ちが上がるし、昼に歩くのも気分転換になっています。

「体動かすのって大事なことやったんや(えせ関西弁)」

続けていきたいですね。