文系のあなた!文系だからと言って理系の統計基礎知識は学ばなくていいと思ってませんか?データ解析能力が足りない社会人は多いです。それどころかデータ解析を見ないフリする社会人はとっても多い。実際には、大半の会話についていくための知識は、そんなに多くないんです。本っ当に最低限の知識を、本っ当にわかりやすくまとめました!文系のあなた、是非見てください!
- データ統計基礎知識の超・基礎を身につけたい方
- 実務に役立つ数学知識を学びたい学生や社会人(中学生でもたぶんわかる)
- 文系出身で数学を諦めていた社会人
- 理系出身でも数学の知識を再確認したい社会人
ども!過酷なパワハラ環境から自力で脱出した脱獄リーマンこと高岡遥也です!
私は文系だからと、数学的な知識・統計基礎知識を見ないふりする人が本当に多くてもったいない。ちょっと勉強するだけでも大きく知見が広がるんだ!ぜひ一緒に学んでいきましょう!
データ統計基礎知識を押さえる
第1回の内容は触りの中の触りだったけど、文系あるいは中学生でも理解できるレベルに深堀りしよう。この記事では、ばらつき・標準偏差・分布を扱うよ。平均値・中央値・最頻値・相関も扱おうと思っていたけど、こちらは第3回で。
第1回は、パン屋を使って説明したんだ。見てない方は先にどうぞ。今回は、統計基礎知識を深堀して実践的にビジネスシーンに即した説明をしていくよ。
統計基礎知識:統計の基本
ばらつき・標準偏差とは何か?
「ばらつき」とは、データの安定性や予測可能性を示すもの
「標準偏差」とは、それを数値化したもの
です。ばらつきと標準偏差の具体的な理解を深めるために、例を2つ挙げてみましょう。
コーヒーショップの場合


コーヒーショップAとコーヒーショップBがあるとします。それぞれの店舗で1日のカフェラテの売り上げを見てみましょう。コーヒーショップAでは、毎日110~120杯の間で安定しています。一方、コーヒーショップBでは、ある日は70杯、別の日は150杯と、日によって売り上げが大きく変動しています。コーヒーショップBの方が明らかに「ばらつき」が大きいと言えるでしょう。
このばらつきが大きいと、材料の発注や人員配置の予測が難しくなります。
実際に、ばらつきの程度は「標準偏差」という言葉で表すことができます。
店舗 | 平均 | 標準偏差 | 説明 |
コーヒーショップA | 114杯 | 3.2杯 | だーいたい、毎日111杯~117杯くらい売れてるよね。 毎日、117杯プラスα用意しておけば、まあ大丈夫か。 |
コーヒーショップB | 107杯 | 28.9杯 | だーいたい、毎日78杯~136杯くらい売れてるよね。 毎日136杯用意…いや、78杯しか売れなかったらめっちゃ廃棄になるやん! |
通販サイトの場合


次に、ある通販サイトの日々のアクセス数を見てみます。サイトAは毎日約3,000~3,200のアクセスがあり、非常に安定しています。しかし、サイトBでは、ある日は1,000アクセスで、ある日は5,000アクセスです。サイトAと比較して明らかにアクセス数の「ばらつき」が大きいことが見て取れます。
サイトBはサーバーの負荷対策や広告の出稿計画が難しくなるかもしれません。
店舗 | 平均 | 標準偏差 | 説明 |
サイトA | 3,114 | 65 | だーいたい、毎日3,049~3,179くらいアクセスあるね。 在庫処分セールはいつやっても、大丈夫か。 |
サイトB | 3,000 | 1,414 | だーいたい、毎日1,586~4,414くらいアクセスあるね。 在庫処分セール、人見てるときにやらないとな・・・。 |
ばらつき・標準偏差のまとめ
これらの例からわかるように、「ばらつき」「標準偏差」はビジネスのあらゆる側面で重要な指標となる。これらを正確に把握することで、需要の予測、在庫管理、人員配置、インフラ整備ど、より効率的な経営戦略を立てることが可能なるんだ。
また、どの業界であっても、変動に柔軟に対応できる体制を整えることは重要。予測可能な変動をきちんと定量的に予測する技術が「ばらつき」「標準偏差」を含めた統計基礎知識から出来ているわけだ。
ちなみに、標準偏差が便利だな・すごそうだな、と思った人はExcelの「STDEV.P関数」で簡単に算出できるよ。もっと詳しく知りたい人は、下記のようなサイトで学ぶとよいかと。


統計基礎知識:分布
分布とは?
次に、「ばらつき」「標準偏差」と関係性が深い「分布」について詳しく見ていこう。
分布は、データがどのように散らばっているか、または集中しているかを示すデータです。
先に示した日別のデータよりも大量のデータを容易に視覚化できる。「分布」は、
「どのようなデータが、どれだけ頻繁に出てきているのか」
を示しているとも言えます。データの分布を理解すると、直感的に「ばらつき」「標準偏差」も理解できます。これを通じて、企業が何に向けて努力すべきかを見出すヒントが得られるよ。
「分布とはこういうもの」という例を示します。
コーヒーショップの場合


コーヒーショップA
青のグラフを見てください。
- 日々一定の顧客数を持っていることがわかります。
- このデータだけでも、毎日の売上はある程度予測可能と考えられます。
- 在庫管理や人員配置において、予測可能なデータは経営上の大きな利点となります。
コーヒーショップB
オレンジのグラフを見てください。
- 日による売上の変動が激しいことがわかります。
- このデータだけでは、毎日の売上の予測は困難で、他に曜日別データ等を要すると考えられます。
- 別データを収集しても売上予測が困難である場合、発注や人員配置においてリスクをもたらす可能性があります。
通販サイトの場合


サイトA
緑のグラフを見てください。
- 3,000~3,999アクセスの間にほとんどの日が収まっていて、安定したアクセス数があります。
- サーバーの負荷対策や広告計画が予測可能と考えられます。
- いつセールやキャンペーンを行ってもアクセス数があるので、開催時期の心配は少ないでしょう。
サイトB
青のグラフを見てください。
- 青のグラフの通り、日によってアクセスが全くなかったりとても多かったり、アクセス数にばらつきが大きい事がわかります。
- サーバーの負荷対策や広告計画の大きな課題となります。
- セールやキャンペーンの効果を最大化するためには、アクセス数を安定化させるか、このばらつきの理由を理解して最大に近い数が狙える時に開催することになるでしょう。
分布の種類
分布には様々な種類がありますが、ここでは最も一般的な二つ、正規分布と一様分布について説明します。
正規分布


正規分布は、自然界や社会科学で最も一般的に見られる分布の一つです。ベルカーブやガウス分布とも呼ばれ、要するにデータが平均値周辺を中心に平均から離れるほどその確率が減っていくように、左右対称に数値が分布しているということです。
先に示したコーヒーショップや通販サイトの例は、だいたいこんな形のグラフになっているよね。例えば、身長も正規分布に従うと言われています。
正規分布に従っている場合に便利な事があります。平均値と標準偏差が推定できれば、ある事が起きる確率がおおよそ何%なのか、まで計算が出来てしまうことです。期待値の高い活動を繰り返しやっていると、適当にやっている人と比較にならない成功率を叩き出します。
一様分布


一様分布は、すべての値が同じ確率で発生する分布です。例えば、サイコロを振ったときの各目の出る確率は一様分布のようになります。
分布のまとめ
分布を理解することは、データの背後にある物語を読み解く鍵となります。正規分布や一様分布などの基本的な分布を把握するだけでも理解度が変わります。更に興味を深めていけば、データ分析の精度を高め、より有意義な洞察を得ることができるでしょう。
おわりに
データ統計基礎知識は、意思決定において非常に大きな役割を果たします。ばらつき、分布、そして次の回で説明する代表値、相関関係といった概念は、単なる数値には収まらず「確かな証拠」を私たちに示してくれます。
「ばらつき」を理解すると、時間対効果・費用対効果の良否を見分ける力が得られます。そして「分布」を把握すると、商品の売れ筋や価格戦略を見極める洞察を得られます。
統計基礎的な概念を武器に、データを読み解き、現場での深い予測を行いましょう。今後も、これらの概念をさらに深掘りしていきます。具体的なビジネスシーンでの応用例も共有していきますので、ご期待ください。
データの海を航海する際には、これらの数学的な知識が頼りになる羅針盤です。次回も、新たな発見と共にお会いしましょう。それでは、また次回のブログでお会いしましょう!

30代半ばのサラリーマンです!入社早々から4-5年は、周囲の上司や先輩に酷く追い詰められた経験あり。早朝深夜残業サービス当たり前。今ではそんなしょうもない類の人達を努力で出し抜いて成績優秀者として報奨を得たり役職者になる事ができました。自由に、楽しく、家族第一、それでも活躍できるサラリーマンを日々目指しています。苦しみ悩む社会人を応援するためにブログ発信を決意。
コメント