2022-01-01から1年間の記事一覧

統計的検定でよく使われる手法をまとめる

思い出すのに時間が掛かってしまうことがあるので、よく行われる検定においてどの手法がどのように使われるか、なぜ使うことができるかをまとめようと思います。 母比率の検定 母比率の検定においては、 が十分大きいときに二項分布が正規分布に近似できるこ…

データ分析をするときに意識していること

データ分析者の果たすべき役割として良く言われることに、「価値ある意思決定をできるようにサポートすること」と「意思決定を効率化できるようにサポートすること」というものがあるが、このサポートの塩梅が非常に難しいことがある。 例えば、「データ上大…

XGBoostについての備忘録

XGBoost の公式ドキュメントを見るたびに、毎回「どのような式変形でこの形になるのだっけ」となり、思い出すのに時間がかかる箇所があったので、備忘録としてまとめようと思います。 xgboost.readthedocs.io 式変形の箇所 「Tree Boosting」という見出しの…

BigQueryで統計的検定をできるようにする

BigQueryで検定をしたい 分析データの格納先として BigQuery(BQ)が多くの会社で使われていますが、実際に分析をするときに統計的検定を行いたいことがあると思います。 しかし、BQ で検定をするためには面倒なことも多く、「もっと手軽にできるようにした…