学習の進め方: Jupyter notebook対応のファイルをダウンロードし、 jupyter notebookを起動したあと、ウェブ上で作業します。 作業結果はすべてその(ウェブ)ページに残りますので、 その ipynb ファイルやそれから作成されたHTMLファイルをレポートとして毎回提出します。

講義スケジュール

註: 1~3(第1回~第6回)までのJupyter notebookはProbStatB.zipにまとめてあります。これをダウンロードし、展開して使ってください。 具体的な使い方は第1回の講義の時に説明します。
  1. 第1-2回目(9月27日,10月4日): Python入門, Jupyter notebook (Guide2Python.ipynb)
    主な内容: Pythonの起動法、Jupyter notebookの使い方、Pythonの概要, Python Tutorの使い方、レポートについて
    注意: Pythonではコメントの始まり記号は # です。(プログラミング言語Cとは異なり)//ではありません(エラーになります)
    進捗状況によっては第3回もPython入門とします。
    問題6は、「words.txtをダウンロードしておいたものをPythonから開く」こと を想定していました。しかし、requestsモジュールを使えば、 ウェブ上のファイルにPythonからアクセスすることができます。使い方などは 例えばこれ をみてください(自分で調べられるようになることも目標です)。
    演習問題5は「力任せ」の解き方で十分です。 より洗練された方法については 文字列アルゴリズムなどのページを参照してください。
  2. 第3-4回目(10月11, 18日): Numpy/Matplotlibの基礎, Jupyter notebook (Intro2Numpy.ipynb)
    : assets.zipをダウンロードし、展開する必要があります (展開後、assetsフォルダができて、その中にcat.jpgファイルがあることを確認する)

  3. 第5-6回目(10月25日,11月1日): Pandasの基礎, Jupyter notebook (Intro2Pandas.ipynb)
    この講義では SampleData を予めダウンロードし、展開しておくことが必要になります。
    : 配布した資料で、「関数の適用」のメソッドの表においてappyamapapplymapに訂正(このページにあるものは修正済み)

  4. 第7回目(11月8日): この資料から第11回目までの講義では ProbStatB2.zip を予めダウンロードし、展開しておくことが必要です。

    Pythonで確率を学ぶ, Jupyter notebook (Intro2Probab.ipynb)

  5. 第8回目(11月15日): Pythonで確率分布を学ぶ, Jupyter notebook (Intro2ProbDistri.ipynb)

  6. 第9回目(11月22日): Pythonで統計学を学ぶ(1), Jupyter notebook (Python-statistics1.ipynb)

  7. 第10回目(11月29日): Pythonで統計学を学ぶ(2), Jupyter notebook (Python-statistics2.ipynb)
    課題2-4の変更: 「相関係数は、共分散を(標本分散の平方根である)標準偏差の積で割った値となっているが、np.cov, np.stdを用いて確かめよ。異なる場合は標準偏差を不偏分散の平方根の値を用いて計算してみよ。」と修正します。

  8. 第11回目(12月6日): Pythonで統計学を学ぶ(3), Jupyter notebook (Python-statistics3.ipynb)
    「正規分布の性質」のコードについて、以下のように修正します:(赤字の部分が修正箇所)
      %matplotlib inline
      import numpy as np
      from scipy import stats as st
      import matplotlib.pyplot as plt
    
      x = np.linspace(-4, 4, 10000)
      plt.plot(x, st.norm.pdf(x,0,1), label=r'N(%i,%i)$' % (0,1))
      plt.axis([-4,4,-0.02,0.5])
      plt.axhline(0,c='g',ls='-.')
      plt.axvline(-2,c='b',ls='--')
      plt.axvline(2,c='b',ls='--')
      x = np.linspace(-2, 2, 10000)
      plt.fill_between(x, st.norm.pdf(x,0,1))
      plt.show()
    
    また、演習問題3-2の模範図に誤りがありました。訂正しておきます(再読込で訂正されるはず)。

  9. 第12回目(12月13日): Pythonで統計学を学ぶ(4), Jupyter notebook (Python-statistics4.ipynb)(12/13に修正)
    注意: 「検定を行え」や「検定で調べよ」という 問題では特に、プログラムの結果を表示しただけでは『何も述べていない』に等しい。
    『検定統計量これこれに対し、有意水準が{1/5}%であるから、(検定統計量の値は棄却域に{入る/入らない}ため)帰無仮説は{棄却/採択}され、対立仮説が{採択/棄却}される』というような文を書くこと
  10. 第13回目(12月20日): 小テスト、質疑応答、今までの補足 Pythonで統計学を学ぶ(4), Jupyter notebook (Python-statistics4.ipynb)(12月18日改訂:近藤さん、ご指摘ありがとう)
    訂正:(上記のリンク先は修正済み)
      独立性の検定(カイ自乗検定)のステップの記述において、
      1.帰無仮説と対立仮説をたてる: 帰無仮説H0は、「数学と統計学の2つの変数は独立(連関なし)」
      対立仮説H1は「「数学と統計学の2つの変数は独立(連関なし)」
     の箇所を次のように訂正します:
      1.帰無仮説と対立仮説をたてる: 帰無仮説H0は、「数学と統計学の2つの変数は独立(連関なし)」
      対立仮説H1は「「数学と統計学の2つの変数は独立でない(連関あり)
  11. 第14回目(1月10日): Pythonで統計学を学ぶ(5), Jupyter notebook (Python-statistics5.ipynb), レポート課題

    shidouhou.csvSampleData (zipファイル) の中にある。 また、read_csv関数で読み込むときにWindowsではencode-decode errorが出る ので、encoding='cp932'を関数のオプション引数として与えること

  12. 第15回目(1月17日): Pythonで統計学を学ぶ(6), Jupyter notebook (Python-statistics6.ipynb)
    「対応のある一元配置分散分析」はWindows環境下のPython3では実行できませんので、 扱いません(興味ある人はLinux OSを用いるか、 プログラミング言語Rを用いた2016年度までの講義を参照してください。

  13. 試験期間(1月24日): 1月10日に配布した課題に対するレポートを提出
    レポート課題