院試hub

院試 確率統計の出題傾向と対策

院試 確率統計の出題傾向。確率空間・確率変数・中心極限定理・推定・検定・マルコフ連鎖の頻出パターンと、数学系・情報系研究科ごとの試験範囲、答案で失点しやすい論点を整理します。

院試 確率 対策 の過去問演習へ

トピック整理を読んだら、院試 確率 対策 を出題する大学の過去問 解答PDFで演習を進めましょう。

確率統計は院試で「点数が伸びる人と止まる人が綺麗に分かれる」典型科目です。理由は二つあります。第一に、数学系では測度論的な定式化(σ-加法族・確率測度・独立性)を前提とした論証が要求されるのに対し、情報系では同じ用語を使いながら推測統計と機械学習の応用問題に振れる。同じ「確率」という看板でも、答案に書くべき内容が研究科ごとに違うため、汎用の参考書を1冊回しただけでは志望先の作法と合わない答案を量産してしまう。第二に、確率の問題は計算が合っていても「なぜその式が適用できるか」を一行書かないと配点を取り切れない構造になっていて、独立性・i.i.d.・分散有限・正則条件などの前提を曖昧にした答案は減点を積み重ねます。情報系では機械学習・データサイエンスの台頭に伴って配点比重が年々上がっており、いまや院試対策の中でも最優先で時間を割くべき分野の一つです。本記事は、数学系・情報系の双方を視野に入れた現実的な確率統計対策の地図です。

この分野が出題される大学・研究科

確率統計を主要試験科目として扱う研究科は、大きく数学系と情報系の二系統に分かれます。数学系では、京都大学 理学研究科 基礎数学、東京科学大学 理学院 数学系、神戸大学 理学研究科 数学、東京都立大学 理学研究科 数理科学、大阪公立大学 理学研究科 数学、東京大学 数理科学研究科 専門科目A などで、確率論の枠組みから推定・検定までを必答もしくは選択問題として出題する例が増えています。情報系では九州大学 システム情報科学府 情報科学(数学系)、東京科学大学 工学院 情報通信系、東京大学 情報理工学系研究科 電子情報学などで、確率変数・期待値・分散・条件付き確率・推定の基本論点が頻出です。注意したいのは、同じ「確率統計」でも数学系は測度論の入門までを意識した出題(σ-加法族や独立性の定義からの論証)、情報系は応用寄りの計算問題(マルコフ連鎖の定常分布、最尤推定、ベイズ更新)が中心という違いがある点です。志望研究科の傾向は想像ではなく、必ず最新の募集要項と過去問で直接確認してください。

学部段階で固めておくべき基礎

確率統計の演習に入る前に、最低限ここまでは詰めておく必要があります。逆に言えば、ここが曖昧なまま過去問演習に入ると、解説を読んでも「なぜそうなるのか」が腹落ちせず、結局2周目以降の効率が落ちます。

  • 集合演算:和集合・積集合・補集合、ド・モルガンの法則。σ-加法族の定義と確率測度の可算加法性で必須
  • 組合せ論:順列・組合せ・多項係数、包除原理。離散分布の確率計算と母関数の展開で常用
  • 線形代数:固有値・固有ベクトル、対角化、二次形式。多変量正規分布の共分散行列とマルコフ連鎖の遷移行列で必須
  • 微積分:重積分、変数変換のヤコビアン、ガンマ関数・ベータ関数。連続分布の期待値計算と変数変換問題で必須
  • ベイズの定理:条件付き確率の定義と全確率の公式。最尤推定とベイズ推定の境界を意識する出発点
  • 収束の概念:ε-N論法、一様収束と各点収束の区別。確率収束・概収束・分布収束の階層理解の前提

ここが怪しい場合は確率統計の演習に入る前に1〜2週間を集中的に確保し、学部2〜3年次の解析・線形代数の章末問題を埋めてから戻ってきた方が、結果的に近道になります。特にヤコビアンの計算と固有値問題は、確率統計の答案でほぼ毎回出てくる道具なので、これだけは確実に手が動く状態にしておいてください。

論点別に見る出題と失点

確率統計はサブトピックごとに固有の答案作法があり、各論点の頻出パターンと失点パターンは独立に整理した方が頭に残ります。1つずつ見ていきます。

確率空間と条件付き確率

頻出は、確率測度の公理からの基本性質の証明、独立性と排反の区別、条件付き確率と全確率の公式、ベイズの定理の応用問題。数学系では「(Ω, ℱ, P) を確率空間とせよ」から始まる論証が普通で、σ-加法族の定義(補集合に閉じている・可算合併に閉じている)を答案で確認しないまま「事象の極限」を扱うと根本的な減点になります。情報系で多いのはベイズ更新の応用で、検査の陽性的中率(事前確率と感度・特異度から事後確率を計算する)が典型問題ですが、ここで頻出する失点は「P(B|A) と P(A|B) を取り違える」「分母に全確率 P(B) = P(B|A)P(A) + P(B|Ã)P(Ã) を置き忘れる」の二つ。条件付き確率の問題は、まず樹形図か分割表を答案に描いてから式を立てる順序を崩さないでください。独立性については「2つずつ独立」と「3つ同時に独立」が異なることを意識した出題(パリティの例題など)が数学系で頻出します。

離散・連続分布と特性関数

頻出は、二項・ポアソン・幾何・負の二項などの離散分布、正規・指数・ガンマ・χ2・t・F などの連続分布、モーメント母関数と特性関数、変数変換のヤコビアン、最大値・最小値の分布、順序統計量。失点で最も多いのは「変数変換でヤコビアンの絶対値を取り忘れて密度関数が負になる」答案で、変換 Y = g(X) の密度を fY(y) = fX(g-1(y)) · |dg-1/dy| と書く際の絶対値を落とすと、結果が確率密度の条件(非負・全空間で積分が1)を満たしません。答案の最後に必ず ∫ fY(y) dy = 1 を確認する習慣をつけてください。モーメント母関数の問題では、MX(t) = E[etX] の存在範囲(t の収束半径)を確認しないまま微分すると採点者は減点します。正規分布の二次形式が χ2 分布に従うことの導出(Z12 + ··· + Zn2 ∼ χ2(n))は情報系・数学系どちらでも頻出で、t分布・F分布の構成(標本平均と標本分散の比)も含めて、分布の系譜を一枚の図で整理しておくと検定問題で迷いません。

大数の法則と中心極限定理

頻出は、大数の弱法則・強法則、中心極限定理(CLT)、収束概念の階層(概収束 ⇒ 確率収束 ⇒ 分布収束、ただし逆は不成立)、デルタ法、スルツキーの定理。失点の最頻は「収束の種類を曖昧にしたまま結論を書く」答案です。「中心極限定理により √n (X̄ - μ) / σ → N(0, 1)」と書く際、これは分布収束であって確率収束ではないことを明示しないと数学系では減点対象になります。CLTの適用条件(i.i.d. かつ分散有限、または独立で Lindeberg 条件)を一行確認することも必須で、独立でない場合や分散が無限の場合(コーシー分布など)への盲目的な適用は致命的なミスです。情報系で多いのは正規近似による信頼区間の構成で、ここでも「標本サイズ n が大きい」という前提を答案に書き、n = 30 程度の経験則を超えていることを明示してから近似に入る順序を守ってください。チェビシェフの不等式を使って大数の弱法則を証明する問題は、数学系で頻出する標準演習なので一度自力で書き下しておくと安心です。

最尤推定と十分統計量

頻出は、最尤推定量(MLE)の導出、モーメント推定との比較、不偏性・一致性・有効性、フィッシャー情報量とクラメール・ラオの下界、十分統計量と Neyman の分解定理、指数型分布族。失点の典型は「対数尤度関数 &ell;(θ) = ∑ log f(xi; θ) を θ で微分した後の符号取り違え」と「二階微分の確認を省略して最大値か最小値か曖昧にする」答案です。MLE を求めたら必ず ∂2&ell; / ∂θ2 < 0 を確認するか、対数尤度の凹性を一行示してください。正規分布の母分散の MLE が n で割る形(不偏分散は n-1 で割る)であることの区別、ポアソン分布の MLE が標本平均と一致することの導出は、ほぼどの研究科でも頻出する基本論点です。十分統計量を求める問題では、Neyman の分解定理 f(x; θ) = g(T(x), θ) · h(x) の形に分解できることを明示してから T(x) を答えるのが安全で、いきなり「T(x) = ∑ xi が十分統計量」と書くと論理が抜けます。フィッシャー情報量 I(θ) = E[(∂ log f / ∂θ)2] = -E[∂2 log f / ∂θ2] の二つの表現の同値性を要求する出題も数学系で見られます。

仮説検定

頻出は、帰無仮説と対立仮説の設定、第一種・第二種の誤り、検定統計量の構成、棄却域、p値、ネイマン・ピアソンの補題、尤度比検定、母平均・母分散・母比率の検定、適合度検定(χ2)。失点で最も多いのは「検定統計量の自由度を取り違える」答案です。母平均の検定で母分散既知なら標準正規、未知で標本分散を使うなら自由度 n-1 の t 分布。二標本検定では自由度 n1 + n2 - 2、適合度検定ではカテゴリ数 - 1 - 推定したパラメータ数。自由度の指定を一行間違えると棄却域が変わるので、検定統計量を書いた直後に分布と自由度を必ず明記してください。次に多いのが「片側検定と両側検定の区別を曖昧にする」失点で、対立仮説 H1: μ > μ0 なのか H1: μ ≠ μ0 なのかで臨界値が変わります。答案冒頭で H0 と H1 を明示し、有意水準 α を宣言してから検定統計量に進む順序を崩さないこと。ネイマン・ピアソンの補題を使う問題では、尤度比 Λ(x) = L(x; θ1) / L(x; θ0) が単調になることを示してから棄却域 {x : Λ(x) > k} を構成する流れを答案に残します。

マルコフ連鎖の基礎

頻出は、離散時間マルコフ連鎖の遷移行列、Chapman-Kolmogorov 方程式、状態の分類(再帰・非再帰、周期)、既約性・非周期性、定常分布の存在と一意性、エルゴード定理、吸収マルコフ連鎖の吸収確率と吸収時間。失点の典型は「既約性・非周期性を確認せずに定常分布の存在を主張する」答案です。定常分布 π は πP = π かつ ∑πi = 1 を解いて求めますが、その解が極限分布(任意の初期分布から収束する分布)と一致するためには既約・非周期が必要で、これを答案に書かないまま「したがって長期挙動は π である」と結論すると論理が抜けます。情報系では遷移行列の固有値分解から定常分布を読み取る問題が頻出で、最大固有値 1 に対応する左固有ベクトルを正規化したものが π になります。吸収マルコフ連鎖の問題は、まず非吸収状態間の遷移行列 Q と吸収状態への遷移行列 R に分解し、基本行列 N = (I - Q)-1を経由して吸収確率 NR と平均吸収時間 N·1 を求める定型手順を覚えておくと得点源になります。

出題大学ごとの色の違い

同じ確率統計でも、研究科が違えば「採点者が見ているもの」が違います。志望先によって演習の比重の置き方が変わります。

  • 東大 数理科学研究科 専門科目A:測度論的定式化が前提で、σ-加法族・確率測度の可算加法性から論証する答案が要求される。極限定理の証明(弱法則・CLT)を自力で書き下せる水準が安全圏。
  • 東大 情報理工 電子情報学:応用寄りで、ベイズ推定・最尤推定・マルコフ連鎖の定常分布が頻出。機械学習の前提知識(ベイズ更新、EM アルゴリズムの初歩)まで踏み込むと差がつく。
  • 京大 理学研究科 基礎数学:論理過程を最後まで書かせる文化。途中式の省略は配点を取り切れない。確率論の枠組みからの厳密な論証が中心で、伊藤『確率論』レベルの理解が前提。
  • 東京科学大 理学院 数学系:旧東工大の伝統で、確率変数の変数変換と分布収束の問題が深い。特性関数による CLT の証明(Lévy の連続性定理)まで触れた出題例もある。
  • 東京科学大 工学院 情報通信系:情報理論との接続が強く、エントロピー・相互情報量・KLダイバージェンスを扱う問題が確率と一緒に出る。マルコフ連鎖の応用も頻出。
  • 九大 システム情報科学府 情報科学(数学系):標準的な数理統計の出題範囲を満遍なく出す傾向で、推定・検定・マルコフ連鎖の三本柱を均等に詰めるのが効く。
  • 神戸大 理学研究科 数学:基礎概念の定義と性質を直接問う出題が多い。独立性・条件付き確率・各種収束の定義を自分の言葉で書ける状態にしておく必要がある。

外部生がつまずく構造的な理由

確率統計で外部生が苦戦するのは、能力差ではなく構造的な要因が大きいです。代表的なのは次の三つで、自分がどれに当たっているかを早めに自覚すると、対策の優先順位がはっきりします。

第一に、確率論と統計学の境界が曖昧なまま勉強を始めてしまうこと。確率論は「確率空間が与えられたときに事象や確率変数の性質を導く」演繹的な分野で、統計学は「観測データから未知のパラメータや分布を推測する」帰納的な分野です。この区別を意識せずに参考書を1冊回すと、最尤推定の問題で「尤度関数の対数を取って微分」という手順だけ覚えてしまい、なぜそれが推定量として正当化されるか(一致性・漸近正規性)を答案に書けない。数学系志望者は確率論を測度論的に学ぶ意識、情報系志望者は推測統計の論理構造を意識する意識、どちらも欠かせません。

第二に、計算は出来るが論証の作法が学部の授業で身についていないこと。学部の確率統計の講義はカリキュラム上「応用数学」の枠で行われることが多く、定義の確認や論理の正当化よりも計算例の消化に時間が使われがちです。その結果、過去問を解いても「正解の数値は出るが部分点が取り切れない」状態になる外部生が多い。具体的には、独立性の仮定・分散有限の前提・正則条件・収束の種類などを答案で明示する習慣が育っていない。これは独学では意識して矯正しないと身につかない作法で、模範解答を読む際に「数値計算の部分」だけでなく「前提条件の宣言部分」を写経することで矯正できます。

第三に、情報系と数学系で要求される答案スタイルの違いを知らないこと。情報系の答案で「σ-加法族を定義から確認」と書きすぎると論点がぼやけ、逆に数学系の答案で「機械学習的に解釈すれば」と応用に振ると採点者の意図と合わない。志望研究科の過去問を3〜5年分眺めて、模範解答の論証密度を自分の答案の基準にする必要があります。所属学部の作法しか知らない状態で本番に臨むと、内容理解が十分でも採点基準と微妙にずれた答案になります。

残り月数別の演習ロードマップ

確率統計の対策に使える月数別に、現実的に効くやり方を整理します。すべての月数で共通するのは「過去問1年分を最初に時間を計って解き、現状を可視化する」ことです。これを飛ばすと、得意分野(例えば計算問題)に時間を使いすぎ、苦手分野(例えば測度論的論証)を後回しにする悪い循環に入ります。

残り6か月の場合

最初の2か月は学部教科書(『統計学入門』など)の章末問題で基礎を固めます。難しい参考書を新たに買うより、学部講義で使った標準教科書を1冊ずつ通読する方が結果として速い。次の2か月で稲垣『数理統計学』もしくは Casella-Berger を通読しながら、過去問を年度ごとに解き、論点別の弱点と配点比重を可視化します。最後の2か月は弱点論点の章末問題と過去問演習を交互に回し、答案を時間制限付きで書く訓練に切り替えます。数学系志望者はこの最後の2か月の前半で伊藤『確率論』もしくは伏見『確率と確率過程』の必要箇所を集中して仕上げると測度論的論証に対応できます。

残り3か月の場合

過去問1年分を時間を計って解き、確率空間・分布・推定・検定・マルコフ連鎖の5論点のうち得点率の低いものを優先的に補強します。最初の1か月は弱点論点の教科書復習、次の1か月で過去問を直近5年分2周、最後の1か月は答案の作法(前提条件の宣言、収束の種類の明示、自由度の確認)と時間配分の調整。線形代数と微積分の基礎は毎日30分程度の固定枠を確保し、ヤコビアンの計算と固有値問題の手が鈍らないようにすることが重要です。

残り1か月の場合

この段階では新規範囲に手を広げるより、既に解いた過去問の答案を「採点者が読める形」に書き直す方が得点を伸ばします。各設問について、独立性の仮定・分散の有限性・収束の種類・検定統計量の自由度・ヤコビアンの絶対値、の5点を必ず答案に残す訓練を反復します。時間が足りない論点は、配点の取りやすい設問(離散分布の期待値・分散、条件付き確率のベイズ更新、定型的な検定問題)を確実に取りにいく戦略に切り替え、測度論的論証の証明問題は捨てる判断も必要です。

推奨教科書・参考書

確率統計の教科書選びは、新しい本を増やすより1冊を完走することの方が大事です。以下は「これだけ揃えれば十分」という基準で、各書の使いどころも併記します。

  • 東京大学教養学部統計学教室『統計学入門』(東京大学出版会) — 学部初年度の標準教科書。基礎概念と推定・検定の入門に最適で、章末問題も適切な難易度。確率統計に初めて触れる外部生はここから。
  • 稲垣宣生『数理統計学』(裳華房) — 数理統計の標準書で、推定論・検定論の論証密度がちょうど院試レベル。最尤推定・十分統計量・クラメール・ラオの下界・ネイマン・ピアソンの補題までこの一冊で揃う。
  • 伊藤清『確率論』(岩波書店)— 数学系志望者の必読書。測度論的確率論の枠組み(σ-加法族・確率測度・期待値の定義)から極限定理まで。京大基礎数学・東大数理科学を狙うなら避けて通れない。
  • 伏見正則『確率と確率過程』(岩波書店) — マルコフ連鎖・ポアソン過程・ブラウン運動の入門。情報系志望者にも読みやすく、応用例が豊富。
  • Casella-Berger『Statistical Inference』 — 英語の数理統計の標準書で、世界的に最も広く使われている。情報系志望者で機械学習方面に進む予定なら、ここで身につけた語彙が後々効く。
  • 東京大学教養学部統計学教室『自然科学の統計学』『人文・社会科学の統計学』 — 『統計学入門』の続編で、応用例が豊富。検定の使い分けや回帰分析の基礎を補強したい場合に。
  • 『大学院入試問題集』各社 — 実戦演習用。志望研究科の過去問が尽きた後に、他大学の類題で論点別の演習を補う。

院試hub の解答パックでカバーされる範囲

院試hub では確率統計が試験範囲に含まれる数学系・情報系研究科について、年度別の解答パックを揃えています。九大 システム情報科学府 情報科学(数学系)東大 数理科学研究科 専門科目A神戸大学 理学研究科 数学東大 情報理工 電子情報学 など、複数大学を比較しながら数学系の厳密な論証スタイルと情報系の応用計算スタイルの違いを学べる構成です。

各解答PDFは年度別に整理されていて、各設問に方針・典型失点・部分点の置き所を併記しています。使い方の推奨は次の順序です。まず公式PDFの問題を自力で時間を計って解く。次に解答パックの「方針」だけ先に読み、自分の方針と一致しているかを確認する。最後に答案全体を突き合わせ、独立性の仮定の明示・収束の種類の指定・検定統計量の自由度・ヤコビアンの絶対値など、確率統計に固有の答案作法の不備を直していく。3周目以降は時間配分の最適化に使えます。1年分を解くごとに、自分の弱点が「内容理解」「論証の作法」「計算精度」のどれに分類されるかを記録しておくと、残り月数別ロードマップの調整に役立ちます。

公開前に必ず最新の公式募集要項・公式過去問ページで試験科目・出題範囲を確認してください。

院試 確率 対策 を出題する大学・研究科 — 院試 過去問 解答PDF

院試 確率 対策 を含む院試対策の解答・解説PDF(公式過去問と併用する独自教材)。問題本文は含みません。

関連する対策ガイド

他の出題分野を見る

出題分野マップ一覧へ