104 lines
2.8 KiB
TeX
104 lines
2.8 KiB
TeX
\section{Oppgave 1: Kapittel 17, oppgave 1c}
|
|
|
|
I denne oppgaven bruker vi observasjonene
|
|
\[
|
|
\{(2,10), (3,8), (4,8), (6,7)\},
|
|
\]
|
|
og vi er gitt \(\sigma_0 = 0.5\) og \(n_0 = 4\).
|
|
|
|
\subsection{Tema}
|
|
Temaet er Bayesiansk lineær regresjon med informativ prior for usikkerheten. Vi skal
|
|
finne posteriorfordelingen til \(\tau\), posteriorfordelingen til \(y(x)\),
|
|
prediktiv fordeling for \(Y_+(x)\), samt tilhørende intervallestimater.
|
|
|
|
\subsection{Prior og hyperparametre}
|
|
Siden \(\sigma_0 = 0.5\) og \(n_0 = 4\), får vi
|
|
\[
|
|
\nu_0 = n_0 - 2 = 2,
|
|
\qquad
|
|
SS_0 = \sigma_0^2 \nu_0 = 0.5^2 \cdot 2 = 0.5.
|
|
\]
|
|
Dette brukes videre sammen med regresjonsstatistikkene fra datasettet.
|
|
|
|
\subsection{Posterior for \(\tau\)}
|
|
Når regresjonslinjen er estimert, får vi posteriorfordelingen
|
|
\[
|
|
\tau \mid \text{data} \sim \Gamma\!\left(\frac{\nu_1}{2}, \frac{SS_1}{2}\right).
|
|
\]
|
|
Her settes de konkrete tallene inn fra R-skriptet.
|
|
|
|
\subsection{Posterior for \(y(x)\)}
|
|
For en vilkårlig verdi \(x\) får vi
|
|
\[
|
|
y(x)\mid \text{data}
|
|
\sim
|
|
t\!\left(\alpha_0 + \beta x,\;
|
|
s_1\sqrt{\frac{1}{n} + \frac{(x-\bar{x})^2}{SS_x}},\;
|
|
\nu_1\right).
|
|
\]
|
|
De konkrete parameterverdiene kan hentes fra skriptet og settes inn her.
|
|
|
|
\subsection{Prediktiv fordeling for \(Y_+(x)\)}
|
|
Den prediktive fordelingen for en ny observasjon er
|
|
\[
|
|
Y_+(x)\mid \text{data}
|
|
\sim
|
|
t\!\left(\alpha_0 + \beta x,\;
|
|
s_1\sqrt{1 + \frac{1}{n} + \frac{(x-\bar{x})^2}{SS_x}},\;
|
|
\nu_1\right).
|
|
\]
|
|
|
|
\subsection{Intervallestimater}
|
|
Et \(95\%\)-kredibilitetsintervall for regresjonslinjen er
|
|
\[
|
|
I_{0.05}(x)
|
|
=
|
|
\alpha_0 + \beta x
|
|
\pm
|
|
t_{\nu_1,0.025}\,
|
|
s_1\sqrt{\frac{1}{n} + \frac{(x-\bar{x})^2}{SS_x}}.
|
|
\]
|
|
Et \(95\%\)-prediktivt intervall fås tilsvarende ved å legge til \(1\) inne i roten.
|
|
|
|
\subsection{Kommentar}
|
|
Denne oppgaven er en direkte anvendelse av formlene i kapittel 17. Hovedpoenget er
|
|
at vi kombinerer observasjonene med en svak informativ prior for usikkerheten, og
|
|
deretter leser av posterior- og prediktive fordelinger fra de oppdaterte hyperparametrene.
|
|
|
|
\subsection{R-kode}
|
|
Listing~\ref{lst:task12-r} viser delen av R-skriptet som løser bokoppgavene 1c og 1d.
|
|
|
|
\begin{listing}[H]
|
|
\begin{minted}{r}
|
|
task_1c <- data.frame(
|
|
x = c(2, 3, 4, 6),
|
|
y = c(10, 8, 8, 7)
|
|
)
|
|
|
|
fit_1c <- fit_simple_regression(task_1c$x, task_1c$y, nu0 = 4 - 2, SS0 = 0.5^2 * (4 - 2))
|
|
print_regression_summary(
|
|
label = "Task 1: Chapter 17, problem 1c",
|
|
fit = fit_1c,
|
|
x_eval = mean(task_1c$x),
|
|
level_y = 0.95,
|
|
level_pred = 0.95
|
|
)
|
|
|
|
task_1d <- data.frame(
|
|
x = c(0, 1, 2, 3),
|
|
y = c(0, 2, 7, 5)
|
|
)
|
|
|
|
fit_1d <- fit_simple_regression(task_1d$x, task_1d$y, nu0 = -2, SS0 = 0)
|
|
print_regression_summary(
|
|
label = "Task 2: Chapter 17, problem 1d",
|
|
fit = fit_1d,
|
|
x_eval = mean(task_1d$x),
|
|
level_y = 0.90,
|
|
level_pred = 0.95
|
|
)
|
|
\end{minted}
|
|
\caption{R-kode for bokoppgavene 17.1c og 17.1d}
|
|
\label{lst:task12-r}
|
|
\end{listing}
|