MA-223/Oblig/3c/latex/sections/task1_kap17_1c.tex

\section{Oppgave 1: Kapittel 17, oppgave 1c}

I denne oppgaven bruker vi observasjonene
\[
\{(2,10), (3,8), (4,8), (6,7)\},
\]
og vi er gitt \(\sigma_0 = 0.5\) og \(n_0 = 4\).

\subsection{Tema}
Temaet er Bayesiansk lineær regresjon med informativ prior for usikkerheten. Vi skal
finne posteriorfordelingen til \(\tau\), posteriorfordelingen til \(y(x)\),
prediktiv fordeling for \(Y_+(x)\), samt tilhørende intervallestimater.

\subsection{Prior og hyperparametre}
Siden \(\sigma_0 = 0.5\) og \(n_0 = 4\), får vi
\[
\nu_0 = n_0 - 2 = 2,
\qquad
SS_0 = \sigma_0^2 \nu_0 = 0.5^2 \cdot 2 = 0.5.
\]
Dette brukes videre sammen med regresjonsstatistikkene fra datasettet.

\subsection{Posterior for \(\tau\)}
Når regresjonslinjen er estimert, får vi posteriorfordelingen
\[
\tau \mid \text{data} \sim \Gamma\!\left(\frac{\nu_1}{2}, \frac{SS_1}{2}\right).
\]
Her settes de konkrete tallene inn fra R-skriptet.

\subsection{Posterior for \(y(x)\)}
For en vilkårlig verdi \(x\) får vi
\[
y(x)\mid \text{data}
\sim
t\!\left(\alpha_0 + \beta x,\;
s_1\sqrt{\frac{1}{n} + \frac{(x-\bar{x})^2}{SS_x}},\;
\nu_1\right).
\]
De konkrete parameterverdiene kan hentes fra skriptet og settes inn her.

\subsection{Prediktiv fordeling for \(Y_+(x)\)}
Den prediktive fordelingen for en ny observasjon er
\[
Y_+(x)\mid \text{data}
\sim
t\!\left(\alpha_0 + \beta x,\;
s_1\sqrt{1 + \frac{1}{n} + \frac{(x-\bar{x})^2}{SS_x}},\;
\nu_1\right).
\]

\subsection{Intervallestimater}
Et \(95\%\)-kredibilitetsintervall for regresjonslinjen er
\[
I_{0.05}(x)
=
\alpha_0 + \beta x
\pm
t_{\nu_1,0.025}\,
s_1\sqrt{\frac{1}{n} + \frac{(x-\bar{x})^2}{SS_x}}.
\]
Et \(95\%\)-prediktivt intervall fås tilsvarende ved å legge til \(1\) inne i roten.

\subsection{Kommentar}
Denne oppgaven er en direkte anvendelse av formlene i kapittel 17. Hovedpoenget er
at vi kombinerer observasjonene med en svak informativ prior for usikkerheten, og
deretter leser av posterior- og prediktive fordelinger fra de oppdaterte hyperparametrene.

\subsection{R-kode}
Listing~\ref{lst:task12-r} viser delen av R-skriptet som løser bokoppgavene 1c og 1d.

\begin{listing}[H]
\begin{minted}{r}
task_1c <- data.frame(
  x = c(2, 3, 4, 6),
  y = c(10, 8, 8, 7)
)

fit_1c <- fit_simple_regression(task_1c$x, task_1c$y, nu0 = 4 - 2, SS0 = 0.5^2 * (4 - 2))
print_regression_summary(
  label = "Task 1: Chapter 17, problem 1c",
  fit = fit_1c,
  x_eval = mean(task_1c$x),
  level_y = 0.95,
  level_pred = 0.95
)

task_1d <- data.frame(
  x = c(0, 1, 2, 3),
  y = c(0, 2, 7, 5)
)

fit_1d <- fit_simple_regression(task_1d$x, task_1d$y, nu0 = -2, SS0 = 0)
print_regression_summary(
  label = "Task 2: Chapter 17, problem 1d",
  fit = fit_1d,
  x_eval = mean(task_1d$x),
  level_y = 0.90,
  level_pred = 0.95
)
\end{minted}
\caption{R-kode for bokoppgavene 17.1c og 17.1d}
\label{lst:task12-r}
\end{listing}