这是莲子的又一个坑,用于记录和学习概统。
所用教材为《概率论与数理统计》第二版,朱翼隽主编。
“事件A发生必然导致事件B发生”,记作A\(\subset \)B,如果A\(\subset \)B且B\(\subset \)A,则A=B
“事件A或事件B至少发生一个”,记作A\(\cup \)B或A+B
“事件A和事件B同时发生”,记作A\(\cap \)B或AB
“事件A与事件B不可能同时发生”,则A与B“互斥”
“事件A与事件B必定发生其中一个,且A与B互斥”,则A与B互逆,A的逆事件\(\overline{A}\)=B
“事件A发生且事件B不发生”,记为A-B
定义发生事件A的概率P(A)=p。
对任意事件,0\(\leq \)p\(\leq \)1,且P(\(\phi \))=0,P(\(\Omega \))=1。
P(A)+P(\(\overline{A}\))=P(\(\Omega \))=1。
若B\(\subset \)A,P(A-B)=P(A)-P(B)。
对任意事件A,B,P(A+B)=P(A)+P(B)-P(AB),
古典概型:结果有限,两两互斥,概率相等。例:投掷一枚骰子的结果。
几何概型:等可能性,借助几何度量确定概率。例:在[0,10]中点A落在某一范围。
在事件B发生的情况下发生事件A的概率,称为条件概率,记作P(A|B)
P(A|B)=\(\frac{P(AB)}{P(B)}\)
当两个事件相互独立(即两个事件相互之间无影响)时,P(A|B)=P(A)。
若P(AB)=P(A)\(\cdot \)P(B),则事件A与事件B相互独立,且\(\overline{A}\)与B,A与\(\overline{B}\),\(\overline{A}\)与\(\overline{B}\)均相互独立。
在重复独立试验中,如果每次结果只有两个,即事件A与事件\(\overline{A}\),且P(A)=p,P(\(\overline{A}\))=1-p=q,则该试验称为伯努利试验。
事件A在n次试验中出现k次的概率为\(P_{n}(k)=C_{n}^{k}p^{k}(1-p)^{n-k}\)
问题来了,莲子因为挖坑不填而被隙间的概率有多大?这貌似还是一个条件概率……
P(莲子被隙间|莲子挖坑不填)=?
@crazypeanut 问题来了,莲子因为挖坑不填而被隙间的概率有多大?这貌似还是一个条件概率……
P(莲子被隙间|莲子挖坑不填)=?
这两个是独立事件,所以P=0。
我莲子是不可能被隙间的!
如果随机变量X有限或可数无限,则称X为一个离散型随机变量,p\(_{k}\)=P(X=x\(_{k}\))(k=1,2,…)为随机变量X的概率分布或分布律。
二点分布:概率分布为
━━━━━━━━━━┯━━━━━━━━━━━━━━━━━━━━
是的没看错\(X\)仍然是我│我就是用在\(0\)没有表格的这个论坛\(1\)
──────────┼────────────────────
传说\(P(X=x_{i})\)中的│美丽帅气的\(q\)视情况增减的占位字\(p\)
━━━━━━━━━━┻━━━━━━━━━━━━━━━━━━━━
的分布称为二点分布(其中q=1-p),记为B(1,p),其中p为参数(也就是发生概率),如果随机变量X的分布为二点分布,也称X服从二点分布,记为X~B(1,p)
例:X为抛1次硬币后正面向上。
二项分布:概率分布为
\(P(X=k)=C_{n}^{k}p^{k}q^{n-k},k=0,1,2,\cdots ,n;q=1-p,0< p< 1\)
的分布称为二项分布,记为B(n,p),其中n,p为参数,如果X服从二项分布,记为X~B(n,p)
例:X为抛n次硬币后正面向上的次数。
泊松分布:
泊松定理:设\(\lim_{x\to\infty }np_{n}=\lambda \),则
\(\lim_{x\to\infty}C_{n}^{k}p^{k}q^{n-k}=\frac{\lambda ^{k}}{k!}e^{-\lambda }\),\((q_{n}=1-p_{n})\)
概率分布为\(P(X=k)=\frac{\lambda ^{k}}{k!}e^{-\lambda }\),\(k=0,1,2,\cdots\)
的分布为泊松分布,当二项分布的n非常大,p很小时,二项分布可以近似用泊松分布代替。
如果随机变量X的分布函数F(x)可以表示成非负函数f(x)的积分
\[F(x)=\int_{-\infty }^{x}f(t)dt\]
则称随机变量X为连续型随机变量,f(x)称为X的概率分布密度函数或概率密度函数,简称为概率密度或密度
均匀分布:
概率密度为
\(f(x)=\left\{\begin{matrix}\frac{1}{b-a},
\\
\\ 0 ,
\end{matrix}\right.\)\(\begin{matrix}a\leqslant x\leqslant b
\\
\\ 其他
\end{matrix}\)
的分布称为在区间[a,b]上的均匀分布,记为U(a,b)。
指数分布:
概率密度为
\(f(x)=\left\{\begin{matrix}\lambda e^{-\lambda x},
\\
\\ 0,
\end{matrix}\right.\)\(\begin{matrix}x> 0
\\
\\ x\leqslant 0
\end{matrix}\)
的分布称为指数分布,记为\(Exp(\lambda )\),其中\(\lambda > 0\)为参数。
正太正态分布:
概率密度为
\(f(x)=\frac{1}{\sqrt{2\pi \sigma }}e^{-\frac{(x-\mu )^{2}}{2\sigma ^{2}}}\),\(-\infty < x< +\infty \)
的分布称为正太正态分布,记为\(N(\mu ,\sigma ^{2})\),其中\(\mu ,\sigma (\sigma > 0)\)为参数。
其中N(0,1)称为标准正太正态分布,图像如下
设X,Y为随机变量,存在函数g(x),使Y=g(X)(即\(y_{i}=g(x_{i})\),则\(P(Y=y_{i})=P(X=x_{i})\)
二维均匀分布:
概率密度为
\(f(x,y)=\begin{cases}
\frac{1}{A} & \text{ } (x,y)\in D \\
0& \text{ } 其他
\end{cases}\)
其中,D为xOy平面上面积为A的有界区域,,则称(X,Y)在D上服从二维均匀分布。
二维正太正态分布:
概率密度为
\(f(x,y)=\frac{1}{2\pi \sigma _{1}\sigma _{2}\sqrt{1-\rho ^{2}}}e^{-\frac{1}{2(1-\rho ^{2})}[\frac{(x-\mu _{1})^{2}}{\sigma _{1}^{2}}-\frac{2\rho (x-\mu _{1})(y-\mu _{2})}{\sigma _{1}\sigma _{2}}+\frac{(y-\mu _{2})^{2}}{\sigma _{2}^{2}}]}\)
\(-\infty < x< +\infty ,-\infty < y< +\infty\)
其中\(\mu _{1},\mu _{2},\sigma _{1},\sigma _{2},\rho \)均为常数,且\(\sigma _{1}> 0,\sigma _{2}> 0,-1< \rho < 1\),则称(X,Y)服从二维正态分布。
边缘分布:
二维变量其中一个概率为1时另一个的分布。
例:关于X的边缘分布:
分布函数:\(F_{X}(x)=F(x,+\infty )=\lim_{y\rightarrow +\infty }F(x,y)\)
概率密度:\(f_{X}(x)=\int_{-\infty }^{+\infty }f(x,y)dy\)
如果对所有x,y,有
\(P(X\leqslant x,Y\leqslant y)=P(X\leqslant x)\cdot P(Y\leqslant y)\)
即\(F(x,y)=F_{X}(x)\cdot F_{Y}(y)\)
则称随机变量X和Y相互独立
D为随机变量X的方差
\(D(X)=E((X-E(X))^{2})=E(X^{2})-[E(X)]^{2}\)
D的性质:
设C为常数,则D(C)=0。
设C为常数,X为随机变量,则D(CX)=C²D(X)。
设X,Y是两个相互独立的随机变量,则D(X±Y)=D(X)+D(Y)。
D(X)=0与P(X=C)=1互为充要。
切比雪夫不等式:对任意随机变量X,若E(X)=a,又存在D(X),则
\(\forall \varepsilon > 0,P(|X-a|\geqslant \geq \varepsilon )\leqslant \frac{D(X))}{\varepsilon^{2} }\)
研究对象的全体是“总体”,总体中的每一个对象为“个体”,总体可以与随机变量相互对应。
从总体中抽取n个个体来获取总体的部分信息,被抽取的为“样本”,n为样本容量,样本值的全体为“样本空间”。
设\((X_{1},X_{2},\cdots ,X_{n})\)为取自总体\(X\)的样本,
样本均值\(\overline{X}=\frac{1}{n}\sum_{i=1}^{n}X_{i}\)
样本方差\(S^{2}=\frac{1}{n-1}\sum_{i=1}^{n}(X_{i}-\overline{X})^{2}\)
样本标准差\(S=\sqrt{S^{2}}\)
\(\chi ^{2}\)分布:
如果随机变量X的概率密度为
\(f(x)=\left\{\begin{matrix}
\frac{1}{2^{\frac{n}{2}}\Gamma (\frac{n}{2})}x^{\frac{n}{2}-1}e^{-\frac{x}{2}}\\
0
\end{matrix}\right.\)\(\begin{matrix}
x> 0\\
x\leqslant 0
\end{matrix}\)
其中\(\Gamma (x)=\int_{0}^{+\infty }t^{x-1}e^{-t}dt\)
则称随机变量X服从自由度为\(n\)的\(\chi^{2}\)分布,记作\(X\sim chi^{2}(n)\),图像如下
性质1\(设X与Y相互独立,且X\sim chi^{2}(m),Y\sim chi^{2}(n),则X+Y\sim chi^{2}(m+n)\).
\(t\)分布:
如果随机变量X的概率密度为
\(f(x)=\frac{\Gamma (\frac{n+1}{2})}{\sqrt{n\pi }\Gamma (\frac{n}{2})}(1+\frac{x^{2}}{n})^{-\frac{n+1}{2}}\)
则称随机变量X服从自由度为\(n\)的\(t\)分布,记作\(X\sim t(n)\),图像如下
性质2\(设X与Y相互独立,且X\sim N(0,1),Y\sim chi^{2}(n),则\frac{X}{\sqrt{Y/n}}\sim t(n)\).
\(F\)分布:
如果随机变量X的概率密度为
\(f(x)=\left\{\begin{matrix}
\frac{\Gamma( \frac{m+n}{2})}{\Gamma( \frac{m}{2})\Gamma( \frac{n}{2})}m^{\frac{m}{2}}n^{\frac{n}{2}}x^{\frac{m}{2}-1}(mx+n)^{-\frac{m+n}{2}}\\
0
\end{matrix}\right.\)\(\begin{matrix}
x> 0\\
x\leqslant 0
\end{matrix}\)
则称随机变量X服从第一自由度为\(m\),第二自由度为\(n\)的\(F\)分布,记作\(X\sim F(m,n)\),图像如下
常见的总体大都服从正态分布,对于正太态总体的抽样分布,有
费希尔定理:设\(X_{1},X_{2},\cdots ,X_{n}\)为取自正态总体\(N(\mu ,\sigma ^{2})\)的样本,则
\(\overline{X}\sim N(\mu ,\frac{\sigma ^{2}}{n})\)
\(\frac{(n-1)S^{2}}{\sigma ^{2}}\sim \chi ^{2}(n-1)\)
\(\overline{X}与S^{2}相互独立\)
定理:设\(X_{1},X_{2},\cdots ,X_{n}\)为取自正态总体\(N(\mu ,\sigma ^{2})\)的一个样本,则
\(U=\sqrt{n}\frac{\overline{X}-\mu }{\sigma }\sim N(0,1)\)
\(T=\sqrt{n}\frac{\overline{X}-\mu }{S }\sim t(n-1)\)
定理:设\(X_{1},X_{2},\cdots ,X_{N}\)和\(Y_{1},Y_{2},\cdots ,Y_{n}\)分别取自两个相互独立的正态总体\(N(\mu _{1},\sigma ^{2}_{1})\)及\(N(\mu _{2},\sigma ^{2}_{2})\)的样本,则
\(U=\frac{\overline{X}-\overline{Y}-(\mu _{1}-\mu _{2})}{\sqrt{\frac{\sigma _{1}^{2}}{m}+\frac{\sigma _{2}^{2}}{n}}}\sim N(0,1)\)
\(F=\frac{S_{1}^{2}\sigma _{2}^{2}}{S_{2}^{2}\sigma _{1}^{2}}\sim F(m-1,n-1)\)
若\(\sigma _{1}^{2}=\sigma _{2}^{2}\),有\(T=\frac{\overline{X}-\overline{Y}-(\mu _{1}-\mu _{2})}{\sqrt{\frac{(m-1)S_{2}^{1}+(n-1)S_{2}^{2}}{m+n-2}}\sqrt{\frac{1}{m}+\frac{1}{n}}}\sim t(m+n-2)\)
在问题中需要进行假设,原假设\(H_{0}\)与备择假设\(H_{1}\)。
\(U\)检验法
\(\sigma ^{2}\)已知,\(\mu \)的假设检验。
\(H_{0}:\mu =\mu _{0}\)
已知样本均值\(\overline{X}\)是总体均值\(\mu \)的无偏估计,而且统计量\(U=\frac{\overline{X}-\mu _{0}}{\sigma /\sqrt{n}}\sim N(0,1)\),于是在假设\(H_{0}\)成立,且\(\sigma ^{2}\)已知的条件下,可以用统计量\(U\)作为检验统计量,\(U\sim N(0,1)\)。对于给定的\(\alpha \),查表得\(u_{\frac{\alpha }{2}}\),于是由\(P(|\frac{\overline{X}-\mu _{0}}{\sigma /\sqrt{n}}|\geqslant u_{\frac{\alpha }{2}})=\alpha \)可以确定\(H_{0}\)的拒绝域为\(|U|=|\frac{\overline{X}-\mu _{0}}{\sigma /\sqrt{n}}\geqslant u_{\frac{\alpha }{2}}|\)
将所得数值带入计算,若\(|u|\geqslant \mu _{\frac{\alpha }{2}}\),则拒绝假设\(H_{0}\),否则接受。
\(T\)检验法
\(\sigma ^{2}\)未知,\(\mu \)的假设检验。
\(H_{0}:\mu =\mu _{0},H_{1}:\mu \neq \mu _{0}\)
样本方差\(S^{2}\)是总体方差的无偏估计量,统计量\(T=\frac{\overline{X}-\mu _{0}}{S/\sqrt{n}}\sim t(n-1)\),于是在假设\(H_{0}\)成立,且\(\sigma ^{2}\)未知的条件下,可以用统计量\(T\)作为检验统计量,\(T\sim t(n-1)\)。对于给定的\(\alpha \),查表得\(t_{\frac{\alpha }{2}}(n-1)\),于是由\(P=(|\frac{\overline{X}-\mu _{0}}{S/\sqrt{n}}|\geqslant t_{\frac{\alpha }{2}}(n-1))=\alpha \)可以确定\(H_{0}\)的拒绝域为\(|T|=|\frac{\overline{X}-\mu _{0}}{S/\sqrt{n}}|\geqslant t_{\frac{\alpha }{2}}(n-1)\)
\(\chi ^{2}\)检验法
@DTSIo 我准备博资考的时候也写了概率论的笔记,涉及到特征函数和基本的鞅理论的部分都可以贴上来......
DT君又要弃更了么 /0o0 迷弟哭@[email protected]
@leafwest DT君又要弃更了么 /0o0 迷弟哭@[email protected]
我是用 latex 写的,感觉格式放到这里好像不太对......而且这学期任务量突然暴涨,也许再更新就是这学期的更加专门的学习笔记了啊