莲子的概统笔记

  1. 7周前
    6周前宇佐见莲子 重新编辑

    这是莲子的又一个坑,用于记录和学习概统。
    所用教材为《概率论与数理统计》第二版,朱翼隽主编。

  2. 6周前宇佐见莲子 重新编辑

    随机事件与概率


    当我们进行一个实验(例如抛硬币)时,
    “样本空间”是这个实验所有可能的结果,记为\(\Omega \);其中一个结果为“样本点”,记为\(\omega \);包含一个或多个“样本点”的集合称为“事件”,\(\phi \)为“不可能事件”即不可能发生的事件。
    例:
    投掷一个骰子,观察其落地后朝上面的点数
    “样本空间”:1,2,3,4,5,6
    一个“样本点”:1
    将“出现点数为偶数”这个“事件”记为A,
    A={2,4,6}或A={X|X=2,4,6}

    “事件A发生必然导致事件B发生”,记作A\(\subset \)B,如果A\(\subset \)B且B\(\subset \)A,则A=B
    “事件A或事件B至少发生一个”,记作A\(\cup \)B或A+B
    “事件A和事件B同时发生”,记作A\(\cap \)B或AB
    “事件A与事件B不可能同时发生”,则A与B“互斥”
    “事件A与事件B必定发生其中一个,且A与B互斥”,则A与B互逆,A的逆事件\(\overline{A}\)=B
    “事件A发生且事件B不发生”,记为A-B

    定义发生事件A的概率P(A)=p。
    对任意事件,0\(\leq \)p\(\leq \)1,且P(\(\phi \))=0,P(\(\Omega \))=1。
    P(A)+P(\(\overline{A}\))=P(\(\Omega \))=1。
    若B\(\subset \)A,P(A-B)=P(A)-P(B)。
    对任意事件A,B,P(A+B)=P(A)+P(B)-P(AB),
    古典概型:结果有限,两两互斥,概率相等。例:投掷一枚骰子的结果。
    几何概型:等可能性,借助几何度量确定概率。例:在[0,10]中点A落在某一范围。

    在事件B发生的情况下发生事件A的概率,称为条件概率,记作P(A|B)
    P(A|B)=\(\frac{P(AB)}{P(B)}\)
    当两个事件相互独立(即两个事件相互之间无影响)时,P(A|B)=P(A)。
    若P(AB)=P(A)\(\cdot \)P(B),则事件A与事件B相互独立,且\(\overline{A}\)与B,A与\(\overline{B}\),\(\overline{A}\)与\(\overline{B}\)均相互独立。

    在重复独立试验中,如果每次结果只有两个,即事件A与事件\(\overline{A}\),且P(A)=p,P(\(\overline{A}\))=1-p=q,则该试验称为伯努利试验。
    事件A在n次试验中出现k次的概率为\(P_{n}(k)=C_{n}^{k}p^{k}(1-p)^{n-k}\)

  3. 问题来了,莲子因为挖坑不填而被隙间的概率有多大?这貌似还是一个条件概率……
    P(莲子被隙间|莲子挖坑不填)=?

  4. 6周前

    @crazypeanut 问题来了,莲子因为挖坑不填而被隙间的概率有多大?这貌似还是一个条件概率……
    P(莲子被隙间|莲子挖坑不填)=?

    这两个是独立事件,所以P=0。
    我莲子是不可能被隙间的!

  5. 5周前宇佐见莲子 重新编辑

    随机变量及其分布


    如果对于样本空间\(\Omega \)中每一个基本事件\(\omega \),都有一个单值实函数X(\(\omega \))与之对应,且\(\forall \)x\(\in\)R,{\(\omega \),X(\(\omega \))\(\leq \)x}是一个随机事件,则称X=X(\(\omega \))为随机变量。
    F(x)=P(X\(\leq \)x)为随机变量X的分布函数。

    如果随机变量X有限或可数无限,则称X为一个离散型随机变量,p\(_{k}\)=P(X=x\(_{k}\))(k=1,2,…)为随机变量X的概率分布或分布律。

    二点分布:概率分布为
      ━━━━━━━━━━┯━━━━━━━━━━━━━━━━━━━━
    是的没看错\(X\)仍然是我我就是用在\(0\)没有表格的这个论坛\(1\)
      ──────────┼────────────────────
     传说\(P(X=x_{i})\)中的美丽帅气的\(q\)视情况增减的占位字\(p\)
      ━━━━━━━━━━┻━━━━━━━━━━━━━━━━━━━━
    的分布称为二点分布(其中q=1-p),记为B(1,p),其中p为参数(也就是发生概率),如果随机变量X的分布为二点分布,也称X服从二点分布,记为X~B(1,p)
    例:X为抛1次硬币后正面向上。

    二项分布:概率分布为
    \(P(X=k)=C_{n}^{k}p^{k}q^{n-k},k=0,1,2,\cdots ,n;q=1-p,0< p< 1\)
    的分布称为二项分布,记为B(n,p),其中n,p为参数,如果X服从二项分布,记为X~B(n,p)
    例:X为抛n次硬币后正面向上的次数。

    泊松分布:
    泊松定理:设\(\lim_{x\to\infty }np_{n}=\lambda \),则
    \(\lim_{x\to\infty}C_{n}^{k}p^{k}q^{n-k}=\frac{\lambda ^{k}}{k!}e^{-\lambda }\),\((q_{n}=1-p_{n})\)
    概率分布为\(P(X=k)=\frac{\lambda ^{k}}{k!}e^{-\lambda }\),\(k=0,1,2,\cdots\)
    的分布为泊松分布,当二项分布的n非常大,p很小时,二项分布可以近似用泊松分布代替。

    如果随机变量X的分布函数F(x)可以表示成非负函数f(x)的积分
    \[F(x)=\int_{-\infty }^{x}f(t)dt\]
    则称随机变量X为连续型随机变量,f(x)称为X的概率分布密度函数或概率密度函数,简称为概率密度或密度

    均匀分布:
    概率密度为
    \(f(x)=\left\{\begin{matrix}\frac{1}{b-a},
    \\
    \\ 0 ,
    \end{matrix}\right.\)\(\begin{matrix}a\leqslant x\leqslant b
    \\
    \\ 其他
    \end{matrix}\)
    的分布称为在区间[a,b]上的均匀分布,记为U(a,b)。

    指数分布:
    概率密度为
    \(f(x)=\left\{\begin{matrix}\lambda e^{-\lambda x},
    \\
    \\ 0,
    \end{matrix}\right.\)\(\begin{matrix}x> 0
    \\
    \\ x\leqslant 0
    \end{matrix}\)
    的分布称为指数分布,记为\(Exp(\lambda )\),其中\(\lambda > 0\)为参数。

    正太正态分布:
    概率密度为
    \(f(x)=\frac{1}{\sqrt{2\pi \sigma }}e^{-\frac{(x-\mu )^{2}}{2\sigma ^{2}}}\),\(-\infty < x< +\infty \)
    的分布称为正太正态分布,记为\(N(\mu ,\sigma ^{2})\),其中\(\mu ,\sigma (\sigma > 0)\)为参数。
    其中N(0,1)称为标准正太正态分布,图像如下
    标准正太函数.png

    设X,Y为随机变量,存在函数g(x),使Y=g(X)(即\(y_{i}=g(x_{i})\),则\(P(Y=y_{i})=P(X=x_{i})\)

  6. 5周前宇佐见莲子 重新编辑

    多维随机变量及其分布


    设一个随机实验E,它的样本空间是\(\Omega ={\omega },X=X{\omega }和Y=Y{\omega }\)是定义在\(\Omega \)上的随机变量,由它们构成的有序数组(X,Y)称为二维随机变量或二维随机向量。
    \(F(x,y)=P(X\leqslant x,Y\leqslant y)\)称为二维随机变量(X,Y)的分布函数,简称分布函数,或称为随机变量X和Y的联合分布函数,简称联合分布。
    \(P(X=x_{i},Y=y_{j})=p_{ij},i,j=1,2,\cdots \)称为二维离散型随机变量(x,y)的概率分布或分布律,或随机变量X和Y的联合分布律。
    如果存在非负函数f(x,y),使\(F(x,y)=\iint_{D}f(x,y)d\sigma =\int_{-\infty }^{x}\int_{-\infty }^{y}f(x,y)dxdy\),则称(X,Y)为二维连续型随机变量,函数f(x,y)为二维随机变量(X,Y)的概率密度或称为随机变量X和Y的联合概率密度。

    二维均匀分布:
    概率密度为
    \(f(x,y)=\begin{cases}
    \frac{1}{A} & \text{ } (x,y)\in D \\
     0& \text{ } 其他
    \end{cases}\)
    其中,D为xOy平面上面积为A的有界区域,,则称(X,Y)在D上服从二维均匀分布。

    二维正太正态分布:
    概率密度为
    \(f(x,y)=\frac{1}{2\pi \sigma _{1}\sigma _{2}\sqrt{1-\rho ^{2}}}e^{-\frac{1}{2(1-\rho ^{2})}[\frac{(x-\mu _{1})^{2}}{\sigma _{1}^{2}}-\frac{2\rho (x-\mu _{1})(y-\mu _{2})}{\sigma _{1}\sigma _{2}}+\frac{(y-\mu _{2})^{2}}{\sigma _{2}^{2}}]}\)
    \(-\infty < x< +\infty ,-\infty < y< +\infty\)
    其中\(\mu _{1},\mu _{2},\sigma _{1},\sigma _{2},\rho \)均为常数,且\(\sigma _{1}> 0,\sigma _{2}> 0,-1< \rho < 1\),则称(X,Y)服从二维正态分布。

    边缘分布:
    二维变量其中一个概率为1时另一个的分布。
    例:关于X的边缘分布:
    分布函数:\(F_{X}(x)=F(x,+\infty )=\lim_{y\rightarrow +\infty }F(x,y)\)
    概率密度:\(f_{X}(x)=\int_{-\infty }^{+\infty }f(x,y)dy\)

    如果对所有x,y,有
    \(P(X\leqslant x,Y\leqslant y)=P(X\leqslant x)\cdot P(Y\leqslant y)\)
    即\(F(x,y)=F_{X}(x)\cdot F_{Y}(y)\)
    则称随机变量X和Y相互独立

  7. 应该不会挖坑不填吧。下个月我就要考这门课了 /<<

  8. @李炼杰 应该不会挖坑不填吧。下个月我就要考这门课了 /<<

    这个坑正在缓慢填坑中。(我月底就考了)

  9. 5周前

    下星期博资考要考概率论......

  10. 3周前宇佐见莲子 重新编辑

    随机变量的数字特征


    数学期望E为随机变量X取值的概率的加权平均值
    离散型:\(E(X)=\sum_{k=1}^{+\infty }x_{k}p_{k}\)。
    连续型:\(E(X)=\int_{-\infty }^{+\infty }xf(x)dx\),如果该积分不绝对收敛,则称随机变量X的数学期望不存在。
    E的性质:
    设C为常数,则E(C)=C。
    设C为常数,X为随机变量,则E(CX)=CE(X)。
    设X,Y是任意两个随机变量,则E(X+Y)=E(X)+E(Y)。
    设X,Y是相互独立的随机变量,则E(XY)=E(X)E(Y)。

    D为随机变量X的方差
    \(D(X)=E((X-E(X))^{2})=E(X^{2})-[E(X)]^{2}\)
    D的性质:
    设C为常数,则D(C)=0。
    设C为常数,X为随机变量,则D(CX)=C²D(X)。
    设X,Y是两个相互独立的随机变量,则D(X±Y)=D(X)+D(Y)。
    D(X)=0与P(X=C)=1互为充要。

  11. 3周前
    3周前宇佐见莲子 重新编辑

    大数定律和中心极限定律


     设一列随机变量\(X_{1},X_{2}, \cdots \),如果存在\(a_{1},a_{2},\cdots \),有
    \(\forall \varepsilon > 0,\lim_{x\to +\infty }P(|\overline{X_{n}}-a_{n}|< \varepsilon )=1\),
    则称序列\(X_{1},X_{2}, \cdots \)服从大数定律。
    (意思就是说随着X数量的增加,X的平均值收敛于a)

    切比雪夫不等式:对任意随机变量X,若E(X)=a,又存在D(X),则
    \(\forall \varepsilon > 0,P(|X-a|\geqslant \geq \varepsilon )\leqslant \frac{D(X))}{\varepsilon^{2} }\)

  12. 2周前宇佐见莲子 重新编辑

    统计量及其分布

    研究对象的全体是“总体”,总体中的每一个对象为“个体”,总体可以与随机变量相互对应。
    从总体中抽取n个个体来获取总体的部分信息,被抽取的为“样本”,n为样本容量,样本值的全体为“样本空间”。

    设\((X_{1},X_{2},\cdots ,X_{n})\)为取自总体\(X\)的样本,
    样本均值\(\overline{X}=\frac{1}{n}\sum_{i=1}^{n}X_{i}\)
    样本方差\(S^{2}=\frac{1}{n-1}\sum_{i=1}^{n}(X_{i}-\overline{X})^{2}\)
    样本标准差\(S=\sqrt{S^{2}}\)

    \(\chi ^{2}\)分布:
    如果随机变量X的概率密度为
    \(f(x)=\left\{\begin{matrix}
    \frac{1}{2^{\frac{n}{2}}\Gamma (\frac{n}{2})}x^{\frac{n}{2}-1}e^{-\frac{x}{2}}\\
    0
    \end{matrix}\right.\)\(\begin{matrix}
    x> 0\\
    x\leqslant 0
    \end{matrix}\)
    其中\(\Gamma (x)=\int_{0}^{+\infty }t^{x-1}e^{-t}dt\)
    则称随机变量X服从自由度为\(n\)的\(\chi^{2}\)分布,记作\(X\sim chi^{2}(n)\),图像如下
    卡方分布.png
    性质1\(设X与Y相互独立,且X\sim chi^{2}(m),Y\sim chi^{2}(n),则X+Y\sim chi^{2}(m+n)\).

    \(t\)分布:
    如果随机变量X的概率密度为
    \(f(x)=\frac{\Gamma (\frac{n+1}{2})}{\sqrt{n\pi }\Gamma (\frac{n}{2})}(1+\frac{x^{2}}{n})^{-\frac{n+1}{2}}\)
    则称随机变量X服从自由度为\(n\)的\(t\)分布,记作\(X\sim t(n)\),图像如下

    性质2\(设X与Y相互独立,且X\sim N(0,1),Y\sim chi^{2}(n),则\frac{X}{\sqrt{Y/n}}\sim t(n)\).

    \(F\)分布:
    如果随机变量X的概率密度为
    \(f(x)=\left\{\begin{matrix}
    \frac{\Gamma( \frac{m+n}{2})}{\Gamma( \frac{m}{2})\Gamma( \frac{n}{2})}m^{\frac{m}{2}}n^{\frac{n}{2}}x^{\frac{m}{2}-1}(mx+n)^{-\frac{m+n}{2}}\\
    0
    \end{matrix}\right.\)\(\begin{matrix}
    x> 0\\
    x\leqslant 0
    \end{matrix}\)
    则称随机变量X服从第一自由度为\(m\),第二自由度为\(n\)的\(F\)分布,记作\(X\sim F(m,n)\),图像如下

    常见的总体大都服从正态分布,对于正态总体的抽样分布,有
    费希尔定理:设\(X_{1},X_{2},\cdots ,X_{n}\)为取自正态总体\(N(\mu ,\sigma ^{2})\)的样本,则
    \(\overline{X}\sim N(\mu ,\frac{\sigma ^{2}}{n})\)
    \(\frac{(n-1)S^{2}}{\sigma ^{2}}\sim \chi ^{2}(n-1)\)
    \(\overline{X}与S^{2}相互独立\)

    定理:设\(X_{1},X_{2},\cdots ,X_{n}\)为取自正态总体\(N(\mu ,\sigma ^{2})\)的一个样本,则
    \(U=\sqrt{n}\frac{\overline{X}-\mu }{\sigma }\sim N(0,1)\)
    \(T=\sqrt{n}\frac{\overline{X}-\mu }{S }\sim t(n-1)\)

    定理:设\(X_{1},X_{2},\cdots ,X_{N}\)和\(Y_{1},Y_{2},\cdots ,Y_{n}\)分别取自两个相互独立的正态总体\(N(\mu _{1},\sigma ^{2}_{1})\)及\(N(\mu _{2},\sigma ^{2}_{2})\)的样本,则
    \(U=\frac{\overline{X}-\overline{Y}-(\mu _{1}-\mu _{2})}{\sqrt{\frac{\sigma _{1}^{2}}{m}+\frac{\sigma _{2}^{2}}{n}}}\sim N(0,1)\)
    \(F=\frac{S_{1}^{2}\sigma _{2}^{2}}{S_{2}^{2}\sigma _{1}^{2}}\sim F(m-1,n-1)\)
    若\(\sigma _{1}^{2}=\sigma _{2}^{2}\),有\(T=\frac{\overline{X}-\overline{Y}-(\mu _{1}-\mu _{2})}{\sqrt{\frac{(m-1)S_{2}^{1}+(n-1)S_{2}^{2}}{m+n-2}}\sqrt{\frac{1}{m}+\frac{1}{n}}}\sim t(m+n-2)\)

  13. 2周前
    2周前宇佐见莲子 重新编辑

    参数估计


    已知总体\(X\)的分布函数形式,但是含有一个或多个未知参数,用样本构造一个统计量\(\widehat{\theta }(X_{1},X_{2},\cdots ,X_{N})\)来估计\(\theta \),称\(\widehat{\theta }\)是\(\theta \)的估计量。因为样本具有随机性,需要建立评价估计量优劣的标准。
    无偏性
    设\(\theta \)的总体的未知参数,\(\widehat{\theta }(X_{1},X_{2},\cdots ,X_{N})\)是总体的一个样本,\(\widehat{\theta }\)是参数\(\theta \)的一个估计量,若\(E(\widehat{\theta })=\theta \),则称\(\widehat{\theta }\)是\(\theta \)的一个无偏估计量,否则称\(b(\widehat{\theta })=E(\widehat{\theta }-\theta )\)为\(\widehat{\theta }\)的偏差。
    有效性
    设\(\widehat{\theta }_{1}\)和\(\widehat{\theta }_{2}\)都是未知参数\(\theta \)的无偏估计量,若\(D(\widehat{\theta }_{1})< D(\widehat{\theta }_{2})\),则称\(\widehat{\theta }_{1}\)比\(\widehat{\theta }_{2}\)有效。
    一致性
    设\(\widehat{\theta }\)为未知参数\(\theta \)的估计量,当样本容量\(n \to +\infty \)时,若\(\widehat{\theta }\)依概率收敛于0,即\(\forall \varepsilon < 0,\lim_{n \to +\infty }P(|\widehat{\theta }-\theta |)=1\),则称\(\widehat{\theta }\)为\(\theta \)的一个一致估计量。

  14. 2周前宇佐见莲子 重新编辑

    假设检验

     在问题中需要进行假设,原假设\(H_{0}\)与备择假设\(H_{1}\)。

    \(U\)检验法
    \(\sigma ^{2}\)已知,\(\mu \)的假设检验。
    \(H_{0}:\mu =\mu _{0}\)
    已知样本均值\(\overline{X}\)是总体均值\(\mu \)的无偏估计,而且统计量\(U=\frac{\overline{X}-\mu _{0}}{\sigma /\sqrt{n}}\sim N(0,1)\),于是在假设\(H_{0}\)成立,且\(\sigma ^{2}\)已知的条件下,可以用统计量\(U\)作为检验统计量,\(U\sim N(0,1)\)。对于给定的\(\alpha \),查表得\(u_{\frac{\alpha }{2}}\),于是由\(P(|\frac{\overline{X}-\mu _{0}}{\sigma /\sqrt{n}}|\geqslant u_{\frac{\alpha }{2}})=\alpha \)可以确定\(H_{0}\)的拒绝域为\(|U|=|\frac{\overline{X}-\mu _{0}}{\sigma /\sqrt{n}}\geqslant u_{\frac{\alpha }{2}}|\)
    将所得数值带入计算,若\(|u|\geqslant \mu _{\frac{\alpha }{2}}\),则拒绝假设\(H_{0}\),否则接受。

    \(T\)检验法
    \(\sigma ^{2}\)未知,\(\mu \)的假设检验。
    \(H_{0}:\mu =\mu _{0},H_{1}:\mu \neq \mu _{0}\)
    样本方差\(S^{2}\)是总体方差的无偏估计量,统计量\(T=\frac{\overline{X}-\mu _{0}}{S/\sqrt{n}}\sim t(n-1)\),于是在假设\(H_{0}\)成立,且\(\sigma ^{2}\)未知的条件下,可以用统计量\(T\)作为检验统计量,\(T\sim t(n-1)\)。对于给定的\(\alpha \),查表得\(t_{\frac{\alpha }{2}}(n-1)\),于是由\(P=(|\frac{\overline{X}-\mu _{0}}{S/\sqrt{n}}|\geqslant t_{\frac{\alpha }{2}}(n-1))=\alpha \)可以确定\(H_{0}\)的拒绝域为\(|T|=|\frac{\overline{X}-\mu _{0}}{S/\sqrt{n}}|\geqslant t_{\frac{\alpha }{2}}(n-1)\)

    \(\chi ^{2}\)检验法

  15. 上周

    莲子你的坑应该算填完了?我们这边10号考概率,感谢你的贴哈。 /<<

  16. @李炼杰 莲子你的坑应该算填完了?我们这边10号考概率,感谢你的贴哈。 /<<

    这个坑算是填完了吧,我考试也考完了,不过后面的少了一些内容,也不知道会什么时候继续完善。

  17. 我有点兴趣想接盘,考完试如果我还有这个兴致,我再和你说。

  18. DTSIo

    18楼 1月3日

    我准备博资考的时候也写了概率论的笔记,涉及到特征函数和基本的鞅理论的部分都可以贴上来......

 

后才能发言