一、本周工作内容
(一)课程学习
- 学习了统计学导论的前六章(概率论部分)
- 深入学习了python,掌握了部分数据结构的用法,算法方面暂未涉及
- 背了少量单词,做了三道六级真题
- 学习了代码简洁之道的皮毛
- 学习了设计模式的皮毛
(二)文献阅读
阅读了《统计学导论》、《代码简洁之道》、菜鸟教程里python及设计模式的相关内容
(三)实验研究
(四)项目工作
二、本周遇到的问题及解决方案
(一)问题
- 统计学导论阅读出现困难,应该是状态所致
- 未涉及系统化的代码编写
- 统计学导论母函数理解不透彻
(二)解决方案
- 积极调整状态,时间不多了
- 抓紧时间保质保量完成统计学的学习,向导师及时汇报,听取导师意见建议,明确下一步研究方向和重点
- 学习组合数学
三、本周工作收获与体会
(一)知识和技能方面
- 统计学导论
- 引论
- 统计学分为描述统计学和推断统计学
描述统计学:研究简缩数据和描述数据
推断统计学:研究利用数据去做出决策,有不肯定性
- 也有统计理论和方法论的分野
统计理论是应用数学的分支,扎根于概率论,包含概率论,也有概率论以外的东西,如随机化原则的理论、各种估计的原理、假设检验的原理、一般的决策原理
- 概率
- 古典概率(先验概率)
- 互不相容、等可能
- 根据以往经验和分析得到的概率,比如全概率公式,它往往作为由因求果种的因出现的概率
- 频数概率(后验概率)
是信息理论的基本概念。在通信系统中,在收到信息后,接收端所了解的发送端发送的概率
- 加入一个不确定时间的发生的主观概率,因为新情况的出现而改变,变前的就是先验概率,变后的是后验概率
- 此处有全概率和贝叶斯
- 全概率是把复杂事件的概率分解为简单事件概率的加权和,核心是用样本空间的划分(一组互斥且穷尽所有可能的事件)
- 全概率的数学定义:设B1, B2, …, Bn是样本空间Ω的一个划分(即Bi∩Bj=∅且∪inBi=Ω),且P(Bi)>0,那么对任意事件A,有:P(A)=∑i=1nP(Bi)⋅P(A∣Bi)
直观理解:事件A发生的概率等于每个“原因”Bi发生的概率,乘以该“原因”下A发生的条件概率,最后求和。
- 示例:设有B1、B2两个生产线,产量分别是60%和40%,B1的次品率是5%,B2的次品率是20%,球随机抽以一个产品是次品(事件A)的概率
P(A)=P(B1)P(A∣B1)+P(B2)P(A∣B2)=0.6∗0.05+0.4∗0.1=0.07
- 贝叶斯用于计算“逆概率”:已知事件A发生,求它由某个“原因”Bi导致的概率(后验概率)。它是全概率公式的逆向应用,核心是先验概率和后验概率的转换
- 贝叶斯的数学定义:在全概率的条件下,贝叶斯表示为:P(Bj∣A)=P(A)P(Bj)⋅P(A∣Bj)=∑i=1nP(Bi)⋅P(A∣Bi)P(Bj)⋅P(A∣Bj)
公式拆解:
P(Bj):先验概率(“原因”Bj发生的初始概率)
P(A∣Bj):似然度(“原因”Bj下事件A发生的概率)
P(Bj∣A):后验概率(观察到A后,“原因”Bj发生的概率)
- 示例:若抽到次品(事件A),求他来自生产线B1的概率:
P(B1∣A)=P(A)P(B1)P(A∣B1)=0.070.6∗0.05≈0.4286(42.86%)
- 求n个对象分为k组的方法数:将(rn)视作把n个对象分为两组,一组r个对象,另一组包含另外的n−r个对象的方法数,那么求n个对象分为k组的方法数就可以是(n1n)(n2n2+n3)=n1!n2!n3!n!
- Stirling公式:n!≈2πe−nnn+21
- 二项式定理和多项式定理
- 二项式定理
(x+y)n=∑i=1n(in)xn−iyi可以归结为n个因子分为两组的方式数问题,某一项是xn−iyi,意味着从n−i个因子中选x,剩下i项选y,其方式数是(in),就是所求系数
- 多项式定理
(x1+x2+...+xk)n=n1!n2!...nk!n!x1n1x2n2...xknk或者是n!∏i=1kni!xini,该和是对n的全部k有序划分(n1,n2...nk)求取
- 组合母函数
假设罐子里有n1个某种颜色的球,n2个第二种颜色的球,n3个第三种颜色的球,再抽取m1个球放在第一个颜色的盒子里,m2个放在第二个颜色的盒子里,m3个放在第三个颜色的盒子里,令n是球的总数,那么有n=m1+m2+m3=n1+n2+n3,在(x1t+x2+x3)n1(x1+x2t+x3)n2(x1+x2+x3t)n3中x1m1x2m2x3m3tr中的系数给出了r个球与包含他的罐子的颜色相同的方式数
假设五枚骰子,求一次投掷得出15的方式数,可以列出(x+x2+x3+x4+x5+x6)5,容易看出展开式中出现x15的方式数就是所求方式数,于是由1−x1−xn=1+x+x2+...+xn−1,由此母函数可以写成(1−x)5x5(1−x6)5,省略因子x5,又有(1−x)n1=1+(1n)x+(2n+1)+...=∑i=0∞(in+i−1)xi……
- 边际概率
- 条件概率
- 随机变量
随机变量x是定义在Ω上的函数,基本事件ω∈Ω,有一个数值x(ω)预支对应
- 独立性
令A和B是样本空间S中的两个事件,满足如下任意条件则为两个事件独立
P(A|B) = P(A) 或 P(B|A) = P(B) 或 P(A,B) = P(A)P(B)
- 离散随机变量
- 连续随机变量
- 期望和矩
- 矩:具有该分布的随机变量的幂的期望
关于任一点a的矩:E[(x−a)r]=∫−∞+∞(x−a)rf(x)dx
a等于平均数时,就有关于平均数的矩,用μr表示:μ_r=E[(x-μ_1^')^r]=\intop^{+\infty}_{-\infty}(x-μ_1^')^rf(x)dx
关于平均数的二阶矩是x的方差:μ_2=\intop^{+\infty}_{-\infty}(x-μ_1^')^2f(x)dx=μ_2^'-(μ_1)^2
关于平均数的三阶矩叫非对称的测度或者偏斜度
- 矩母函数
- 特殊连续分布
- 六级听力备考策略(一道题一小时)
- 完整听音频1-2遍
- 逐句听写
- 每句停顿
- 每句听五遍左右(最多十遍)
- 听不懂的地方留白
- 对照原文
- 跟读音频
- 裸听听懂
(二)团队协作方面
四、下周工作计划
(一)课程学习
(二)文献阅读
(三)实验研究
(四)项目工作
(五)与导师沟通
一、本周工作内容
(一)课程学习
- 学习了统计学导论的前六章(概率论部分)
- 深入学习了python,掌握了部分数据结构的用法,算法方面暂未涉及
- 背了少量单词,做了三道六级真题
- 学习了代码简洁之道的皮毛
- 学习了设计模式的皮毛
(二)文献阅读
阅读了《统计学导论》、《代码简洁之道》、菜鸟教程里python及设计模式的相关内容
(三)实验研究
(四)项目工作
二、本周遇到的问题及解决方案
(一)问题
- 统计学导论阅读出现困难,应该是状态所致
- 未涉及系统化的代码编写
- 统计学导论母函数理解不透彻
(二)解决方案
- 积极调整状态,时间不多了
- 抓紧时间保质保量完成统计学的学习,向导师及时汇报,听取导师意见建议,明确下一步研究方向和重点
- 学习组合数学
三、本周工作收获与体会
(一)知识和技能方面
- 统计学导论
- 引论
- 统计学分为描述统计学和推断统计学
描述统计学:研究简缩数据和描述数据
推断统计学:研究利用数据去做出决策,有不肯定性
- 也有统计理论和方法论的分野
统计理论是应用数学的分支,扎根于概率论,包含概率论,也有概率论以外的东西,如随机化原则的理论、各种估计的原理、假设检验的原理、一般的决策原理
- 概率
- 古典概率(先验概率)
- 互不相容、等可能
- 根据以往经验和分析得到的概率,比如全概率公式,它往往作为由因求果种的因出现的概率
- 频数概率(后验概率)
是信息理论的基本概念。在通信系统中,在收到信息后,接收端所了解的发送端发送的概率
- 加入一个不确定时间的发生的主观概率,因为新情况的出现而改变,变前的就是先验概率,变后的是后验概率
- 此处有全概率和贝叶斯
- 全概率是把复杂事件的概率分解为简单事件概率的加权和,核心是用样本空间的划分(一组互斥且穷尽所有可能的事件)
- 全概率的数学定义:设B1, B2, …, Bn是样本空间Ω的一个划分(即Bi∩Bj=∅且∪inBi=Ω),且P(Bi)>0,那么对任意事件A,有:P(A)=∑i=1nP(Bi)⋅P(A∣Bi)
直观理解:事件A发生的概率等于每个“原因”Bi发生的概率,乘以该“原因”下A发生的条件概率,最后求和。
- 示例:设有B1、B2两个生产线,产量分别是60%和40%,B1的次品率是5%,B2的次品率是20%,球随机抽以一个产品是次品(事件A)的概率
P(A)=P(B1)P(A∣B1)+P(B2)P(A∣B2)=0.6∗0.05+0.4∗0.1=0.07
- 贝叶斯用于计算“逆概率”:已知事件A发生,求它由某个“原因”Bi导致的概率(后验概率)。它是全概率公式的逆向应用,核心是先验概率和后验概率的转换
- 贝叶斯的数学定义:在全概率的条件下,贝叶斯表示为:P(Bj∣A)=P(A)P(Bj)⋅P(A∣Bj)=∑i=1nP(Bi)⋅P(A∣Bi)P(Bj)⋅P(A∣Bj)
公式拆解:
P(Bj):先验概率(“原因”Bj发生的初始概率)
P(A∣Bj):似然度(“原因”Bj下事件A发生的概率)
P(Bj∣A):后验概率(观察到A后,“原因”Bj发生的概率)
- 示例:若抽到次品(事件A),求他来自生产线B1的概率:
P(B1∣A)=P(A)P(B1)P(A∣B1)=0.070.6∗0.05≈0.4286(42.86%)
- 求n个对象分为k组的方法数:将(rn)视作把n个对象分为两组,一组r个对象,另一组包含另外的n−r个对象的方法数,那么求n个对象分为k组的方法数就可以是(n1n)(n2n2+n3)=n1!n2!n3!n!
- Stirling公式:n!≈2πe−nnn+21
- 二项式定理和多项式定理
- 二项式定理
(x+y)n=∑i=1n(in)xn−iyi可以归结为n个因子分为两组的方式数问题,某一项是xn−iyi,意味着从n−i个因子中选x,剩下i项选y,其方式数是(in),就是所求系数
- 多项式定理
(x1+x2+...+xk)n=n1!n2!...nk!n!x1n1x2n2...xknk或者是n!∏i=1kni!xini,该和是对n的全部k有序划分(n1,n2...nk)求取
- 组合母函数
假设罐子里有n1个某种颜色的球,n2个第二种颜色的球,n3个第三种颜色的球,再抽取m1个球放在第一个颜色的盒子里,m2个放在第二个颜色的盒子里,m3个放在第三个颜色的盒子里,令n是球的总数,那么有n=m1+m2+m3=n1+n2+n3,在(x1t+x2+x3)n1(x1+x2t+x3)n2(x1+x2+x3t)n3中x1m1x2m2x3m3tr中的系数给出了r个球与包含他的罐子的颜色相同的方式数
假设五枚骰子,求一次投掷得出15的方式数,可以列出(x+x2+x3+x4+x5+x6)5,容易看出展开式中出现x15的方式数就是所求方式数,于是由1−x1−xn=1+x+x2+...+xn−1,由此母函数可以写成(1−x)5x5(1−x6)5,省略因子x5,又有(1−x)n1=1+(1n)x+(2n+1)+...=∑i=0∞(in+i−1)xi……
- 边际概率
- 条件概率
- 随机变量
随机变量x是定义在Ω上的函数,基本事件ω∈Ω,有一个数值x(ω)预支对应
- 独立性
令A和B是样本空间S中的两个事件,满足如下任意条件则为两个事件独立
P(A|B) = P(A) 或 P(B|A) = P(B) 或 P(A,B) = P(A)P(B)
- 离散随机变量
- 连续随机变量
- 期望和矩
- 矩:具有该分布的随机变量的幂的期望
关于任一点a的矩:E[(x−a)r]=∫−∞+∞(x−a)rf(x)dx
a等于平均数时,就有关于平均数的矩,用μr表示:μ_r=E[(x-μ_1^')^r]=\intop^{+\infty}_{-\infty}(x-μ_1^')^rf(x)dx
关于平均数的二阶矩是x的方差:μ_2=\intop^{+\infty}_{-\infty}(x-μ_1^')^2f(x)dx=μ_2^'-(μ_1)^2
关于平均数的三阶矩叫非对称的测度或者偏斜度
- 矩母函数
- 特殊连续分布
- 六级听力备考策略(一道题一小时)
- 完整听音频1-2遍
- 逐句听写
- 每句停顿
- 每句听五遍左右(最多十遍)
- 听不懂的地方留白
- 对照原文
- 跟读音频
- 裸听听懂
(二)团队协作方面
四、下周工作计划
(一)课程学习
(二)文献阅读
(三)实验研究
(四)项目工作
(五)与导师沟通