注意:
- 这个问题有两个版本的解答,希望能够快速找到答案的朋友请查看Method 2,有时间慢慢琢磨的朋友请查看Method 1
- 本人不是数学专业的学生,以下看法均是在学习时根据课本前后的逻辑关系所作出的推测,写出这篇文章一来是分享自己的一点点的看法,二来更是希望跟各位前辈、高手讨教,所以如果有不正确的地方请您指出,谢谢!
Method 1 - 按照G.Polya的探索法进行研究
- 问题的提出
现将浙大四版《概率论与数理统计》中第一次提出“样本方差”的原文摘抄如下:样本是进行统计推断的依据。在应用时,往往不是直接使用样本本身,而是针对不同的问题构造样本的适当函数,利用这些样本的函数进行统计推断。
定义 设
是来自总体
的一个样本,
是
的函数,若
中不含未知参数,则称
是一统计量
因为
都是随机变量,而统计量
是随机变量的函数,因此统计量是一个随机变量。设
是对对应于样本
的样本值,则称
是
的观察值。
下面列出几个常用的统计量。设
是来自总体
的一个样本,
是这一样本的观察值。定义
样本平均值

样本方差

忙于复习考研的同学或者急着赶进度的老师,也许会忽略样本方差这一定义得出之前的一系列前提条件,而直接关注样本方差的公式
。
对于大部分同学而言(当然对于大部分的教学、考试要求也如此),公式就是公式,而给出公式就是要你背要你会套用会计算。
可是,仍有那么小部分特爱纠结的人(比如反应迟钝的我)对这个公式的系数非常纳闷,心中总会有一个很模糊的问题 – 为什么除上的是
而不是
呢? - 明白我们的问题
正如数学教育大师G.Polya在其数学解题奇书How to solve it中所说的“对你所不理解的问题作出答复是愚蠢的”,我们所遇到的这个模糊的问题确实应该再细化一些!为什么我们会觉得这个方差公式应该除以的是
?
同样是方差,我们在概率论中关于随机变量的数字特征时就学过(当然有些有兴趣的朋友也跟着课本一起证明过)随机变量的方差公式(见浙大四版《概率与数理统计》P101)
![D(X)=\sum_{i=1}^\infty[x_k-E(X)]^2\times p_k](http://signal.spitzland.com/wp-content/cache/bf038cd5c1de7fa982908370b75f9fc0.png)
在古典概率的条件下(注意,古典概型才成立,别的情况并不一定成立)
(见浙大四版《概率与数理统计》P10公式(4.1)),于是在古典概型(这也是最一般最常见的概型)时,随机变量的方差公式可以改写成
(其中![D(X)=\frac1{n}\sum_{i=1}^\infty k \times [x_k-E(X)]^2](http://signal.spitzland.com/wp-content/cache/80b9639443c382866ce1fcd72568a8da.png)
为
出现的次数)
也许是因为古典概型实在是太普遍了 – “抽球”是古典概型,“放球”也是古典概型,我们所能举出的简单例子几乎大部分都是古典概型,于是我们就十分粗略地对随机变量的方差公式理解成“每个随机变量值与均值的偏差乘以其出现的次数k最后再除上所有可能的情况n”,其实这一粗略的结论理解起来却也是那么的顺畅 – 每个与均值的偏差再平均一下就是总体的方差了。
由于课本将概率论安排在数理统计之前,所以我们在潜移默化下,就会对方差有一个很模糊却又能说服自己去理解、接受的认识,即是将“每个与均值的偏差再平均一下”出来的东西。于是,一些比较容易在简单问题上纠结不清的同学在看到样本的方差公式时,就会很自然地跟随机变量的方差公式进行对比,由此生出这样的问题 - 为什么除上的是
而不是
。 - 试着慢慢解决我们的问题
浙大四版《概率与数理统计》并没有马上解释为什么样本方差的公式会要这样子来进行定义,但是,不断学习课本,突然在第七章参数估计的第三节“估计量的评选标准”里再次看到样本方差公式(浙大四版《概率论与数理统计》P159 第一段),只不过这个时候,课本是从“参数估计”的角度来对样本方差公式进行分析,如下:设总体
的均值为
,方差
均未知,由第六章(3.19)、(3.20)知

这就是说不论总体服从什么分布,样本均值
是总体均值
的无偏估计;样本方差
是总体方差的无偏估计,而估计量
却不是
的无偏估计,所以我们一半取
作为
的估计量。也许思维缜密,学得比较踏实的朋友在看到这一段话时就会拍案叫绝 – 原来如此!
但是,我相信肯定会有人跟我一样还摸不着头脑,为什么要拿这个公式跟参数估计来进行对比呢?!慢慢分析一下,慢慢翻查一下课本你一定也会有类似的醍醐灌顶、拍案叫绝的感觉!
我们先来慢慢分析上面课本上的这段话,首先找出这段话的主干并把无关部分用X代替,那就是”X是X的无偏估计“,好了,既然提到了无偏估计,那么我们首先要知道跟什么偏,或者说“这个参数跟什么有偏差”(一个估计量的提出,总得评价它是否提得好,而评价是否”提得好“的标准就是以”无偏性“进行衡量的,具体见浙大四版《概率论与数理统计》P158)跟什么有偏差呢,跟什么做对比呢?这段话已经告诉我们 - 样本方差
是总体方差
的无偏估计,原来如此,这里是用
来估计
!
这样的解释对于一些朋友来说已经能让他们充分相信样本方差公式必须除以的是
,这样才能达到“无偏估计”,但是我相信仍然有一部分朋友,跟我一样,很纳闷,为什么在这里要提出无偏估计呢?! - 问题的进一步加深 – 解决另一个问题
为什么要提出无偏估计?
Method 2 - 数学证明
(证明中的部分
公式引用于dutor的这篇文章)
必须明白,样本方差属于数理统计的领域,数理统计的一条很重要的原则就是,假设整体服从某一稳定的概率分布,不过该分布的某些具体的参数并不知道,但是,通过抽取整体所得到的样本,我们可以构建一些函数对这些未知参数进行估计,从而确定出整体所服从的概率分布,即对整体建模,最终在这个模型上研究我们所需要的一些信息。简而言之,样本的统计量必须以相应的概率数字特征进行估计,而“无偏”是这一估计的目标。
所以我们的问题就是,为什么
是
的无偏估计
求证:
是
的无偏估计
证明:
1.54 The relations considered in this problem are used on many occasions throughout the book
(c)show also if,then
- Method one – dislocation subtraction
let
and
then we make a subtraction
let
and we will get:
![\lim_{n\to \infty}(1-\alpha)X=\lim_{n\to \infty}(\alpha+\alpha^2 + \alpha^3 + \ldots + \alpha^n -n\alpha^{n+1})\\=\lim_{n\to \infty}[(\alpha+\alpha^2 + \alpha^3 + \ldots + \alpha^n) -n\alpha^{n+1}]](http://signal.spitzland.com/wp-content/cache/c200b37e927d741ba14fb4c5b9ab859d.png)
in it,
,which means that this part can be eliminated,then we will make a summation for the rest of the part,which is a form of geometric progression.

- Method two
Note that if we expand this complex summation formula and combine some parts,perhaps it will be a little easy.
![\sum_{n=0}^\infty n\alpha^n = \lim_{n \to \infty}(0+\alpha^1+2\alpha^2+3\alpha^3+\ldots+n\alpha^n)\\=\lim_{n\to \infty}[(\alpha+\alpha^2+\alpha^3+\alpha^4+\ldots+\alpha^n)\\+(0+\alpha^2+\alpha^3+\alpha^4+\ldots+\alpha^n)\\+(0+0+\alpha^3+\alpha^4+\ldots+\alpha^n)\\+(0+0+0+\alpha^4+\ldots+\alpha^n)\\+(0+0+0+0+\ldots+\alpha^n)]\\=\lim_{n\to \infty}[\frac{\alpha(1-\alpha^n)}{1-\alpha}+\frac{\alpha^2(1-\alpha^{n-1})}{1-\alpha}+\ldots+\frac{\alpha^n(1-\alpha)}{1-\alpha}]\\=\lim_{n\to \infty}\sum_{k=1}^n \frac{\alpha^k(1-\alpha^{n+1-k})}{1-\alpha}\\=\lim_{n\to \infty}\sum_{k=1}^n (\frac{\alpha^k}{1-\alpha}-\alpha^n)\\=\lim_{n\to \infty} \frac{\alpha(1-\alpha^k)}{(1-\alpha)^2} -\lim_{n \to \infty} n\times\alpha^n](http://signal.spitzland.com/wp-content/cache/5351fda93619f8980eec6863b7d88d4b.png)
There are two parts,in which,
,as a result

- Method three,as the manual solution to this book gives:
Note that
then differentiating both sides of it,we get

finally
提高全國碩士研究生數學入學考試成績是考生的普遍願望,正確把握複習方向是提高成績的關鍵。問題的焦點在哪裡?我們以2005年全國碩士研究生入學統一考試的統計資來說明:
| 数学一 | 数学二 | 数学三 | 数学四 | |
| 0.7以上 | 2.7% | 2.7% | 18.7% | 16% |
| 0.3~0.7 | 94.7% | 85.3% | 64% | 75.3% |
| 0.3以下 | 2.7% | 12% | 17.3% | 8.7% |
| 平均分 | 68.2 | 69.69 | 75.20 | 78.89 |
| 难度系数 | 0.45 | 0.465 | 0.501 |
0.526 |
这组数据提出了一个值得人们思考的问题:数学一的试题中等难度的题目占94.6\%,而难度系数仅为0.45,为什么平均分那么低?怎样才能提高考试成绩?
通过对研究生入学考试试卷的分析,作者认为考生失分的首要因素是对基本概念和基本性质不清楚,特别是填空题与选择题的分偏低,与命题的期望值相差较大,针对这个问题,作者分析了近十年研究生入学考试的数学试题情况,针对概念与性质类的试题对考生的影响做了研究,得出以下结论:
考生提高考试成绩的首要环节是要理解基本概念,明确概念的要素,认清其实质;理解基本性质,明确性质的基本特征。
为此作者针对数学中的基本概念、基本性质编写了一些是非题,并说明了命题正确与否,也给出了相关分析或反例。在一些题目中又加了说明,列举了近年来考试中的相关试题,指出这些试题的求解关键是明确概念或性质的那些特征,或没有正确使用性质而导致的错误等。
例1 (97303) (注:97303表示1997年研究生入学考试数学三试题,分值为3,其余类推)
若函数
,则
本题考查的知识点为定积分的概念与几何意义。
此题求解的关键是明确:如果
在
上可积分,则定积分
表示一个确定的值。
因此只需令
,则所给表达式可转换为
,将其两端在积分区间
上积分,可得:

积分后解出
,可得
表达式。
如果又能明确定积分的几何意义,注意到被积函数
可以化为
,因此
表示圆心在原点的半径为1的上半圆周,可知
表示半径为1的1/4圆的面积,
,则问题易解。
但本题难度系数仅有0.29,表明绝大多数考生对定积分的概念与几何意义理解不够深刻,不能运用性质求解问题。
例2 (00103)
。
此题可以利用定积分换元法求解,但是由于是填空题,如果注意到
可表示为

可以知道
表示半径为1的1/4圆的面积,易知积分值为
。
难度系数也仅为0.64
例3 (01103) 设
,则
在点
可导的充分必要条件为
A.
存在
B.
存在
C.
存在
D.
存在
本题考查的知识点为函数在一点处的定义,左导数、右导数与导数的关系,有界变量与无穷小量乘积的性质。
本题难度系数为0.25.
例4 (01103) 设函数
在点
附近有定义,且,
则
A. 
B. 曲面
在点
的法向量为
C. 曲线
在点
的切向量为
D. 曲线
在点
的切向量为
这个试题包含了三个性质:
函数
在点
存在偏导数,并不一定能保证
在点
处可微分。因此A不正确。
函数
在点
处不可微分,则曲面
在点
可能不存在切平面,可知B不正确。
一元函数
在点
处可导,则曲线
在点
必存在切线,且切线的斜率为切向量为
,因此C正确,D不正确。
考生对于多元函数微分概念掌握不好,忘记了微分的必要条件为函数在该点存在偏导数;微分的充分条件是函数在该点有连续偏导数。
本题难度系数为0.35。
例5 (99103) 设
是连续函数,
是
的一个原函数,则
A.当
是奇函数时,
必是偶函数。
B.当
是偶函数时,
必是奇函数。
C.当
是周期函数时,
必是周期函数。
D.当
是单调函数时,
必是单调函数。
本题考查的知识点为原函数的概念及可变上限积分的函数表示方法、函数的奇偶性、周期性、单调性概念。
本题难度系数为0.19
例6(02103) 考虑二元函数
的下面4个性质:
①
在
处连续;
②
在点
处两个偏导数连续;
③
在点
处可微;
④
在点
处的两个偏导数存在;
若用“
表示可由性质
推出性质
,则有
A.
B.
C.
D.
本题考查的知识点为二元函数的连续性、偏导数、可微分之间的关系。
本题难度系数仅为0.31。
例7(03103) 已知
在
的某个邻域内连续,且
,则
A.点
不是
的极值点。
B.点
是
的极大值点。
C.点
是
的极小值点。
D.根据所给条件无法判定点
是否为
的极值点。
本题考查的知识点为极限基本定理(极限与无穷小的关系)二元函数极值的概念。
由于很多考生不知道一元函数极值的基本定理可以推广到二元函数极值,因此不知道用

其中
当
时为无穷小量。将所给题设条件化为
的表达式关系,不会导出
,不知道用定义判定
是否为极值。
本题难度系数为0.245。
上面各题都是考查基本概念与基本性质,得分率都很低,失分的关键就是考生没能理解基本概念的实质与基本性质的特征,同样许多解答题和证明题,其求解的关键和重要因素也是基本概念或基本性质。
为了帮助考生理解基本概念、基本性质,我们从说是研究生入学考试大纲要求的知识点出发,对高等数学、线性代数、概率论与数理统计的基本概念和基本性质进行分析、整理,目的是为考生提供一本侧重概念与性质分析的辅导书,将其定位于简明又有实效、不但能提高考生的复习效率,更有有助于考生提高考试成绩的辅导书。
本书为高等教育出版社出版的高等数学、线性代数、概率论与数理统计教学辅导丛书之一。这套丛书分别从概念与性质、基本运算、证明三个侧面编写。包括:
1.《考研数学焦点概念与性质 – 高等数学、线性代数、概率论与数理统计》。徐兵、肖马成、周概容。高等教育出版社。
2.《2007年考研数学历年真题解析与应试对策》(理工类)。徐兵、肖马成、周概容。高等教育出版社。
3.《2007年考研数学历年真题解析与应试对策》(经济类)。徐兵、肖马成、周概容。高等教育出版社。
4.《高等数学证明题500例解析》。徐兵。高等教育出版社。
5.《线性代数、概率论与数理统计证明题500例解析》。肖马成、周概容。高等教育出版社。
从某种意义上说,《焦点概念与性质》是针对概念与性质的专项辅导书;《考研历年真题解析》是提高运算能力的辅导书;证明题解析是提高求解证明题能力的辅导书。可以说这套丛书为大学生学习高等数学、线性代数、概率论与数理统计提供了一套全方位、有特色、有成效的高品质的精品辅导书,是作者几十年教学经验与教学研究的总结与积累。如《2007年考研数学历年真题解析与应试对策》有以下几个特色:
(1)分析各部分知识的基本问题,归纳基本运算方法,以利于考生理出知识框架。
(2)在范例解析中,对所选试题指出了考察的知识点,以利于考生明确试题的立意。
(3)对试题给出了解析,分析了解题思路。对部分试题给出了考生的典型运算错误,指出错误产生的原因,以利于考生防范。
(4)对部分试题给出了特殊解题技巧,或试题可能的变化形式,或对试题中某些条件的作用进行解析;或指出某些题目在命制时出于考察知识点或难度等因素而有意放宽题设条件等说明,目的是利于考生能深入复习。
(5)给出了近年来试题的难度系数,以利于考生检查自己对知识的掌握程度。
《证明题解析》一书有以下特色:
(1)对所选证明题进行对比、分类、归纳。
将证明思路相同的题目、证明结论相同的题目、已知条件相同的题目等集中对比、归纳,以引起读者注意证明的基本思路有何变化,希望引导学生从这些数学证明问题的常见方法中,学习发现数学的基本算理,培养训练数学思维方法。本书志在引导学生思考证明题的解题思路,寻找有效的解题途径,如果题目的已知条件不变化,而证明的结论发生变化,证明的思路将发生什么变化?如果已知条件发生变化,而证明的结论不变,证明的思路将发生什么变化?外玩形式相仿的题目,是否证明思路相同?外观形式不同的题目,是否证明的思路也不同?本书希望读者能通过这种训练,有效地提高证明题的求解能力,打牢数学基础。
(2)选题范围较广,本书参考多种版本习题集、全国硕士研究生入学试题、北京市及全国部分省市大学生数学竞赛题、美国等国外大学生数学竞赛题等。
本书的高等数学部分,由北京航天航空大学徐兵教授编写;线性代数部分,由南开大学肖马成教授编写;概率论与数理统计部分,由南开大学周概容教授编写。
作者于北京航空航天大学
2006年7月
实现这个功能的插件中,最流行的是张志强的latex插件LaTex for WordPress http://zhiqiang.org/blog/plugin/mimetex
然而这个原始的版本使用Mimetex的服务器,生成的公式并不太美观,因此dutor更换了tex服务器 http://www.dutor.net/index.php/2010/05/wordpress-using-latex/ 后面这个插件就是我的博客中所使用的。当然,tex服务器还有很多种,具体的更换方法在张志强的博客中已经提到了。
关于这个插件的使用,有两个最基本的问题,在此写出来希望能帮助有需要的朋友
1、关于插件本身的使用:
- 行内公式(跟文字混合在一起)书写在一对双美元符号$$ latex代码 $$之中,例:
从中随机抽取n个样本
,
,是样本均值 - 行间公式(单独占一行且居中的公式)则需要在第一个双美元符号后面加感叹号$$! latex代码 $$,例:
![\large \begin{array}{rcl}D(\overline X)&=&D(\frac1n\sum_{i=1}^nX_i)\\[10pt]&=&\frac1{n^2}D(\sum_{i=1}^nX_i)\\[10pt]&=&\frac1{n^2}(\sum_{i=1}^nD(X_i))\\[10pt]&=&\frac{\sigma^2}n \\[10pt]\end{array}](http://signal.spitzland.com/wp-content/cache/4033622878bbf63b17d39ea6e911a839.png)
- 想要输出latex原代码(即为不解析双美元符号内的公式)则需要在后一个双美元符号前加感叹号 $$ LaTex代码 !$$
2、公式图片在wordpress中的美化:
- 这个插件生成的公式是图片形式的所有的图片都是一class = tex的,在排版中图片与文字保持纵轴对称则能显得好看一些,所以可以在wordpress主题的style.css里添加下面代码以限定全部公式图片的排版规则:
img.tex {
vertical-align: middle;
}
,then