下载此文档

清华大学模式识别往年考题.doc


文档分类:资格/认证考试 | 页数:约4页 举报非法文档有奖
1/4
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/4 下载此文档
文档列表 文档介绍
清华大学模式识别往年考题.doc:00-16:00 1(15分)两类分类问题,P(w1)=1/4,P(w2)=3/4。样本有两个特征,分别是x和y。两类?的概率密度函数:w1,在0<=x<=3、0<=y<=3中均匀分布,其余为0;w2,在2<=x<=5、1<=y<=7中均匀分布,其余为0。请设计做小错误率贝叶斯分类器,并计算误分率。 2(20分)支持向量机通过二次最优化得到支持向量。现在有一个两类分类问题,共有N个样本,样本有d维特征空间,样本集合是线性可分的。试使用遗传算法求解支持向量,说明算法步骤和使用的遗传算子。使用遗传算法求解支持向量有什么优缺点? 3(20分)两类分类问题,有3个特征x,y,z,共有N个样本。通过经验知道将3个特征进行加权相加得到的特征将具有更好的分类性能,但是不知道如何得到各个特征的权重。试回答?如何得到各个特征的权重。给出必要的计算和推导过程。 4(15分)使用多级聚类算法对下面的样本进行聚类,使用最近距离量度。给出计算过程,多级聚类树。问应该分成几类,为什么?举例说明使用最近距离量度聚类和使用最远距离量度聚类各自的优缺点。(1,0)(2,0)(0,2)(1,3)(0,5)5(20分)距离是模式识别中的重要概念,试说明贝叶斯分类器、近邻法、Fisher投影法、C均值算法是否受不同距离量度选择的影响。如果不是,说明原因;如果是,举例说明受什么影响。 6(10分)一个袋子中装有红、绿、蓝三种颜色的球,采用有放回的取球方法,取出N个球,其中有n1个红色球、n2个绿色球和n3个蓝色球的概率为p(n1,n2,n3)=(N!/(n1!n2!n3!))*p1^n1*p2^n2*p3^n3其中n1+n2+n3=N,p1+p2+p3=1已知概率模型如下:p1=1/4p2=1/4+p/4p3=1/2-p/4如果一个人是红绿色盲,分不清红色球和绿色球,那么他只能知道他取了m1=n1+n2个红/绿球,和m2=n3个蓝色球。试通过这些数据估计概率模型中的p,并估计红色球和绿色球的数?。--------------------------------不出意外的话应该是在清华最后一门考试了,复****的时候又极其痛苦,500+张ppt,很多公式要理解要背,所以得纪念一下,粗略回忆一下今天考的内容,给后面的同学留点参考吧(这里研究生的考试题实在有点稀少) 模式识别林行刚(电子系) 一、判断对错40*=20分考的题很细,涉及了各个方面,比如 简单模式匹配、K-L变换(2题)、最小欧氏距离、权向量定义、近邻函数定义、单个神经元分类是否是线性的、子空间(1题)、“最小马氏距离分类器的错误概率一定不会比最小欧氏距离分类器的错误率大”。二、对现有算法的理解5*5=251、s个类,可以用s(s-1)/2个线性分类器分开,称为这个样本集成对线性可分。举例二、对现有算法的理解5*5=251、s个类,可以用s(s-1)/2个线性分类器分开,称为这个样本集成对线性可分。举例说明,成对线性可分不一定线性可分。 2、定义相似度为20-min(d{Xi,Xj})(Xi属于类wi,Xj属于类wj),其中d{Xi,Xj}表示两个样本之间的欧氏距离,给了一组样本10个数据,{-,-,-0.

清华大学模式识别往年考题 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数4
  • 收藏数0 收藏
  • 顶次数0
  • 上传人dyx110
  • 文件大小23 KB
  • 时间2020-02-21