下载此文档

学堂课程在线大数据平台核心技术(清华)课后作业答案.pdf


文档分类:IT计算机 | 页数:约5页 举报非法文档有奖
1/5
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/5 下载此文档
文档列表 文档介绍
该【学堂课程在线大数据平台核心技术(清华)课后作业答案 】是由【青山代下】上传分享,文档一共【5】页,该文档可以免费在线阅读,需要了解更多关于【学堂课程在线大数据平台核心技术(清华)课后作业答案 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。:..大数据平台核心技术(清华)第一章课后作业单选题(1分)蚂蚁金服的贷款业务可以做到()秒极速审批?无须人工干预。A0B1C3D5正确答案B单选题(1分)单一集群规模可以达到()以上服务器(保持80%线性扩展)A1000B5000C8000D10000正确答案D单选题(1分)ODPSGraph可以支持100亿顶点和()亿边的规模,支持节点失败自动恢复。A500B1000C1500D2000正确答案C单选题(1分)ODPS每秒钟创建订单数在2014年双11达到了()万笔。A5B6C7D8E9正确答案D第二章课后作业单选题(1分)1/15:..13亿人口,平均每人每年产生的照片和视频存储量为500MB,如果对一年产生的数据进行存储需要什么级别的存储容量()ATBBPBCEBDZB正确答案C单选题(1分)下面对分布式文件写入方式描述不正确的是()A使用链式写入方式可以有效利用网络带宽,减少由于网络带宽带来的写入流量瓶颈B使用主从模式写入可以有效提高网络利用率,同时可以降低写入延迟C使用链式写入方式在写入时,如果链条中间节点写入失败,可以采取放弃写入,直接写入到失败节点后边的节点的方法来提高写入成功率DSealAndNew的错误处理方法可以有效防止由于短时间某些节点异常带来的数据写入被阻塞的问题正确答案B单选题(1分)对分布式读取方式描述正确的是()A如果数据采用多份存储的方式,在读取时读取任何一份都可以得到数据,所以没有必要考虑打开文件读取时返回多个数据的位置B如果采用基于统计的方法来避免读取的时候慢节点造成的性能下降,需要每隔一定的时间间隔重新对统计值进行更新C如果使用Erasurecoding的编码方式来存储数据,读取用户数据的时候对于编码组中任何一份数据读取,都可以获得原始数据D如果使用Erasurecoding的编码方式来存储数据,编码组中任何一份数据丢失都会导致数据不能读取出来正确答案B单选题(1分)为保证从分布式存储系统中读取的数据正确,需要采用哪种数据处理方式()A压缩B多份存储CErasurecoding编码DChecksum数据校验正确答案D单选题(1分)2/15:..对数据进行Checksum数据校验不需要的数据参数是()A数据存储位置BChecksum值C数据长度D数据正确答案A单选题(1分)对于数据复制中的两种技术Replication和Rebalance的异同点描述不正确的是()ARepication的主要目的是为了保证数据可靠,防止数据丢失BRebalance的主要目的是为了清理系统中的多余数据,提高空间利用率CReplication和Rebalance都需要考虑到数据在数据中心中的存放位置,提高由于硬件失效带来的数据不可用DReplication和Rebalance需要有优先级控制,防止数据复制不及时造成数据丢失正确答案B单选题(1分)对于Paxos协议描述不正确的是()A协议可以处理任何的硬件失效,包括硬盘损坏、网络不通等B任何数据达到一致状态都需大多数成员接受数据C协议中需要引入一个单调递增的序列号作为每一次数据达成一致的标号D每次数据达成一致至少需要进过两个阶段正确答案A多选题(2分)如果想使用Erasurecoding编码方式提高存储效率(假设用户数据切片数量为K,冗余编码组数量为M),()AK=5M=1BK=6M=2CK=6M=3DK=8M=4正确答案CD多选题(2分)下面对于分布式存储系统中如何选取存储介质的描述错误的是()A为了让程序实现简单高效,存储系统中应该选用单一的存储介质B为了节省存储成本,通常在一个分布式存储系统中会使用多种存储介质来实现高性能和大容量的目的C不同的使用场景下,应该采用灵活的混合存储方式来满足需求3/15:..D所有存储介质的存储寿命都是一样的,所以寿命不在选取介质类型的考虑范围内正确答案AD第三章课后作业单选题(1分)分布式调度类似于PC机的什么部件?()A磁盘BCPUC总线D网卡正确答案B单选题(1分)下面对分布式调度需要解决问题的说法正确的是?()A分布式调度主要解决任务调度的问题B分布式调度主要解决资源如何分配的问题C分布式调度既要解决任务调度也需要解决资源调度的问题D以上说法都不对正确答案C单选题(1分)伏羲分布式调度系统中负责资源调度的角色是?()AFuxiMasterBTuboCAppMasterDAppWorker正确答案A单选题(1分)为了加快instance运行,通常在调度上采取什么策略?()A数据locality调度B均匀调度C优化网络D优化磁盘正确答案A单选题(1分)4/15:..伏羲通过什么封装了MapReduce过程中的数据shuffle?()Alocality调度BAppWorkerCstreamlineDinstance正确答案C单选题(1分)伏羲的backupinstance机制不需要参考的信息是?()A已完成的Instance比例B数据处理速度低于其他Instance平均值C运行时间超过其他Instance的平均运行时间D数据locality正确答案D单选题(1分)下列关于伏羲资源调度优先级策略的说法错误的是?()A每个job在提交时会带一个priority值,一个整数值,越大优先级越高B相同优先级按提交时间,先提交的优先级高C资源优先分配给高优先级的job,剩余的资源继续分配给次高优先级jobD允许有高优先级的紧急任务加入正确答案A单选题(1分)伏羲资源调度支持抢占,下面说法错误的是?()AFuxiMaster会从当前正在运行的任务中,从最低优先级任务开始强制收回资源B最低优先级任务被抢占后,抢占过程即终止C抢占会一直递归进行D不能抢比自己优先级高的任务正确答案B多选题(2分)阿里云伏羲分布式调度系统与社区HadoopMR最大的区别是?()AHadoop是一层架构集中资源和任务调度,而伏羲是两层架构独立的资源和任务调度BHadoop存在规模瓶颈,而伏羲规模横向扩展性更好CHadoop与伏羲的调度策略不同DHadoopjobtracker没有failover,伏羲有完善的failover功能正确答案ABD5/15

学堂课程在线大数据平台核心技术(清华)课后作业答案 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数5
  • 收藏数0 收藏
  • 顶次数0
  • 上传人青山代下
  • 文件大小577 KB
  • 时间2024-03-22