下载此文档

教育技术领域术语提取研究.doc


文档分类:文学/艺术/军事/历史 | 页数:约9页 举报非法文档有奖
1/9
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/9 下载此文档
文档列表 文档介绍
教育技术领域术语提取研究一问题提出术语是专业领域中概念语言指称。(中国标准研究院,1999)术语是定义明确专业名词,是领域专家用来刻画、描写领域知识基本信息承载单元,是信息检索与信息提取重要单元,是知识库中核心成员,也是本体构成基本单元。同时,一个学科术语表对于该学科文献表示、自动分类与学科研究热点发现也有着非常重要意义。有关知识库建立与文本自动分类等技术恰恰属于当前在教育技术领域悄然兴起知识工程学范畴。当前,知识工程学正成为教育技术领域一个重要研究领域。它包括软计算、Agent、自然语言理解、逻辑与推理、形象思维研究、基于事例推理、机器学****知识本体论等领域研究。(黄荣怀等,2004)李爽(2005)还就知识工程有关领域(如基于知识库知识发现、自然语言理解、基于事例推理等)在支持未来远程学****支持相关技术研究与开发方面潜力进行了剖析。另外,杨开城等人(2006)利用了知识工程中自然语言理解技术来建立教育技术学理论研究中话语词汇体系,剖析教育技术理论研究话语逻辑,这属于教育技术研究中元研究范畴,采用是内容剖析方法(话语剖析方法)。近年来,在教育技术领域(包括远程教育领域)陆续开展了多项元研究工作(周彩霞等,2006;周彩霞等,2005;项国雄等,2005;张静等,2004;祝智庭等,2002:张伟远。1999:殷丙山等,2005:张秀梅,2005a;杨开城等,2006),这些研究一个共同特点就是采用了内容剖析方法,它一般过程是先建立一个分类体系,然后将研究样本按照这个分类体系进行分类,最后得出研究样本分布特点,这其实就是一个文本分类过程。目前,自然语言理解领域已有较为成熟文本自动分类技术,但是已有研究中却没有提及采用了该技术。张秀梅(2005b)曾撰文介绍国外远程教育研究中六项有代表性采用文献内容剖析法研究,然而也未提及这些研究是否用到了文本自动分类技术。这里我们假定研究者没有采用文本自动分类技术,而是人工对研究样本进行分类,可以想见,随着研究论文不断增多(通过“中国学术期刊网”查询,从1999年到2006年大陆教育技术领域六个CSSCI引文来源期刊共刊发论文11370篇),要对这几千篇上万篇文章进行分类工作量是巨大。所以,我们必须将文本自动分类技术及其他自然语言处理技术引入文献内容剖析方法中,使这一研究方法更为高效。我们知道,文本自动分类前提是文本表示,文本表示基础是对文本进行分词。由于现有分词工具只包含通用词汇,所以在进行分词时会产生大量错误分词,从而无法正确完成文本表示,也就给文本自动分类带来不准确性。所以,当前问题就是建立教育技术领域术语词汇表,为利用自然语言理解技术开展教育技术领域元研究打下基础。本研究将试图研制一个针对教育技术领域(包括远程教育领域)术语提取算法,并建立一份术语表,以期能为其他研究者开展文献内容剖析研究提供方便。二文越研究我们将先通过文献研究,总结前人在术语提取方面工作,从而为建立自己算法打下基础。另外,分词是术语提取基础,我们有必要了解分词技术以及已有分词工具。 1 中文分词技术及工具中文分词是中文信息处理领域中一项基础技术。一些比较简单分词算法有最大匹配法、最大概率法等。由于开发分词工具需要建立大型词库与语法知识库,费时费力,也非笔者能力所及。所幸是,中国科学院计算技术研究所在多年研究基础上,耗时一年研制出了基于多层隐马

教育技术领域术语提取研究 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数9
  • 收藏数0 收藏
  • 顶次数0
  • 上传人
  • 文件大小22 KB
  • 时间2020-07-01