《计算语言学概论》是2003年来自商务印书馆出版的图书,作者是俞士汶。该书从"基础""算360百科法"和"应用"三个方面,较为系统地何输老夜续车介绍计算语言学的图齐部例座杆材班基础理论、相关的自然语言处理技术和应用。
基础呼境殖远却不转部分(包括一、二导帮波、三章)主要讲述计算语言学的数学和语言学基本概念,计算语言学和自然语言处理技术的关系,毛自然语言处理的基本流程等内容。此外,作为计算语言学的重要分支之一,语料库语言学得到了较大发展,有关语料库语言学的基础概念、基本理论、近年来的一些发展概况在第三章中加以介绍。介绍这部分内容的目的,是让读者在不涉及技术细节的情况下,对计算语言学有一个初步的,同时也是较为全面的理解和掌握。
算法部分(包括第四、五章)主要介绍计算语言学的常用技术和算法。从处理对象来讲,主要包括词法层面的分析技术、句法层面的分析技术和语义层面的处理技术;从处理方法来讲,既有传统的规则方法,也有基于语料库的统计方法的介来自绍。这部分内容的主旨是希望通过本章学习后,使学生能对计算语言学的领域中的一些主流技术(比如隐马尔可夫模型在词性标注中的应用,GLR算法,部分分析技术等)有一个概要的认识,并能运用这些技术进行计算语言学相关的工作实践。
应用部分(包括第型六、七章)主要讲授自然犯语言处理应用系统。需要360百科说明的是,基于语言信息处理技术的应用系统很多,本教材只是重点介背北灯经组月些用观丝元绍一些常见的系统,介绍这些系统的工作机理、发展、取得的成绩,也客观介绍这些系统存在的问题和困难。主要包烈树英口轴曾程措相括机器翻译系统,信息检索系统、信息提取系统,文本分类系统等。
第一章绪论:什么是计算语言学
第一节计算语言学的研究对象
儿路化山云 第二节计算语言学的研究方法
第三节计算语跟主怀所非液紧言学的实际应用
第对绿划百四节小结
第二章语言知家证个易护器较如坐预识的形式化表达
第一节给厂示土认严点管协乎语言与语言知识
第二节形式化表达手段
第三节语法知识的都底形式化表述理论体系
第四节斗领气液其何听延云印她语义知识的形式化表述理论体系
护医界际影色损数节独数 第五节语篇知识的青宜树度布形式化表述理论体系
第六节小结
第三章语料库好技故断始百:语言知识的另一种表示形式
第一节语料库研究概况
第二节语料的收集与加工
第三节语料库的应用
第四节小结
第四章词法分析
第一节高节纪而子概述
第二节"词"的识别
第三节词性标注
第四节词义标注
第五节小结
第五章句法分析
第一节句法分析导引
第二节广义LR分析算法
第三节基于线图的分析技术
第四节其他句法分析技术
第五节小结
第六章机器翻译
第一节机器翻译概述
第二节基于规则的机器翻译
第三节基于语料库的机器翻译以及混合式机器翻译
第四节机器翻译的困难、对策和评价
第五节小结
第七章面向文本的智能信息处理
第一节信息检索
第二节信息提取
第三节文本自动分类
第四节小结
术语表
后记