计算语言学(
computational linguistics)是一门跨学科的研究领域,试图找出
自然语言的规律,建立运算模型,最终让
电脑能够像人类般分析,理解和处理自然语言。
过去,计算语言学的研究一般由专门负责利用电脑处理自然语言的
电脑学家进行。由於近年的研究显示人类语言是超乎想像的复杂,现在的计算语言学研究多由来自不同学科的专家共同进行。一般来说,研究队伍的成员有电脑学家、
语言学家、语言专家(熟悉有关研究项目所要处理的语言的人),以至研究
人工智能、
认知心理学、
数学、
逻辑学等的专家。
起源
计算语言学始於一九五零年代的
美国,是人工智能研究的开端。当时,美国希望能够利用运算又快又准确的电脑,将大量外语材料瞬间翻译成
英语;研究重点特别放在翻译
俄文写成的科学技术刊物上,以窥探
苏联的科技发展。
语音合成、语音识别
主要包括以下几个方面:
语音编码(speech coding)、
语音识别(speech recognition)、
语种识别(language identification)、
说话人识别(speaker recognition)或
说话人确认(speaker verification)、语义理解(semantics understanding)、
语音合成(speech synthesis)等。
在人机交互过程中,经常用到
语音识别技术和
语音合成技术。