计算机科学

首页 > 计算机科学

词语搭配

2018-07-27 10:50:20     所属分类:计算语言学

在语料库语言学中词语搭配(Collocation)是指按顺序排列的单字或者术语同时出现的次数比偶然的多。在片语学(phraseology)中词语搭配是惯用片语(phraseme)的子类别。一个措辞上的词语搭配的例子,如韩礼德[1]提出的语言表达式strong tea(而不是*powerful tea)。

词语搭配这个词的定义在语言学界中是最受争论的之一[2]

词语搭配在机器翻译等任务中能有所应用。

用于搭配提取的公式[3]

  • 互信息:
  • t测试:
  • z测试:
  • Chi方测试:
  • 似然比:

此外,在[4]中罗列了84个可用于此任务的公式。

参考文献

  1. ^ Halliday, M.A.K., 'Lexis as a Linguistic Level', Journal of Linguistics 2(1) 1966: 57-67
  2. ^ Evert, S. Corpus Linguistics. An International Handbook. 2008. 
  3. ^ Manning, C. D. Foundations of statistical natural language processing. MIT Press. 1999. 
  4. ^ Pecina, P. An Extensive Empirical Study of Collocation Extraction Methods: 13. 2005. 
版权声明:本文由北城百科网创作,转载请联系管理获取授权,未经容许转载必究。https://www.beichengjiu.com/computerscience/338985.html

上一篇:数理语言学
下一篇:文化组学
相关推荐