2011-07-14 29 views
0

我有一大串200,000字左右的原始文本。这是一本书。这是“语料库”的正确定义吗?

我想用这些词来分析单词关系,以便我可以将这些关系应用到其他应用程序。

这叫做“语料库”吗?

回答

4

A 语料库,在语言学中,是任何连贯的真实(*)文本或正在研究的语音体。所以是的,一本书是一个语料库。只要你不随机洗牌,它在一个字符串中的事实并不重要。

(*)与一系列组成词组被显示为测试对象以测量他们的反应相反,正如在心理语言学中通常所做的那样。

0

通常“语料库”用于指结构化的集合,但语言学家会知道你在说什么。