2012-07-20 62 views
8

我需要一个基于牛津词典单词列表的词典文件。现在我可以访问Linux的单词列表,这对我的目的不利。有没有人知道我可以下载这个,因为小时的谷歌搜索引发了一个空的参数异常!牛津词典的单词表文件

任何帮助,非常感谢。 干杯。

+0

您可以查询提供api的在线词典并制作自己的单词列表。 – LanguagesNamedAfterCofee 2012-07-20 03:23:34

+3

@LanguagesNamedAfterCofee这是我见过的最含糊的评论:-) – 2012-07-20 04:01:57

回答

11

尽管您不可能下载OED列表,但有很多不同的单词列表可用。不过,您可能需要做一些工作来区分单词和定义。

一个良好的开端是http://www.dicts.info/dictionaries.php

Moby project看起来很有希望,特别是他们的610,000+词表(最后一个链接页)。您也可以下载Wikitionary dump。您必须从XML中提取单词。

很多选择。你应该能够找到一个适合你的需求。

+0

感谢百万队友,实际上“Moby Thesaurus”正是我所需要的。 ;-) – MaYaN 2012-07-20 17:08:21

6

起步比较晚,但是这将下载的中英文维基词典所有单词压缩列表,而不需要解析XML(尽管一些最起码的分析是必要的):

curl http://dumps.wikimedia.org/enwiktionary/latest/enwiktionary-latest-all-titles.gz ~/Downloads/titles.gz 

从那里,所有的你需要做的是解压缩文件,并使其成为一个纯文本文件:

gunzip ~/Downloads/titles.gz 
mv ~/Downloads/titles ~/Downloads/titles.txt 

为了解析列表,使用这样的事情,这将检索完全由小写英文字母的所有单词的列表:

grep "^[a-z]\{1,\}$" ~/Downloads/titles.txt | sort | uniq >> ~/Downloads/words.txt 
+0

感谢您的回答,非常有用 – MaYaN 2014-05-01 15:21:17

+2

这里的任何人在2016年后:网址是https://dumps.wikimedia.org/enwiktionary/latest/enwiktionary-latest-all-titles.g 注意http ** š** – Chewtoy 2017-02-20 10:05:07