2012-07-16 25 views
2

我一直在寻找名词,动词和形容词的单词列表,我可以导入并使用到我正在使用的密码构建工具中。我没有抓住英语中的每一个单词,而是一直试图找到更简单的单词,这些单词可以连接成合理的密码短语。寻找密码建设的词列表

有没有人知道这样的资源?我尝试了谷歌搜索和Binging以及hippity和hoppity,但我似乎无法找到任何相关的东西。

回答

1

您可以使用(几乎)所有unix发行版附带的词汇表。它可以在/usr/share/dict/words找到。

Here is the list, if you don't have a unix box

+0

不是一个简单的列表 - 有多少人知道单词琐罗亚斯德?对不起,没有赏金这个答案:-D – 2013-04-09 22:51:18

+1

我做到了!弗雷迪水星是一个琐罗亚斯德教......;) – 2013-04-19 16:05:52

0

请检查这些: http://ogden.basic-english.org/words.html https://simple.wikipedia.org/wiki/Wikipedia:List_of_1000_basic_words https://simple.wikipedia.org/wiki/Wikipedia:Basic_English_alphabetical_wordlist

通过使用简单的网页抓取你可以获取的所有单词列表,然后使它们独特的。

另外在那里引用了一些其他的链接,也检查这些链接。

+0

关闭保罗(虽然不是一个简单的抢/支付清单),但没有足够的词之间我所需要的。谢谢回答。 – 2013-04-15 19:24:49

+0

老实说,我不知道你会在哪里找到一个只包含简单单词的列表,特别是在一个容易抓取的表单中。 – Paul 2013-04-15 19:52:50

+0

是的,可能不是保罗,虽然我很惊讶这里没有薪水选项。 – 2013-04-16 00:08:49

0

我完全推荐这个: http://packetstormsecurity.com/Crackers/wordlists/

只是开个玩笑!你有没有试过WordNet?它有各种语言,平台等的接口,它非常强大。

+0

是的我看过WordNet从另一个答案在这里,再次不是一个简单的列表,将不得不手动编辑。 – 2013-04-16 00:07:27

0

我会采取一些措施,但你可能不喜欢答案。我能想到的最简单的方法是通过使用搜索词“名词”或“动词”以及fyletype:csv在Google上查找CSV列表。一旦你找到符合你的标准的文件。我在GITHub上发现了很多,你可以做一些github调用,或者如果不在GIT上,你可以使用你选择的服务器端语言对文件执行CURL或HTTP调用......生成逗号分隔列表或数组(某种结构),然后创建一个随机化函数,并对列表进行调整(抓取一个或两个顶部单词并使用randrange或类似的东西拼接rand数)。然后你可以连接一串字和数字。如果您可以制作简单的两个或三个所有单词的字段表(剪切并粘贴它们)或从原始文件导入...并执行相同操作的查询,则更容易。选择一个或三个随机单词并连接它们,并使用记录的行号进行唯一性设置。

但有两件事是确定的,你需要一个消耗性的过程,你需要字符串连接功能。

+0

是的,我们已经有一个过程需要2个单词和1个数字来形成良好的强度短语,但是我们的单词列表(像所有的例子一样)要么太长(太可怕的话),要么太短。 谢谢大家回答! – 2013-04-16 00:08:22

1

当您说“通过电话轻松沟通”时,您的意思是说,当各种发言人发音时,通常很难与其他词混淆?也许“斗篷”听起来很独特,但“十五”听起来太像“五十”了?如果是这样,你的任务就很艰巨。

你可以通过分析谷歌NGRAM集“共同”的话:http://storage.googleapis.com/books/ngrams/books/datasetsv2.html

您可以确定使用同音/音位分析“声音独特性”。

  1. 获取最常见的1克某(最近)年:

    如果我上我会服用这一点。

  2. 计算/存储每个单词的double metaphone
  3. 通过metaphone进行分组,看看有多少人可以获得metaphone只有1个与之相关的常用词。

所以,这不是一个简单的列表,但你要求的也不是简单的,对不起!

+0

你在正确的轨道ers81239,但不完全是,它更多的是关于常用单词,即任何普通英语发音者可以在句子中放置以便在必要时提供背景的每一天单词。 许多单词列表中都有“琐罗亚斯德教”一词 - 除非你是一个宗教学者,这是毫无意义的,甚至有人甚至不能把它放在句子中。 十五和五十是好的,因为你可以区分使用一个五和五哦。 希望这有助于 - 这是迄今为止最接近的答案,谢谢! – 2013-04-16 04:18:29

+1

是的,如果您阅读Google Ngram数据库的链接,它会给您一个按年份排名Google扫描的书籍中最常见的词汇的排名。所以虽然这些单词可能比会话式英语略微更具学术性,但我认为会话式英语具有重要意义。因为它们是有序的,所以你会得到'最受欢迎的单词'。不只是已知单词的列表。 – 2013-04-16 04:25:05

+0

很酷,我正在寻找更多的选择和运行解决方案(即使它是支付),我已经设法从Ngram分贝下载其中一个文件(许多由于它们的大尺寸而失败 - 是否有ftp选项???)我实际上无法打开文件,因为它的大小为7GB,完全可以工作。 – 2013-04-17 02:21:43