2012-01-01 108 views
-1

我有很长的单词,例如:如何将长单词分成单词?

welcometostackoverflow 

betweenparagraphs 

如何获得字符串或数组像这样在PHP?

Welcome to Stack Overflow 

between paragraphs 

样品结果: http://www.bing.com/images/search?q=betweenparagraphs&go=&qs=n&sk=&form=QBIR

+2

你不能,不只是正则表达式。您需要一个字典文件/数组来分割,即使如此,Stack和Overflow上的大写也不会适用,以及其他许多问题。这很难做,我感觉到[XY问题](http://meta.stackexchange.com/questions/66377/what-is-the-xy-problem)。为什么你需要像这样分割一个字符串? – Bojangles 2012-01-01 14:10:28

+0

@JamWaffles谢谢你的建议.. 我需要拆分长单词才能生成唯一的关键字。 尝试搜索bing中关键字“welcometostackoverflow”的图片 – tanyadong 2012-01-01 14:19:02

+2

尝试在bing处搜索关键字“welcometostackoverflow”的图像......这是可行的,因为搜索引擎可以识别热门关键字和热门搜索词组。否则,正如@Asif所说,没有办法确定像“溢出”这样的词是“溢出”,“溢出”还是“低于”。搜索引擎通常理解,在这种情况下,它更可能是“溢出”而不是任何其他选择。但是他们没有办法100%确定。 – 2012-01-01 14:27:07

回答

6

这几乎是不可能的,因为你的代码无法知道一个字结束。即使有字典,也会有不明确的情况。

+0

尝试在bing处搜索关键字“welcometostackoverflow”的图像 – tanyadong 2012-01-01 14:13:05

+2

如果你是一个搜索引擎,你将拥有一个足够大的可重写字典,它可以帮助你,猜测用户想要写什么。 – rekire 2012-01-01 14:28:33

+0

他有机会获得这样的机会有多大? ;) – ThiefMaster 2012-01-01 14:32:34

0

简单..你不能这样做,即使在数组或文件或其他东西的大量样本单词收集。

的原因是:

  1. 你输入的字符串,因为我以为不会 welcometostackoverflow每次。
  2. 这将导致大模糊不清的情况。的情况。

    例如: 溢出:这可能是overflowoverflowlow ..

+0

bing和其他高级搜索引擎_may_使用排列和组合在非常高的水平,加上_relevant data_和_last搜索_ – Asif 2012-01-01 14:24:10

+0

高级别的比较并不意味着它不可能做到,谢谢Asif。 – tanyadong 2012-01-01 14:30:40

+0

off_sourse在编程中_impossible_的可能性非常小,但我只是试图详细说明你的bing建议。 – Asif 2012-01-01 14:34:20