分词红宝石计数

当我分割字符串“Hello World/N”与分词红宝石计数

"hello world \n".scan(/\w+/)

我得到["hello", "world"]

我想指望\ n或\ T作为字符串为好。

请更正问题。你的一个说法是错误的，我也不明白你在问什么。 – Amadan 2011-04-06 07:24:44

你的前四条线与这个问题无关。 – sawa 2011-04-06 12:50:17

你要这样呢？

"hello world \n".scan(/\w+|\n/)

2011-04-06 07:26:27 Dutow

这是我想要的。非常感谢。 – 2011-04-06 07:32:38

在字符串\n中有一个特殊的含义：它演变为将返回视为空白。您应该避开反斜杠：\\n。

如果要拆分空格你的字符串只是，你应该使用

"Hello world \n".split(/ /)

2011-04-06 07:24:16 Yossi

它会产生相同的错误结果，请参阅rubydoc：如果pattern是一个String，则在分割str时将其内容用作分隔符。如果pattern是单个空格，则str将以空格分割，并且前导空格和忽略连续空白字符的运行。但分割（/ /）是好的。 – Dutow 2011-04-06 07:41:25

@Dutow，谢谢。我纠正了答案。 – Yossi 2011-04-06 08:03:38

这个看起来比使用扫描更简单。谢谢 – 2011-04-06 15:31:53

"hello world \n".scan /[\w\n\t]+/

2011-04-07 19:13:04 EdvardM

您可以使用指定的字符类[：CNTRL：]。

irb(main):001:0> "hello world \n".scan(/\w+|[[:cntrl:]]/) 
=> ["hello", "world", "\n"]

2011-04-19 02:47:45 kyanny

这是如果你不想分手后撇号的话更好（不是90年代，等等）

"hello world \n".split(/[^\w']+/)

2013-02-24 23:57:01 Alex

做不使用\w+计数的话。它会像这样使用Unicode分开的数字和词语：

"The floating point number is 13.5812".scan /\w+/ 
=> ["The", "floating", "point", "number", "is", "13", "5812"]

这同样适用于与其他分隔符像"12,000"数字属实。

Ruby 1.8表达式w+与Unicode一起工作，这已改变。如果字符串中包含Unicode字符，则该字词也将被分隔。

"Die Apfelbäume".scan /\w+/ 
=> ["Die", "Apfelb", "ume"]

这里有两个选项。

2013-09-26 21:54:11

回答