假设你文件读入到一个字符串,字符串分隔成线,从带空白每行的结尾。
arr =<<_.lines.map(&:strip)
<!--#set var="V1" value="HI" -->
<!--#set var="V2" value="THERE" -->
<!--#set var="FV" value="HEY/${V1}/${V2}" -->
_
#=> ["<!--#set var=\"V1\" value=\"HI\" -->",
# "<!--#set var=\"V2\" value=\"THERE\" -->",
# "<!--#set var=\"FV\" value=\"HEY/${V1}/${V2}\" -->"]
我将使用以下正则表达式。
r1 =/
(?<=\svar=\") # match ' var="' in a positive lookbehind
.+? # match one or more characters lazily
(?=\") # match '"' in a positive lookahead
/x # free-spacing regex definition mode
r2 =/
(?<=\svalue=\") # match ' value"' in a positive lookbehind
.+? # match one or more characters lazily
(?=\") # match '"' in a positive lookahead
/x # free-spacing regex definition mode
r3 =/
\/\$\{ # match '/${'
\w+ # match one or more word characters
\} # match '}'
/x # free-spacing regex definition mode
r4 =/
(?<=\/\$\{) # match '/${' in a positive lookbehind
.+? # match any number of character, lazily
(?=\}) # match `}` in a positive lookahead
/x # free-spacing regex definition mode
然后我们可以如下计算所需的返回值。
g = arr.each_with_object({}) do |s,h|
var = s[r1].strip
value = s[r2].strip
h["\/\$\{#{var}\}"] = value.gsub(r3) { |s| h.key?(s) ? "/#{h[s]}" : "" }
end
#=> {"/${V1}"=>"HI", "/${V2}"=>"THERE", "/${FV}"=>"HEY/HI/THERE"}
最后,修改密钥。
g.each_with_object({}) { |(k,v),h| h[k[r4]] = v }
#=> {"V1"=>"HI", "V2"=>"THERE", "FV"=>"HEY/HI/THERE"}
上述两个表达式当然可以链接在一起。实际上,它可以写成一行,但我不会推荐它。
有趣的是这是多么干净。至少在我没有经验的头脑中。我可以到达那里,尽管我的方法不够干净。但是,我仍然不确定如何替换嵌入的变量引用,例如FIRST_VAR等以一种干净的方式。任何想法或提示? – farhany