3
我有一个文件中的URL列表(每行=不同的域)我想扫描(不递归),并选择两个模式,这是在不同的行。经过努力2天 - 我的头在旋转......grep multiline pattern
这是很重要的HTML部分:
<a href="http://subdomain.domain.tld/">Home</a>
</li>
<li>
<a data-uv-trigger='true' href='mailto:[email protected]'>
我需要选择域(subdomain.domain.tld)和电子邮件ADRESS(约翰福音@ doe.com)。我可以通过两步来(wget/sed)这些零件。
wget -O - -i urls-to-scan-manuell.txt | sed -n "s/\(.*a href=\"\)\(.*\)\(\">Home.*\)/\2/p"
wget -O - -i urls-to-scan-manuell.txt | sed -n "s/\(.*true' href='mailto\)\(.*\)\('>.*\)/\2/p"
但我想一次选择两个部分,并将它们写入到一行文件中,并用空格(空格)分隔。这是sed的多行东西,让我疯狂。
请:我需要你的帮助,你会:)
谢谢你在前进, 赖。
Arf,我在'sed'的末尾和'paste'之前忘了管道符号'|'。现在添加它,检查我的更新。 – janos