2013-06-19 52 views
1

我正在构建一个脚本来grep歌曲名称(也许是艺术家)并将其输出到文本文件。Grep将歌曲名从html文档转换为文本文件

假设我们使用的是http url“http://open.spotify.com/track/2TPEDo3bJrmhmDxB2Wi3Kw”,我们希望将歌曲名输出到文本文件中。

我已经走到这一步:

[email protected]:/i/am/a/patch$ curl http://open.spotify.com/track/2TPEDo3bJrmhmDxB2Wi3Kw | grep h1 >> test.txt 
    % Total % Received % Xferd Average Speed Time Time  Time Current 
           Dload Upload Total Spent Left Speed 
100 10291 0 10291 0  0 55260  0 --:--:-- --:--:-- --:--:-- 77962 
[email protected]:/i/am/a/patch$ cat test.txt 

      <h1 itemprop="name">Gold Dust (Flux Pavilion Remix)</h1> 
[email protected]:/i/am/a/patch$ 

这里的问题是,我有一些无用的数据在这里“” 我只希望这首歌的名字。

此外,艺术家也会很好。

每次都会有不同的spotify网址,所以我不能grep歌名。

我被困在这里所以希望有人能帮助我,谢谢!

/呼

回答

3

你可以尝试这样的:

grep -oP '(?<=\"name\">)[^<]+(?=</h1>)' test.txt 
+0

很好,谢谢。 这让它工作。 现在只需要艺术家,但谢谢! :) – Phew