背景信息: 我已经得到了我的供应商上传每天晚上用新产品和更新的股票数等 一个XML文件,但他们已经缝合了我和他们不在XML文件中没有描述,他们有一个链接到他们的网站,它有原始文本的描述。
查找和URL的内容替换URL
什么,我需要做的是,通过我从他们下载和URL的内容替换URL文件循环的脚本。
举例来说,如果我有
<DescriptionLink>http://www.leadersystems.com.au/DataFeed/ProductDetails/AT-CHARGERSTATION-45</DescriptionLink>
我希望它最终成为
<DescriptionLink>Astrotek USB Charging Station Charger Hub 3 Port 5V 4A with 1.5m Power Cable White for iPhone Samsung iPad Tablet GPS</DescriptionLink>
我已经尝试了一些东西,但我不是很精通使用脚本或循环。 到目前为止,我已经有了:
#!/bin/bash
LINKGET=`awk -F '|' '{ print $2 }' products-daily.txt`
wget -O products-daily.txt http://www.suppliers-site-url.com
sed 's/<DescriptionLink>*/<DescriptionLink>$(wget -S -O- $LINKGET/g' products-daily.txt
但同样,我不知道这一切是如何真正起作用的,所以它是摸着石头过河。 任何帮助表示赞赏!
更新为包含示例URL。
你能提供一个url的例子吗?否则很难测试... –
添加的URL例如:) – Mitchell