2011-10-16 17 views
-1

例如,对于此URL它不显示它作为文件对于使用htmlagilitypack你怎么能确定URI是否是文件或不

http://www.darty.com.tr/e_commerce/ximg/yeniyil/darty%20garanty%20brosur.pdf

但它是一个PDF文件。所以我想要的只是确定所有的URL不能像PDF,DOC或DOCX等爬行。我怎么可以做到这一点与C#4.0和htmlagilitypack?

谢谢。

不承认文件:http://img695.imageshack.us/img695/61/notshowasfile.png

+0

你是什么意思“不显示为文件”?它*是*一个文件。 –

+0

乔白在这里我的意思是:http://img695.imageshack.us/img695/61/notshowasfile.png – MonsterMMORPG

回答

1

Uri是基础.NET Framework的一部分 - 这无关与HTML敏捷性包。

这也与它是一个PDF无关。 Uri.IsFile的文档说:

当Scheme属性等于UriSchemeFile时,IsFile属性为true。

换句话说,IsFile回答“这是一个file:// URI”的问题吗?由于这是一个http:// URI,答案是否定的。

您似乎将URL与内容混淆。 A Uri只是一个奇特的字符串;它的工作是的一个URI,而不是去服务器并且询问有关的内容那个URL。 “这是一种我知道如何抓取的文件类型?”无法通过查看URL来回答; http://example.com/articles/123可能是一个网页或PDF或文本文件或JPEG或任何其他的一千件事情。您必须对服务器执行GET或HEAD请求,然后查看返回的Content-Type,以了解URL代表的内容类型。

+0

那么如何提出请求并确定它是页面还是文件呢? – MonsterMMORPG

+0

知道答案的人不会看到关于Uri.IsFile的这个问题。尝试发布一个新问题。 –

相关问题