2013-07-02 57 views
1

我需要一个索引页面,显示所有gitHub存储库的链接。列出所有公共gitHub存储库作为链接

我认为这是什么原因,为什么许多回购是由爬虫类的Waybackmachine

我想,如果有一个高排名这样的网站没有找到,他们将开始对其进行抓取

开发商现场最高审计机关,有一个Api for getting all repos

+0

我不知道理解这是怎么回事一个编程相关的问题。你想达到什么目的? – nulltoken

+0

我想编写一个巨大的索引页面,其中包含所有gitHub存储库的链接。 (只有当它不存在,但我不喜欢,搜索) – rubo77

回答

4

警告: GitHub上承载了巨大的存储库。设计索引时必须考虑到这一点。

我能想到的几个选项:

  • legacy GitHub search API。尽管如此,你将不得不应对API rate limit
  • StackOverflow answer可能是一个良好的开端,让每语言回购数量的粗略把握。
  • 凭借GitHub Archive项目,它记录了公共GitHub的时间表。 (注:作为该项目唯一的公开活动返回从2011年2月12日,你不会得到任何有关数据显示库从这个日期没有任何活动。)
+0

我不认为使用搜索API可以列出所有回购。任何查询都有1000个限制。您不能通过页面“10”,每页最多100条记录。对于JavaScript x Ruby,每种语言的Repos有缺陷。我认为唯一的方法是使用存储库API:http://stackoverflow.com/questions/11449038/is-there-any-link-to-show-all-public-repositories-in-github?lq=1 – atorres

相关问题