让唉,你正在为你的网站分析程序,在其中您登录每次你访问它时页面的地址,让你的log.txt可能是找到一套最常见的元素
x.com/a
x.com/b
x.com/a
x.com/c
x.com/a
没有计数器,它只是一个日志文件,并没有使用sql,因为这有成千上万的元素,你有一千个独特的域名地址(x.com/a x.com/b),什么是最有效的方式通过这个名单,并吐出前10名的网址。
我最好的解决方案是通过日志文件,然后如果该域不存在于散列表中,则将其作为关键字添加,然后增加它的值;然后在散列上搜索最大的10个值。
我不相信这是最好的解决方案,不仅是因为空间的复杂性(如果独特的领域从几千到几百万,会发生什么),而且我需要在散列表上进行另一次搜索找到最大的价值。