2013-05-25 90 views
1

我想保留一些关于某些网页的基本信息。DIY网站统计/分析

我希望保留的信息非常少,而Google分析的内容过于夸张,并且很难将结果集成到页面中。

我想保留时间戳,IP和浏览器信息来计算每天/每周/每月/每年的访问次数的准确信息,并且能够了解访问者来自哪里。

将此信息存储在所有页面的平面文件,每页跟踪的平面文件或关系数据库中是否更好?

+0

我倾向于每页/平面文件,因为编写和检索信息可能是最快的,并且不会膨胀我正在使用的数据库。 – Daniel

回答

1

当你说“将结果集成到页面中”时,我有些困惑。你想以某种方式公开显示你的流量,或者你只是想要一个用户友好和简单的界面来看待事情吗?

当您说“将所有信息保存在平面文件中是否更好,每页平面文件跟踪或关系数据库? - 这也让我感到困惑,如果你有cPanel或大多数其他类型的服务器,它已经自动存储每个用户与服务器/网站交互的日志文件。日志文件是“所有页面的平面文件”+用户所做的任何其他内容。真的,无论你获得多少流量,服务器都会将其记录到一个文件中。没有太多需要进入数据库,除非你正在做其他的事情。我覆盖选项B中的日志文件。

我试图衡量您的专业知识,但我只列出我通常做事情的方式。也许会有帮助。

选项A是一个网站的一个相当新的用户/管理员(但可能适合你完美)&

选项B是一个谁更先进一点,但会显示信息你想在一个不错的Excel电子表格格式化。它还需要更多的步骤。每个人都不了解你的专业水平,我会详细讨论。如果它是多余的道歉。

选项A) Statcounter.com - 它非常容易安装,免费,没有CC预付费,涵盖了您似乎需要的一切,并且可扩展。即使你不知道如何将代码复制并粘贴到页面中,他们也有一个很好的简单指南。这对一定数量的游客是免费的(我相信他们会持有最近的250),那么你只需支付一小笔费用。我相信每年的费用大约是10美元,可以记录最近5000个访问者的日志,并且非常合理地从那里上升。

您也可以只将它放在选定的页面上,就像您似乎想要做的那样。

Statcounter将收集的不仅仅是时间戳,IP,浏览器信息和引荐网址,还有更多关于您感觉像谷歌分析一样被淹没的点 - 它可能完全适合您的需求。用户界面也非常友好。

选项B)更准确的方法,需要多一点经验/努力将是下载您的服务器日志。这可能对你没有任何用处,但是这里有用。

我不确定你有什么类型的网站或服务器,但如果是cPanel,你应该在cPanel的主页面上看到引用“日志”的内容。如果它不是cPanel,我不确定在哪里找到他们说实话,嘿 - 但他们会在某个地方。

使用cPanel,一旦您单击“服务器日志”或“包括单词日志的同义短语”按钮,您应该可以从服务器下载原始日志。它可以用一种你可能不熟悉的文件类型,例如“.tar.gz”,以一种奇怪的方式吐出它们。这只是一个zip格式的文件,您需要“7-Zip”(搜索Google并下载它)才能打开。您不一定需要提取文件,只需用7-Zip在Windows中打开文件并打开文件夹层,直到找到可能以“.com”结尾的文件。

右键单击它并从7-Zip中选择“编辑”,它应该弹出在记事本中打开。如果这不起作用,只需提取该文件,然后将该文件的结尾重命名为“.txt”。

现在你可以在记事本中打开它,它应该精美地复制并粘贴到Excel中。

从这里在Excel中选择“Data” - >“Text to Columns” - >“Delimited” - >并检查底部的“custom”选项,我相信一个“ - ”服务器如何输出日志。

这应该把所有东西都分解成不同的列。它会进行每个人与服务器进行的每一次交互 - 从哪个图片下载他们的图片......哪些css文件......是否已下载以查看您的网页......所有内容。它还方便地具有时间戳,IP,引用URL和Useragent(浏览器信息)。

不要太深入Excel,但您可以选择所有列,然后选择“删除重复项”下的“数据”选项卡,并只检查具有IP的列以获得独特的访问。您也可以在所有列上使用Excel的过滤器选项(同时选择所有列并单击“数据” - >“过滤器”以查看您想要的内容。例如,使用过滤器指定Excel仅显示行不包含“.jpg”或“.css”....等。吨的选项那里。取决于你的经验,但Excel。

我有一种感觉statcounter可能是你在找什么。

否则,你可以在每个页面的顶部放一些PHP代码,并将其发布到你的服务器或数据库的.txt文件中,如果你想要的话。使用关系数据库等,特别是只处理你想要的东西,直到你得到很多流量 - 真的变得非常必要 - 就像1每分钟200-200名访问者 - 和/或你正在用这些数据做动态的事情。

希望这会有所帮助。否则,我可能完全用错误的方向射击 - 哈哈。

+0

嗨,约翰,感谢您花时间写出详细的答复。我想我并不清楚我的需求。这是针对拥有多个拥有自己页面的多个用户的网站,并且每个页面都使用统计信息向用户显示其页面的各个统计信息。虽然我可以使用类似服务器日志文件的东西,但这会比收集数据并将其按需显示给每个用户更加困难。我试图弄清楚的是如何确定数据,数据库,单个平面文件或多个平面文件。 – Daniel

+0

是的,自从我在您的问题中阅读“关系数据库”这个词以来,我有种感觉, –

+0

虽然我只是在这里没有经验的负载/计算机假设,但我会去多个平面文件的数据库,取决于您的服务器/数据库上每个单独的连接负载多少。否则,我认为一个平面文件很可能会让事情变得缓和 - 而流量分析可能无法满足客户的需求。我知道如果你使用mysql memcached可能会派上用场以及其他几个工具。这对您的具体情况来说似乎是一个非常具体和习惯性的问题。如果你想尝试在AWS中进行拍摄,只需搜索60的功率:) –