2013-02-14 35 views
0

我被给了一个具有~306K行的html日志文件。我知道有更好的格式,但希望能够在线查看文件。我想打破文件成更小的位和“寻呼”可能是要走的除手动执行以下任何方式:初始页面的是否有一种简单的方法将一个巨大的HTML文件分割成多个页面

  • 取头和复制到每一个新的文件
  • 副本5-10K线初始文件和粘贴到一个新的机构
  • 复制初始文件的页脚,并复制到每一个新的文件

然后给1.HTML,2.HTML的基本命名规则, 3.html并在新页脚的每个页面上创建子链接。有没有一种自动化的方式来做到这一点?

+1

您可以解析HTML并将日志提供给数据库,然后使用您自己的分页查看器查看它。 – 2013-02-14 17:50:39

+0

你对Java感到满意吗? – 2013-02-14 17:51:52

+0

...或javascript – Toping 2013-02-14 17:52:10

回答

1

您可以使用类似这样

text = document.getElementById('text').value; var pieces = new Array(); var total = Math.ceil(text.length/10000); for(i=0;i<total;i++){ 
pieces[i] = text.substr(([i]*10000),10000)); } 

然后将其发送到一个文件中(你所希望的方式,AJAX,或者一些写TXT)

1

如果您的HTML文件格式是否正确(即带有换行符),您可以取出页眉和页脚,并分割内容,比如说1000行(或任何保证有意义数据的数量)。该声音可以通过shell脚本进行操作。

+0

这可能是我最终会走的路线。谢谢。 – JM4 2013-02-14 17:59:54

+0

如果你对JavaScript感到满意,那么[node.js](https://github.com/tmpvar/jsdom)的一个很好的模块,你可以很容易地将jquery加载并解析 – srosh 2013-02-14 18:05:36

相关问题