2012-02-10 134 views
0

我有以下代码,它可以很好地从SQL表中格式化文本。虽然看起来有点长。PHP mysql格式化文本

它将从换行符创建段落,但忽略标题和列表标签(不换那些在“P”标签。

任何人都可以看到一个明显的方式来凝聚呢?

<?php 

function format_html($content) 
{ 
    $content = str_replace("<h1>\r\n", "<h1>", $content); 
    $content = str_replace("</h1>\r\n", "</h1><p>", $content); 
    $content = str_replace("<h2>\r\n", "<h2>", $content); 
    $content = str_replace("</h2>\r\n", "</h2><p>", $content); 
    $content = str_replace("<h3>\r\n", "<h3>", $content); 
    $content = str_replace("</h3>\r\n", "</h3><p>", $content); 
    $content = str_replace("<h4>\r\n", "<h4>", $content); 
    $content = str_replace("</h4>\r\n", "</h4><p>", $content); 
    $content = str_replace("<h5>\r\n", "<h5>", $content); 
    $content = str_replace("</h5>\r\n", "</h5><p>", $content); 
    $content = str_replace("<h6>\r\n", "<h6>", $content); 
    $content = str_replace("</h6>\r\n", "</h6><p>", $content); 
    $content = str_replace("<ul>\r\n", "<ul>", $content); 
    $content = str_replace("</ul>\r\n", "</ul><p>", $content); 
    $content = str_replace("<ol>\r\n", "<ol>", $content); 
    $content = str_replace("</ol>\r\n", "</ol><p>", $content); 
    $content = str_replace("<li>\r\n", "<li>", $content); 
    $content = str_replace("</li>\r\n", "</li>", $content); 
    $content = "<p>" . str_replace("\r\n", "</p><p>", $content); 
    $content = str_replace("<p><h1>", "<h1>", $content); 
    $content = str_replace("<p><h2>", "<h2>", $content); 
    $content = str_replace("<p><h3>", "<h3>", $content); 
    $content = str_replace("<p><h4>", "<h4>", $content); 
    $content = str_replace("<p><h5>", "<h5>", $content); 
    $content = str_replace("<p><h6>", "<h6>", $content); 
    $content = str_replace("<p><ul>", "<ul>", $content); 
    $content = str_replace("<p><ol>", "<ol>", $content); 
    return $content; 
} 

function format_html_end($content) 
{ 
    $content = str_replace("</h1></p>", "</h1>", $content); 
    $content = str_replace("</h2></p>", "</h2>", $content); 
    $content = str_replace("</h3></p>", "</h3>", $content); 
    $content = str_replace("</h4></p>", "</h4>", $content); 
    $content = str_replace("</h5></p>", "</h5>", $content); 
    $content = str_replace("</h6></p>", "</h6>", $content); 
    $content = str_replace("</ul></p>", "</ul>", $content); 
    $content = str_replace("</ol></p>", "</ol>", $content); 
    return $content; 
} 

?> 

<?php 
$con = mysql_connect("localhost","username","password"); 
if (!$con) 
    { 
    die('Could not connect: ' . mysql_error()); 
    } 

mysql_select_db("db", $con); 

$result = mysql_query("SELECT column FROM table WHERE id = '1'"); 

while($row = mysql_fetch_array($result)) 
    { 
    $content = $row['column']; 
    echo format_html_end(format_html("$content</p>")); 
    } 

mysql_close($con); 
?> 

的从表中的内容会是这个样子......

<h1>Header</h1> 
ertertert 
ertertertert 
rhdfgh 
dfghdfghdfgh 
ddfgh 
<ul> 
<li>fdghdfghd</li> 
<li>fghjfghj</li> 
</ul> 
+0

正则表达式,也许? – tdammers 2012-02-10 16:00:51

+3

你究竟想完成什么?除非有预标记,否则新行简单地被视为空白并与HTML中的其他空白空间紧密结合。 – evan 2012-02-10 16:01:25

+0

您正在删除比相应的'

'更多的'

'。代码看起来可怕..我敢肯定,你会遇到与标签匹配问题 – 2012-02-10 16:05:40

回答

2

你可以用几个正则表达式来处理几乎所有的问题:

$content = preg_replace("/<(h[1-6]|ul|ol)>\r\n/", "<$1>", $content); 
$content = preg_replace("/<\/(h[1-6]|ul|ol)>\r\n/", "</$1><p>", $content); 
$content = preg_replace("/<(\/?)li>\r\n/", "<$1li>", $content); 
$content = preg_replace("/<p><(h[1-6]|ul|ol)>/", "<$1>", $content); 
$content = preg_replace("/<\/(h[1-6]|ul|ol)><\/p>/", "</$1>", $content); 

这些技巧是,您可以在进行替换时使用捕获和反向引用。因此,例如,第一个正则表达式可以匹配h1-h6,ulol,并且在替换期间$1具有与其匹配的那些值中的值。

下面这行代码会保留原样,因为它与其他正则表达式没有任何共同之处,并且工作正常。

$content = "<p>" . str_replace("\r\n", "</p><p>", $content); 
+0

尽管它在每个列表项目的第二个项目中都有效,但它几乎可行。它将p标签添加到第二个和后续列表项中。 – Tom 2012-02-10 16:43:39

+0

我看到...列表项的处理稍有不同。我会修改我的答案。 – Feysal 2012-02-10 17:35:06

0

我不明白为什么你需要所有这些替代品,但你可以使用数组与str_replace

3

大概应该是在代码审查不在这里,但很好啊:

str_replace函数接受数组,例如:

<?php 

function format_html($content) 
{ 
    $replace = array("<h1>\r\n","</h1>\r\n","<h2>\r\n",...); 
    $with = array("<h1>","</h1>","<h2>\r\n",...); 

    $content = str_replace($replace, $with, $content); 
    return $content; 
} 
0

随着他们中的很多,你可以这样做:

$content = str_replace(PHP_EOL, "<p>", $content); 
0

你会想做一个多部分正则表达式。这是我可以快速充实的东西。这将通过使用环视表达式匹配来大大减少代码量。如果这些是通用标签规则,请将下面的“”替换为“<。*>”。

$patterns = array(); 
$patterns[0] = '/(?<=<h[1-6]>)\r\n/'; // removes \r\n after the tag 
$patterns[1] = '/<p>(?=<h[1-6]>)/'; // removes <p> if before the tag 
echo preg_replace($patterns, '', $content); 

帮助上的preg_replace:提前http://www.php.net/manual/en/function.preg-replace.php

外观和向后看:http://www.regular-expressions.info/refadv.html