我最近一直在研究某些数据库搜索功能,并希望获取一些信息,如每个文档的平均字数(例如数据库中的文本字段)。我已经(在数据库之外选择的语言,而不处理)迄今为止发现的唯一的事情就是:使用SQL来确定文本字段的字数统计
SELECT AVG(LENGTH(content) - LENGTH(REPLACE(content, ' ', '')) + 1)
FROM documents
这似乎是工作,但*你有其他的建议?我目前正在使用MySQL 4(希望尽快转到第5版),但我也对通用解决方案感兴趣。
谢谢!
*我可以想象,这是一个非常粗糙的方式来确定这一点,因为它没有考虑内容中的HTML等。对于这个特定的项目来说没问题,但是再一次有更好的方法吗?为了定义我的意思是“更好”:要么更准确,更有效率地执行,要么更“正确”(易于维护,良好的实践等)。对于我可用的内容,上面的查询速度足够快,对于这个项目来说是准确的,但我可能在将来需要类似的东西(所以我问)。
您需要定义“更好” – 2009-04-14 17:56:02