考虑下表“鸣叫”如何从数据库中删除重复的条目?
tweet_id call_id id_str timestamp text
--------------------------------------------------
1 11 12345 312323134 lorem ipsum
2 11 12345 312323134 lorem ipsum
3 11 12345 312323134 lorem ipsum
4 11 12345 312323134 lorem ipsum
5 11 67890 325565454 dolor
6 11 34355 333544664 samet
每鸣叫应仅在数据库中出现一次。正如你所看到的,除了tweet_id(它是一个自动编号字段)之外,完全相同的tweet(相同的call_id,id_str,时间戳和文本 - 除此之外所有内容都是相同的)已被存储4次(!)
有没有一种方法可以精确匹配(所以:除了tweet_id以外,其他都一样),然后删除最后一个x - 1(这里:4 -1 = 3)?换句话说,在清理表看起来像
tweet_id call_id id_str timestamp text
--------------------------------------------------
1 11 12345 312323134 lorem ipsum
5 11 67890 325565454 dolor
6 11 34355 333544664 samet
我希望有一个简单的方法来做到这一点,否则我有一个巨大的问题(显示你其实你之前想到的一个小时是什么把建立你的数据库可以做!)
这个问题必须被回答了百万次。 – usr 2012-03-31 21:10:29