我有一个单词部分的数据库,每个单词有两行。所以基本上每个单词都有两行的数据集。我想找到以元音结尾的单词(以便以后删除它们)。下面是一个例子行:查找与属于集合的两行中的第二行相匹配的记录
ID wordID Segment SegType
2475 1170 d consonant
2476 1170 i vowel
2477 1171 a vowel
2578 1171 d consonant
前两个是一个糟糕的数据集(1170 wordID的) - 这些我想找到,之后再删除。最后两个是一个很好的数据集(wordID 1171),我想保留这些数据集。要做到这一点,最简单的方法是获取wordID
的列表,然后使用它们删除不良集。
那么我该如何选择每个以元音结尾的集合(也就是说集合中两行的第二行的值为vowel
)呢?第二部分的ID
始终高于第一部分,但不是可靠的奇数或偶数(我已经尝试过使用该查询了)。
前两个是坏手段..你是在谈论1170? – Teja
是的,我澄清了我的问题。 – rayne
你想消除重复?什么定义了“坏”wordID? –