我想从一个大的语料库(100万+记录)的字符串运行统计测试,我不知道如何最好在mySQL中直接执行此操作,而不是在php中解析它,采取(至少根据我的技能)年龄。在mySQL中结合字符串
表:
ID Words
---------- -------------
1 ham
2 cheese
3 lettuce
4 tomato
5 onion
所需的输出,我想实现是创建一个包含双字母组和每个字符串的八卦如下两个新列:
ID Words Bigrams Trigrams
---------- ------------- ------------- -------------
1 ham ham_cheese ham_cheese_lettuce
2 cheese cheese_lettuce cheese_lettuce_tomato
3 lettuce lettuce_tomato lettuce_tomato_onion
4 tomato tomato_onion ........
5 onion ......... ........
我想知道是否有是在mySQL中做到这一点的一种方式?
如果这些总是由ID&ID + 1&ID + 2的逻辑,或者是你寻找*所有排列*? – Kaii
@Kaii它会永远是ID,+1,+ 2 – Jacob
已经尝试加入?我们可以帮助你改善你的查询...如果你尝试.. – scaisEdge