我正试图清理一些我从熊猫数据框导入到MySQL中的数据。当我使用MySQL SELECT DISTINCT不区分大小写?
SELECT DISTINCT
Variable
似乎MySQL的对待Variable作为equivilent到变量:
一些显示为:
VARIABLE
别人的。
虽然R将Variable和VARIABLE视为不同,但我将其导入到R中。 运行
as.factor
给了我两个因素。 如何让MySQL的SELECT DISTINCT区分大小写,以便我可以检测并修复导入到R中的数据进行分析?
您可能正在使用不区分大小写的排序规则。你想要一个大小写敏感的。请阅读此处:http://dev.mysql.com/doc/refman/5.7/en/charset-collate.html。 –
[使用'在这个SO后看到'BINARY'](http://stackoverflow.com/questions/19462919/mysql-select-distinct-should-be-case-sensitive) –
我把一切都设置为UTF-8更早在熊猫代码中如此BINARY blob的一切。我想我会考虑将MySQL COLLATION切换为默认情况下区分大小写。命令行上的任何指针? – KillerSnail