我有一些数据,如下面:随机森林机器学习支持字符串字符吗?
username, password, valid
kramer, abcd1234, 1
dan,123123123,0
,你可以看到数据的字符可以是字符串。所以scikit-learn.RandomForestClassifier返回错误如
ValueError: could not convert string to float: 'hEZ7P|N*Akem'
我在考虑两种解决方案。浮动
- 变化串,因为它们可以通过ASCII
- 找到另一个algothrim支持字符串特征来表示。
哪一个更好?你能提出一些建议吗?
这些算法需要数字输入。你的目标是什么? –
我想学习机器学习。所以我设计了我的用例。我创建了一些数据包括user_name,密码和有效的。有效与否取决于密码。我尝试从我的数据中放出algothrim列车。但我发现algothrim无法处理字符串。所以我在这里问 –
我认为机器学习不是要走的路。如果您使用密码来验证某些内容,那么这只是直接的逻辑 - 不需要统计推断。 –