2017-04-03 74 views
0

我无法使用weka加载csv文件,我甚至使用文本编辑器删除了每个特殊符号,但仍然没有运气。我附上了这个文件,如果能解决这个问题,我将不胜感激。无法在weka中加载CSV文件

它显示“值数目错误,阅读31,预期27,阅读令牌[EOL],3号线”

链接:https://drive.google.com/open?id=0By7zyIPDD6HJMmthWnZLSUk5aFE

+0

请编辑你的文章,包括你正在使用的代码不要我们下载文件 –

+0

没有代码,我只是想使用Weka界面加载csv文件,并且上面的链接是用于csv文件的。 –

回答

0

您的文件,如果你空字段的普朗蒂将它下载为.csv,即使头文件在其结尾处也会得到三个逗号。 例如你的第六行:

,道格·沃克,,, 131,罗布·沃克,131,,纪录片,道格·沃克,星球大战:七的部队醒来时,8,143,0 ,,,,,,, ,, 12,7.1,,0 ,,,

类似于这篇文章中的建议,你可以试试s.th.像记事本++或另一个文本编辑器,用“,?”替换“,,”以填补您的空白。

Convert NA values to ? automatically while loading

我这样做,然后你在第一排两个问号得到列名至极显然行不通,所以改变的第一行是这样的:

颜色,director_name ,num_critic_for_reviews,持续时间,director_facebook_likes,actor_3_facebook_likes,actor_2_name,actor_1_facebook_likes,毛,流派,ACTOR_1_NAME,MOVIE_TITLE,num_voted_users,cast_total_facebook_likes,actor_3_name,facenumber_in_poster,plot_keywords,?,num_user_for_reviews,语言,国家,CONTENT_RATING,预算,TITLE_YEAR,actor_2_facebook_likes,imdb_score,ASPECT_RATIO ,movie_faceb ook_likes,additionalColName1,additionalColName2,additionalColName3

,如果你现在尝试导入数据秧鸡开始告诉你该行不喜欢的原因。顺便说一句。你没有“删除每一个特殊符号”! 用例如它的工作原理。

这只是一个丑陋的解决方法,尝试填充空值,并找到一个正则表达式或更好的方式来保存您的文件,以删除每行的最后三个逗号,我现在只是太懒了。但我可以将它加载到weka,这就是你想要的(

+0

感谢队友!它工作:) –

+0

不客气;) –