2016-10-29 23 views
0

我目前正在研究差异式隐私应用程序的项目,并且想要试验在UCI机器学习存储库中找到的数据。如何使用来自UCI机器学习存储库的数据集

我的问题是,当涉及到将数据集导出到像MySQL,PostgreSQL甚至nosql这样的数据库引擎时,我使用这种类型的存储库是一种新的方式。

所以,我的问题是如何在数据库引擎中使用这类存储库中的任何数据集。

我打算用这个数据集 https://archive.ics.uci.edu/ml/datasets/Communities+and+Crime

+0

用您计划使用的实际数据库标记您的问题,并且包含您要使用的数据的快照。 –

+0

@TimBiegeleisen我想使用MySQL数据库 – fudu

回答

1

声明:我有这个没有经验无论是。

由于这是标记,我给出了一个答案,虽然的工作原理类似。

由于这看起来像一个CSV文件,所以可以使用给定列(@attribute)创建一个表(@relation)。您必须查看每一列以查看适当的类型,例如数字可能是integer或某些numeric/decimal类型,字符串可能是charvarchar类型。

create table crimepredict (
    state int, 
    county int, 
    community int, 
    communityname varchar(255), 
    fold int, 
    population decimal(3,2), 
    ... 
) 

然后你就可以,如果quote ''作品与COPY命令

copy crimepredict from '/path/to/communities.data' null '?' delimiter ',' quote '' format csv; 

我不知道导入的文件。如果不是,则必须在导入之前准备好数据文件,然后用双引号将社区名称包装起来。

相关问题