如何使用来自UCI机器学习存储库的数据集

我目前正在研究差异式隐私应用程序的项目，并且想要试验在UCI机器学习存储库中找到的数据。如何使用来自UCI机器学习存储库的数据集

我的问题是，当涉及到将数据集导出到像MySQL，PostgreSQL甚至nosql这样的数据库引擎时，我使用这种类型的存储库是一种新的方式。

所以，我的问题是如何在数据库引擎中使用这类存储库中的任何数据集。

我打算用这个数据集 https://archive.ics.uci.edu/ml/datasets/Communities+and+Crime

来源

2016-10-29 fudu

用您计划使用的实际数据库标记您的问题，并且包含您要使用的数据的快照。 –

@TimBiegeleisen我想使用MySQL数据库 – fudu

声明：我有这个没有经验无论是。

由于这是标记postgresql，我给出了一个答案，虽然mysql的工作原理类似。

由于这看起来像一个CSV文件，所以可以使用给定列（@attribute）创建一个表（@relation）。您必须查看每一列以查看适当的类型，例如数字可能是integer或某些numeric/decimal类型，字符串可能是char或varchar类型。

create table crimepredict (
    state int, 
    county int, 
    community int, 
    communityname varchar(255), 
    fold int, 
    population decimal(3,2), 
    ... 
)

然后你就可以，如果quote ''作品与COPY命令

copy crimepredict from '/path/to/communities.data' null '?' delimiter ',' quote '' format csv;

我不知道导入的文件。如果不是，则必须在导入之前准备好数据文件，然后用双引号将社区名称包装起来。

来源

2016-10-29 12:32:30

如何使用来自UCI机器学习存储库的数据集

回答

相关问题