dataset

    0热度

    1回答

    我有一个具有sql服务器后端的winforms应用程序。我有一些表有静态数据查找表,我希望在应用程序启动时填入我的数据集,以便在需要时用于整个应用程序。 通常,在一个形式,我会用这样的:Me.TEMSWBSETableAdapter.Fill(Me.EMS_DS.TEMSWBSE) 但我必须做的是,在每一个表格,需要这些数据。问题是加载数据需要一段时间,所以我想在启动时将数据加载到后台工作器中,任

    1热度

    2回答

    我在寻找有关快速删除中等大小数据集的三分之二的见解。目前,我正在将空格分隔的数据从文本文件导入到Excel中,并且我正在使用循环逐行删除数据。循环从数据的最底行开始,并删除上行。数据按时间顺序排列,我不能简单地砍掉数据的前三分之二或三分之二。基本上,发生的情况是数据被过度采样,太多的数据点彼此靠得太近。这是一个非常缓慢的过程,我只是在寻找另一种方法。 Sub Delete() Dim n As

    -2热度

    2回答

    我有一组类似于此的数据,并希望在所有不同列的值匹配时获取SORT_DT的最早日期。请帮我解决这个问题 df <- fread("CUST_NO ID_NO SYMBOL AUTO_CREATE_DT CLASS_TYPE SORT_DT 107 10120 1 2014-05-12 G/L 2015-01-09 107 10120 1 2014-05-12

    0热度

    1回答

    我有三个数据集,我想加入为了创建一个测试集用于监督机器学习算法。问题是,尽管它们有一些共同的变量,但它们通常在行数和元素数量上有所不同。我试图使用merge()函数,但是,我使用它越多,我得到的行数就越少。最后,我得到了一个有很多行数的小数据集。 我有这三个数据集: test_review nºrows 22956 test_business nrows 1205 test_user nro

    1热度

    1回答

    我有一组拟合图像:约32000图像的分辨率(256,256)。我要建立的数据集是矩阵状的,所以输出形状是(32000,256 * 256)。 简单的解决方案是一个for循环,samething像: #file_names is a list of paths samples=[] for file_name in file_names: hdu=pyfits.open(file_na

    0热度

    1回答

    在KDD99 data set,一个巨大的连接第32和33功能的值的数量比100 我不明白为什么用100个连接的connection window可以得到一个值,该值大于100的原因还大吗?我咨询了很多信息,但一无所获。

    0热度

    1回答

    我试图Y轴分配给我的数据集: Y = dataset.iloc[:, 17].values 在尝试此命令,我收到以下错误:基于 single positional indexer is out-of-bounds

    0热度

    3回答

    我开始在kaggle。 我通过各种数据的科学和机器学习竞争 我已经知道,对于每一场比赛他们都上传训练数据,测试数据和原始数据不见了。 有人可以解释我是什么,以及如何在解决问题时使用这些数据集。

    2热度

    2回答

    说我用大熊猫datatable.csv阅读,表看起来是这样的: 我们怎么能拆柱3,使得数据表随后是这样的: 我读了很多类似的问题的答案,并尝试使用像.str.rpartition('-'),.split('-')和.apply()喜欢的组合,但我没有设法将分离的值提取到c olumns。

    0热度

    1回答

    我正在DataSet并通过JSON.NET 我面临的问题是其中一个字段存储为一个浮点值,将其转换为JSON,但我需要它作为一个整数序列化。我不想改变全部浮点数为整数,只是那一个字段。 有没有人有这样的例子?