sampling

    0热度

    1回答

    我有一个有5列100万条记录的数据框。 unique_index,name,company_name,city_id,state_id 列,company_name,有100k个独特记录。这遵循权力法。 Top 5000 company_names覆盖了70%的记录。 我想取样品的人数相等这有助于数据的顶部5000,从剩余的一组公司。我试过pd.qcut(df['company_name'],

    0热度

    1回答

    我需要从数据仓库中的不同表中抽取大量数据,比如说600-700个变量......现在,数据集在其原始数据库表单将很容易地触及150个演示--79 MM行,并且为了我的分析目的,我只需要一百万行......如何通过对行进行简单的随机采样,直接从仓库使用proc sql获取数据。 下面的代码不会工作作为ranuni不受Oracle proc sql outobs =1000000; sele

    -3热度

    2回答

    我有一个像下面一个数据帧采样为CSV数据帧, print (df) column 1 column 2 column 3 0 mobile a Blanks 1 mobile b Blanks 2 mobile c cricket 3 laptop d cricket 4 phone e football 5 phone NaN football 6 phone

    -1热度

    1回答

    我有一个信号,我想介绍几个偏移和延迟,其中偏移范围从0.5到5和延迟范围从1到7。 我在此提供一个示例信号来演示我遇到的问题,但实际数据的大小为1x1666520。 如何将这些更改引入信号? 示例代码: t = [ 0 : 1 : 50]; % Time Samples f = 45; % Input Signal Frequency Fs = 440; % Sampl

    1热度

    1回答

    我正在构建一系列滤波器(一个CIC抽取器后接一个低通滤波器),我对频率和脉冲响应感兴趣。 即使知道CIC抽取具有作为移动平均滤波器(MA)类似的脉冲响应,我计算了CIC抽取的下列方式 %parameters of cic D=300; %deci factor M=1; %delays of comb Stages=3; % get impulse response estimated b

    1热度

    1回答

    我有这样一组数据 2016-08-09 12:39:00,536.7841,536.7849,536.6141,536.7849,0.656 2016-08-09 12:40:00,536.6749,536.6749,536.6749,536.6749,0.2642 2016-08-09 12:41:00,535.84,535.84,535.615,535.615,0.348 2016-08

    0热度

    1回答

    我有一个信号,我想在我的信号中添加一个高原(展平),以便找到当地的最大值。 我在这里提供了一个例子,使我的问题更易于理解,因为我的真实数据的大小是1x1666520,所以我无法在此处上传整个文件。 我想要做什么,我期待: •我想让我的信号平坦,我们会发现在信号局部最大值。 •我想将窗口应用于信号,以便在一定范围内可视化展平的效果,并且更深入,更清晰地显示我的信号。我也想控制窗口的大小和宽度。 这里

    0热度

    2回答

    我想从一个大表中获取数据样本,并希望确保稍后可以重复此操作。其他SQL允许使用set.seed(整数)或可重复(整数)命令设置种子来完成可重复采样。但是,这在Presto中不适合我。这样的命令不可用吗?谢谢。

    -1热度

    1回答

    我DF: In [163]: df.head() Out[163]: x-axis y-axis z-axis time 2017-07-27 06:23:08 -0.107666 -0.068848 0.963623 2017-07-27 06:23:08 -0.105225 -0.070068 0.963867 ..... 我设置索引日期时间。由于采样率(10

    0热度

    1回答

    我通常K-折交叉验证的实施是很像: K = 10; CrossValIndices = crossvalind('Kfold', size(B,2), K); for i = 1: K display(['Cross validation, folds ' num2str(i)]) IndicesI = CrossValIndices==i; TempInd =