normalization

    3热度

    1回答

    对于没有理论最大值的特征进行规范化/标准化最好的方法是什么? 例如,股票价值一直在0-1000美元之间的趋势并不意味着它不能继续上涨,那么正确的方法是什么? 我曾考虑过培养一个更高的模型(例如2000),但它感觉不对,因为没有数据可用于1000-2000范围,我认为这会引入偏差

    0热度

    1回答

    我目前正在使用数据库正常化,并且我发现很多来源在获取1NF的方法上有所不同。 例如,这是我的UNF表: customer +----+--------+----------------------+ | id | name | phone | +----+--------+----------------------+ | 1 | achmed | 06-101010, 06-111

    1热度

    1回答

    我试图读取并正常化numpy中的3通道图像。对于图像中的每个通道,我想计算大于零的像素值的平均值。 我开始: from scipy import misc img = misc.imread('test.png') print(type(img)) #<type 'numpy.ndarray'> print(img.shape) #(512, 512, 3) 但我不知道第1)如何索引超出

    0热度

    1回答

    我每天都会收到一个平面文件(CSV),其内容会被导入到我的数据库中(而不是通过Web表单,POS等的数据输入)。有一个记录中有40个字段,我有600,000个独特的记录。 到目前为止,我还没有看到有必要将这个关系数据库作为关系数据库,尽管肯定会有一些规范化使它更有效;重复的产品,商店,客户,经销商等 如果我从一开始就开始并以某种方式逐步输入数据,我会知道如何做到这一切(我经历的每一个资源都涵盖了但

    1热度

    1回答

    我有一个包含youtube视频视图的数据框,我想在1-10范围内缩放这些值。 下面是值的样子的样本?我如何在1-10范围内对其进行标准化,或者有没有更有效的方法来做这件事? rating 4394029 274358 473691 282858 703750 255967 3298456 136643 796896 2932 220661 48688 4661584 2

    0热度

    1回答

    我想通过用户定义的规范化规范化数据框的选定列。到目前为止,我将与 library(tidyr) library(ggplot2) Mode <- function(x, na.rm = TRUE) { x <- lapply(x, as.numeric) distribution <- hist(x, breaks = 50, plot = FALSE) dis

    0热度

    1回答

    比方说,我有一个熊猫的数据帧,我想正常化只有某些属性,但不能使用此功能的帮助下,整个数据帧: preprocessing.normalize ,我想就地这些标准化列到我的数据框。但我不能因为它有不同的格式(numpy数组)。 我已经看到了怎么办正常化其他方式,例如我不喜欢这样的: s0 = X.iloc[:,13:15] X.iloc[:,13:15] = (s0 - s0.mean())/

    4热度

    1回答

    我有下面的代码示例: var inputString = "ñaáme"; inputString = inputString.Replace('ñ', '\u00F1'); var normalizedString = inputString.Normalize(NormalizationForm.FormD); var result = Regex.Replace(normalizedS

    -7热度

    1回答

    我在MATLAB新的,我有一个文件包含657列和97行,我想这些标准化数据0和1

    0热度

    4回答

    我有点卡住设计数据库的一部分。 我有一张名为Staff的表格。它具有不同的属性: StaffID First Name Last Name Job Title Department Number Telephone Number StaffID是此表中的主键。 但是,我的问题是可以根据电话号码找到任何信息(即每个工作人员都有不同的唯一电话号码)。 例如,这意味着当我们有Phone N