normalization

3热度

1回答

对于没有理论最大值的特征进行规范化/标准化最好的方法是什么？例如，股票价值一直在0-1000美元之间的趋势并不意味着它不能继续上涨，那么正确的方法是什么？我曾考虑过培养一个更高的模型（例如2000），但它感觉不对，因为没有数据可用于1000-2000范围，我认为这会引入偏差

0热度

1回答

正常化从UNF到1NF

我目前正在使用数据库正常化，并且我发现很多来源在获取1NF的方法上有所不同。例如，这是我的UNF表： customer +----+--------+----------------------+ | id | name | phone | +----+--------+----------------------+ | 1 | achmed | 06-101010, 06-111

1热度

1回答

Numpy ndarray图像像素对于大于零的像素值的平均值：正常化图像

我试图读取并正常化numpy中的3通道图像。对于图像中的每个通道，我想计算大于零的像素值的平均值。我开始： from scipy import misc img = misc.imread('test.png') print(type(img)) #<type 'numpy.ndarray'> print(img.shape) #(512, 512, 3) 但我不知道第1）如何索引超出

0热度

1回答

平面文件作为输入 - MySQL最佳实践

我每天都会收到一个平面文件（CSV），其内容会被导入到我的数据库中（而不是通过Web表单，POS等的数据输入）。有一个记录中有40个字段，我有600,000个独特的记录。到目前为止，我还没有看到有必要将这个关系数据库作为关系数据库，尽管肯定会有一些规范化使它更有效;重复的产品，商店，客户，经销商等如果我从一开始就开始并以某种方式逐步输入数据，我会知道如何做到这一切（我经历的每一个资源都涵盖了但

1热度

1回答

Python数据框的特定列之间的比例值1-10

我有一个包含youtube视频视图的数据框，我想在1-10范围内缩放这些值。下面是值的样子的样本？我如何在1-10范围内对其进行标准化，或者有没有更有效的方法来做这件事？ rating 4394029 274358 473691 282858 703750 255967 3298456 136643 796896 2932 220661 48688 4661584 2

0热度

1回答

如何将数据帧切片传递给R中的模式归一化的直方图函数？

我想通过用户定义的规范化规范化数据框的选定列。到目前为止，我将与 library(tidyr) library(ggplot2) Mode <- function(x, na.rm = TRUE) { x <- lapply(x, as.numeric) distribution <- hist(x, breaks = 50, plot = FALSE) dis

0热度

1回答

规范化sklearn

比方说，我有一个熊猫的数据帧，我想正常化只有某些属性，但不能使用此功能的帮助下，整个数据帧： preprocessing.normalize ，我想就地这些标准化列到我的数据框。但我不能因为它有不同的格式（numpy数组）。我已经看到了怎么办正常化其他方式，例如我不喜欢这样的： s0 = X.iloc[:,13:15] X.iloc[:,13:15] = (s0 - s0.mean())/

4热度

1回答

删除口音

我有下面的代码示例： var inputString = "ñaáme"; inputString = inputString.Replace('ñ', '\u00F1'); var normalizedString = inputString.Normalize(NormalizationForm.FormD); var result = Regex.Replace(normalizedS

-7热度

1回答

如何在Matlab中规范大数据？

我在MATLAB新的，我有一个文件包含657列和97行，我想这些标准化数据0和1

0热度

4回答

不知道这是否构成传递依赖

我有点卡住设计数据库的一部分。我有一张名为Staff的表格。它具有不同的属性： StaffID First Name Last Name Job Title Department Number Telephone Number StaffID是此表中的主键。但是，我的问题是可以根据电话号码找到任何信息（即每个工作人员都有不同的唯一电话号码）。例如，这意味着当我们有Phone N