training-data

0热度

1回答

我目前正在尝试使用卫星图像来识别苹果园。我在每个班级的代表性数据数量方面面临一个小问题。其实我的问题是：是否有可能在每个时期采取随机一些不同的图像，在我的“非苹果”类，因为我有更多的论文（与“苹果”一），我想增加我的网络将分类出一个不具代表性的图像的概率。在此先感谢您的帮助

0热度

2回答

如何从Weka中的数据集中删除百分比但保持课程平衡？

我有一个数据集，包含来自A类的50％实例和B类的50％实例。我想将我的数据集分成一个训练集和一个测试集。我知道RemovePercentage过滤器存在，但它不关心类平衡。我如何从我的数据集中删除35％，但仍然保持训练集中的50/50类分布？

3热度

2回答

IBM Watson nl-c培训时间

我有一个包含约14,700条记录的数据集。我希望在ibm watson上进行培训，目前我正在试用版。关于分类器需要训练的时间的粗略估计是什么？数据集的每条记录都包含一个句子，第二列包含类名。

0热度

1回答

“时代”对于HMM和神经网络有不同的含义吗？

我正在使用隐马尔可夫模型为N示例句子构建一个文本系统的语音以进行重新估计。在神经网络的背景下，我了解时代的概念是指完整的训练周期。我认为这意味着“将相同的数据提供给相同的，更新的网络，每次都有不同的权重和偏见” - 纠正我，如果我错了。同样的逻辑工作，同时执行从相同的句子重新估计（即训练）HMMs？换句话说，如果我有N个句子，我可以重复输入样本10次，以产生10 * N样本。这是否意味着我正在执

1热度

1回答

使用python sklearn的随机森林模型的增量训练

我使用下面的代码来保存随机森林模型。我正在使用cPickle来保存训练有素的模型。当我看到新的数据时，我可以逐渐地训练模型。目前，列车集有大约2年的数据。有没有一种方法可以在另外两年的时间里进行训练，并且（种类）将其附加到现有的已保存模型上。 rf = RandomForestRegressor(n_estimators=100) print ("Trying to fit the Rando

0热度

1回答

如何为LSTM生成3D Numpy阵列按需

我目前正试图使用通过Keras实现的夏季项目的“简单”LSTM网络。查看给出的示例代码，看起来LSTM代码需要预先生成的3D numpy数组。由于我想使用的数据集和相关的时间间隔都很大，因此我一次加载一个“完整数组”是非常令人望而却步的。是否有可能加载原始数据集并根据网络的需要对其应用排序转换（在这种情况下，从x个时间间隔窗口构建3D数组，然后每次增加1）？如果是这样，你会如何去做这件事？感

0热度

1回答

Lua/Torch - 使用自定义数据集创建train.t7和test.t7文件时出错

我想将我自己的数据集提供给我创建的CNN模型。创建培训和测试.t7文件的代码上传here。我通过创建500个图像的train_set.t7和500个图像的test_set.t7来测试此代码。一切顺利，我能够将图像加载到CNN模型。然后我尝试从较大的数据集创建另一组.t7文件。我想解释一下数据集的组织。有一个名为data的ROOT文件夹（在代码中查找ROOT）。其中有两个子文件夹：train和te

1热度

1回答

Python培训和测试错误

虽然我想运行下面的代码的最后一位，但我得到一个错误，我无法弄清楚为什么。 import random combined_list = h_sub_text + s_sub_text print(len(combined_list)) random.shuffle(combined_list) training_part = int(len(combined_list) * .7) pr

0热度

1回答

斯坦福NLP培训documentpreprocessor

不斯坦福NLP提供的DocumentPreprocessor火车法语料库自己和句子分解创建自己的模型来训练？我与德国的句子工作，我需要创建句子拆分任务，我自己的德国模式。因此，我需要训练句子拆分器，DocumentPreprocessor。有没有办法做到这一点？

2热度

1回答

我已经实现了一个简单的人工神经网络，但没有得到所需的输出

代码有问题吗？还是需要包含更多输入数据记录并更改隐藏层数？我指的是这个tutorial（第4页） import cv2 import numpy as np ann = cv2.ml.ANN_MLP_create() ann.setTrainMethod(cv2.ml.ANN_MLP_RPROP | cv2.ml.ANN_MLP_UPDATE_WEIGHTS) ann.setActiva