training-data

    0热度

    1回答

    我目前正在尝试使用卫星图像来识别苹果园。我在每个班级的代表性数据数量方面面临一个小问题。 其实我的问题是: 是否有可能在每个时期采取随机一些不同的图像,在我的“非苹果”类,因为我有更多的论文(与“苹果”一),我想增加我的网络将分类出一个不具代表性的图像的概率。 在此先感谢您的帮助

    0热度

    2回答

    我有一个数据集,包含来自A类的50%实例和B类的50%实例。我想将我的数据集分成一个训练集和一个测试集。我知道RemovePercentage过滤器存在,但它不关心类平衡。我如何从我的数据集中删除35%,但仍然保持训练集中的50/50类分布?

    3热度

    2回答

    我有一个包含约14,700条记录的数据集。我希望在ibm watson上进行培训,目前我正在试用版。关于分类器需要训练的时间的粗略估计是什么?数据集的每条记录都包含一个句子,第二列包含类名。

    0热度

    1回答

    我正在使用隐马尔可夫模型为N示例句子构建一个文本系统的语音以进行重新估计。在神经网络的背景下,我了解时代的概念是指完整的训练周期。我认为这意味着“将相同的数据提供给相同的,更新的网络,每次都有不同的权重和偏见” - 纠正我,如果我错了。 同样的逻辑工作,同时执行从相同的句子重新估计(即训练)HMMs?换句话说,如果我有N个句子,我可以重复输入样本10次,以产生10 * N样本。这是否意味着我正在执

    1热度

    1回答

    我使用下面的代码来保存随机森林模型。我正在使用cPickle来保存训练有素的模型。当我看到新的数据时,我可以逐渐地训练模型。 目前,列车集有大约2年的数据。有没有一种方法可以在另外两年的时间里进行训练,并且(种类)将其附加到现有的已保存模型上。 rf = RandomForestRegressor(n_estimators=100) print ("Trying to fit the Rando

    0热度

    1回答

    我目前正试图使用​​通过Keras实现的夏季项目的“简单”LSTM网络。查看给出的示例代码,看起来LSTM代码需要预先生成的3D numpy数组。由于我想使用的数据集和相关的时间间隔都很大,因此我一次加载一个“完整数组”是非常令人望而却步的。是否有可能加载原始数据集并根据网络的需要对其应用排序转换(在这种情况下,从x个时间间隔窗口构建3D数组,然后每次增加1)?如果是这样,你会如何去做这件事? 感

    0热度

    1回答

    我想将我自己的数据集提供给我创建的CNN模型。创建培训和测试.t7文件的代码上传here。 我通过创建500个图像的train_set.t7和500个图像的test_set.t7来测试此代码。一切顺利,我能够将图像加载到CNN模型。然后我尝试从较大的数据集创建另一组.t7文件。我想解释一下数据集的组织。有一个名为data的ROOT文件夹(在代码中查找ROOT)。其中有两个子文件夹:train和te

    1热度

    1回答

    虽然我想运行下面的代码的最后一位,但我得到一个错误,我无法弄清楚为什么。 import random combined_list = h_sub_text + s_sub_text print(len(combined_list)) random.shuffle(combined_list) training_part = int(len(combined_list) * .7) pr

    0热度

    1回答

    不斯坦福NLP提供的DocumentPreprocessor火车法语料库自己和句子分解创建自己的模型来训练? 我与德国的句子工作,我需要创建句子拆分任务,我自己的德国模式。因此,我需要训练句子拆分器,DocumentPreprocessor。 有没有办法做到这一点?

    2热度

    1回答

    代码有问题吗?还是需要包含更多输入数据记录并更改隐藏层数?我指的是这个tutorial(第4页) import cv2 import numpy as np ann = cv2.ml.ANN_MLP_create() ann.setTrainMethod(cv2.ml.ANN_MLP_RPROP | cv2.ml.ANN_MLP_UPDATE_WEIGHTS) ann.setActiva