training-data

    2热度

    1回答

    我想将一个火花数据帧转换为标记点。 数据框被命名为DF,看起来像: +-----+-----+-----+-----+-----+-----+-----+-----+-----+------+-----+ |step1|step2|step3|step4|step5|step6|step7|step8|step9|step10|class| +-----+-----+-----+-----+-

    0热度

    1回答

    我正在开发一个项目,我试图微调VGG-FACE模型的最后一层。 但每次当我尝试做装修阶段我已经得到了同样的错误: Traceback (most recent call last): File "freeze_2.py", line 258, in <module> model=entrenamos_modelo('vggface_weights_tensorflow.h5')

    0热度

    1回答

    我在Windows 8上编译tesseract 3.04源代码并编译成功,不包括培训工具。 要构建培训工具,我花了很多时间来搜索这些额外的库,但找不到它们的窗口顶点。 这些库有: libicu-dev,libpango1.0-dev,libcairo2-dev。 (https://github.com/tesseract-ocr/tesseract/wiki/TrainingTesseract)

    -1热度

    2回答

    我有一个数据集,有大约4年的历史数据与每周季节性。我已经开始将最近1年作为训练数据集,并预测了大约30个数据点。但是,在某些情况下将训练数据集缩短到6个月会给我提供更好的预测值。 在线阅读,k倍交叉验证似乎是一种识别正确体积的训练数据集的技术。 我正确吗? 一般来说,任何人都可以推荐有效的方法来选择适量的训练数据集吗? 感谢帮助!

    1热度

    2回答

    我有大约3000个对象,其中每个对象都有一个与它相关的计数。我想随机将这些对象分成70%的培训和30%的测试分组。但是,我想根据与每个对象关联的计数来划分它们,但不是基于对象的数量。 一个例子,假设我的数据集包含5个对象。 Obj 1 => 200 Obj 2 => 30 Obj 3 => 40 Obj 4 => 20 Obj 5 => 110 如果我他们有近70%-30%的比例分成,

    0热度

    1回答

    我的自定义语言模型出现培训错误。 我加了< 30K字。我验证的OOV字计数 - { “语料库”:[{ “out_of_vocabulary_words”:73, “total_words”:5034, “名”: “ABC”, “状态”: “分析” }]} 卷曲-X GET -u “名为myUsername”: “输入mypassword” “https://stream.watsonplatfor

    0热度

    1回答

    我很难理解Wit.ai中的意图部分。当我进入应用程序内部的理解选项卡时,它会将我的意图显示为用户定义的实体。 我们是否需要创建意图作为用户实体,还是需要将意图创建为单独的内部实体。就在今天,当我经历了HTTP API,他们第一次带我到的版本20141022 的文档,然后到版本20160526在15分钟的事(这意味着他们不能与HTTP API版本稳定?)。在旧版本中,我发现发布意图有一个单独的API

    2热度

    1回答

    我在IBM Bluemix上使用了Visual Recognition服务。 我已经创造了一些分类,特别是其中的两个与这一目标: 第一:具有“通用”分类图像中恢复的信心分数有关识别特定对象的。我已经用对象的50个正面例子和50个与对象类似的东西(它的细节,它的组件,图像等等)进行了训练。 秒:一个更具体的分类器,如果第一分类的分数相当高,则识别之前识别的对象的特定类型。这个新的分类器已经被训练为第

    0热度

    1回答

    我设置了一个朴素贝叶斯分类器,试图确定两个五个字符串属性记录之间的相同性。我只准确地比较每对属性(即,使用java .equals()方法)。我有一些训练数据,包括TRUE和FALSE情况,但现在我们只关注TRUE情况。 假设有一些TRUE培训案例,所有五个属性都不相同。这意味着每个比较器都会失败,但是经过一些人类评估后,记录实际上被确定为“相同”。 这个训练案例应该输入朴素贝叶斯分类器吗?一方面

    1热度

    1回答

    我只是从caffe切换到tensorflow。我在tensorflow中有这个最初的例子,它没有批处理。我将使用小批量,但我卡住了。它似乎需要批处理,队列和坐标。我不知道如何使用它们。 我很感激,如果你能在我的代码怎么用配料解释我, import tensorflow as tf import numpy as np import scipy.io as sio import h5py