catboost

    0热度

    2回答

    我对随机森林有疑问。想象一下,我有关于用户与物品交互的数据。项目数量很大,大约为10 000个。我的随机森林输出应该是用户可能与之交互的项目(如推荐系统)。对于任何用户,我想使用描述用户过去已与之进行交互的项目的功能。但是,将分类产品功能映射为单热编码看起来效率非常低,因为用户最多只能与几百个项目进行交互,有时甚至可能只有5个。 您将如何去关于构建一个随机森林时,其中一个输入要素是一个具有〜100

    0热度

    1回答

    我想知道如何配置catboost进行排名任务。 catboost主页暗示它可以用于排名任务。然而,似乎文档排名的任务是稀缺: https://tech.yandex.com/catboost/doc/dg/concepts/cli-reference_train-model-docpage/ 和所有的教程都集中在个别情况进行分类: https://github.com/catboost/catbo

    1热度

    2回答

    如果我理解正确catboost,我们需要调整nrounds就像在xgboost,使用CV。我看到在official tutorial在文献[8] params_with_od <- list(iterations = 500, loss_function = 'Logloss', train_dir = 'train_dir', od_t

    0热度

    1回答

    我声明一个CD文件读取它: pool = Pool(features_file, CDfile) 凡CDfile包含文本和< \ T>分隔符: 0 Target 1 Categ cat_reg 97 Categ cat_dow 98 Categ cat_nweek 99 Categ cat_month 100 Categ cat_hour 101 Categ cat_is_month_

    0热度

    1回答

    我想了解catboost过度检测器。在此描述: https://tech.yandex.com/catboost/doc/dg/concepts/overfitting-detector-docpage/#overfitting-detector 另外一种梯度增强包,比如lightgbm和xgboost使用一个名为early_stopping_rounds参数,这是很容易理解(它停止训练,一旦验证

    1热度

    1回答

    是否有像catboost包中的“scale_pos_weight”参数,因为我们曾经在python的xgboost包中有?

    0热度

    1回答

    我有一个热点编码的标签。我想用它们来训练和预测一个catboost分类器。然而,当我合适时,它给我一个错误,说标签每行不允许有多个整数值。那么catboost不允许对标签进行单热编码?如果没有,我怎样才能让catboost工作?

    1热度

    1回答

    我试图在Windows上安装CatBoost R包,但没有成功。我已经通过了所有的指示和stackoverflow的帖子。 我到目前为止管理的是安装python以及VC++组件。 我可以编译软件包,但是在安装时出现错误“TypeError:resolve_system_cxx()需要正好4个参数(给出3)”。我正在通过CatBoost存储库进行搜索,但无法识别该函数的源文件。你能进一步帮助我吗?

    3热度

    1回答

    我基于this article 试图CatBoost在它的代码,CatBoost在model.fit()plot,所以我想尝试一下我的IPython。 这里是我的CatBoost代码: from catboost import CatBoostRegressor # indicate categorical features for CatBoost categorical_features

    2热度

    1回答

    我想找到使用Catboost进行分类的最佳参数。 我有训练数据和测试数据。我想运行500次迭代的算法,然后对测试数据进行预测。接下来,我想重复600次迭代,然后700次迭代,等等。我不想从第0次迭代开始。那么,有没有什么办法可以在Catboost算法中做到这一点? 任何帮助,高度赞赏!