catboost

0热度

2回答

我对随机森林有疑问。想象一下，我有关于用户与物品交互的数据。项目数量很大，大约为10 000个。我的随机森林输出应该是用户可能与之交互的项目（如推荐系统）。对于任何用户，我想使用描述用户过去已与之进行交互的项目的功能。但是，将分类产品功能映射为单热编码看起来效率非常低，因为用户最多只能与几百个项目进行交互，有时甚至可能只有5个。您将如何去关于构建一个随机森林时，其中一个输入要素是一个具有〜100

0热度

1回答

使用catboost进行排序任务

我想知道如何配置catboost进行排名任务。 catboost主页暗示它可以用于排名任务。然而，似乎文档排名的任务是稀缺： https://tech.yandex.com/catboost/doc/dg/concepts/cli-reference_train-model-docpage/ 和所有的教程都集中在个别情况进行分类： https://github.com/catboost/catbo

1热度

2回答

如何使用`catboost`选择nrounds？

如果我理解正确catboost，我们需要调整nrounds就像在xgboost，使用CV。我看到在official tutorial在文献[8] params_with_od <- list(iterations = 500, loss_function = 'Logloss', train_dir = 'train_dir', od_t

0热度

1回答

如何创建列描述（CD）文件Catboost

我声明一个CD文件读取它： pool = Pool(features_file, CDfile) 凡CDfile包含文本和< \ T>分隔符： 0 Target 1 Categ cat_reg 97 Categ cat_dow 98 Categ cat_nweek 99 Categ cat_month 100 Categ cat_hour 101 Categ cat_is_month_

0热度

1回答

如何使用catboost overfitting检测器

我想了解catboost过度检测器。在此描述： https://tech.yandex.com/catboost/doc/dg/concepts/overfitting-detector-docpage/#overfitting-detector 另外一种梯度增强包，比如lightgbm和xgboost使用一个名为early_stopping_rounds参数，这是很容易理解（它停止训练，一旦验证

1热度

1回答

for cat平衡数据处理猫提高

是否有像catboost包中的“scale_pos_weight”参数，因为我们曾经在python的xgboost包中有？

0热度

1回答

Catboost是否支持单热编码？

我有一个热点编码的标签。我想用它们来训练和预测一个catboost分类器。然而，当我合适时，它给我一个错误，说标签每行不允许有多个整数值。那么catboost不允许对标签进行单热编码？如果没有，我怎样才能让catboost工作？

1热度

1回答

在Windows上安装CatBoost R包时出错

我试图在Windows上安装CatBoost R包，但没有成功。我已经通过了所有的指示和stackoverflow的帖子。我到目前为止管理的是安装python以及VC++组件。我可以编译软件包，但是在安装时出现错误“TypeError：resolve_system_cxx（）需要正好4个参数（给出3）”。我正在通过CatBoost存储库进行搜索，但无法识别该函数的源文件。你能进一步帮助我吗？

3热度

1回答

IPython的导入错误：无法导入名称布局

我基于this article 试图CatBoost在它的代码，CatBoost在model.fit()plot，所以我想尝试一下我的IPython。这里是我的CatBoost代码： from catboost import CatBoostRegressor # indicate categorical features for CatBoost categorical_features

2热度

1回答

使用之前训练过的模型在catboost中进一步预测

我想找到使用Catboost进行分类的最佳参数。我有训练数据和测试数据。我想运行500次迭代的算法，然后对测试数据进行预测。接下来，我想重复600次迭代，然后700次迭代，等等。我不想从第0次迭代开始。那么，有没有什么办法可以在Catboost算法中做到这一点？任何帮助，高度赞赏！