2017-06-01 62 views
0

我正在尝试使用OpsCenter 6.1安装新集群。 OpsCenter中成功SSH的每一个集群中的节点,然后出现几乎立即错误出在每个节点上,出现以下消息:Datastax OpsCenter在检索package_information时安装集群错误:400客户端错误

400 Client Error: Bad Request for url: http://<opscenter>:8888/api/v1/lcm/internal/nodes/<node-id>/package_information 

当试图达到这一页自己,我收到一个404错误此消息:

{"brief": "error", "message": "{\"type\":\"ApiException\",\"code\":404,\"msg\":\"Can't find object for given parameters: {:job-id nil, :node-id \\\"<node-id>\\\"}\"}", "type": "NoSuchResource"} 

注意<的OpsCenter >(上图)是我本地的IP地址,安装和<节点ID >是节点的ID。

考虑到我自己没有收到400错误,我假设我无法复制安装期间发生的情况,因为某些已执行的回滚步骤。

任何洞察什么可能会导致此问题?

在此先感谢!

+0

更多信息 - 我可以手动导航到http://172.23.1.1:8888/api/v1/lcm/nodes/8b7fd5dd-0045-44fb-b019-20c5565f297a并获取有关节点的信息,但是http://172.23.1.1:8888/api/v1/lcm/internal/nodes/8b7fd5dd-0045-44fb-b019-20c5565f297a/package_information没有提供任何内容。就我所见,“内部”资源未在OpsCenter API文档中定义。 – theoneandonly2

回答

0

LCM开发人员在这里...根据所提供的信息很难确切地知道什么是错的。但这里有一些提示:

  1. 如果有一个工作期间的API错误,该错误将被记录在opscenterd.log(通常在/ var /日志/ OpsCenter中的软件包安装,或者像./log /在tarball中安装)。
  2. 内部API是私人的,没有公开记录。它通过每个节点的秘密标记进行身份验证,该标记只在作业的整个生命周期中有效,所以尝试手动ping内部URL非常具有挑战性,我们从不需要有人尝试ping内部API来成功诊断问题。过去。这不是我推荐花费大量时间的东西。
  3. 通过将“lcm”记录器转到opscenter的logback.xml中进行调试并重新启动opscenterd,您可能会得到更多关于LCM正在执行的上下文。
+0

添加了DEBUG选项并查看/var/logs/opscenter/opscenterd.log。它看起来好像在两个节点向opscenter报告“上传事实到OpsCenter服务器”的里程碑之后发生故障。接下来,我收到消息“不使用代理”的子类型“package-proxy”的作业事件。接下来显示一条消息“将WILL_FAIL发送到作业状态通道以进行作业......”。最后,我收到来自两个节点的错误消息:“400客户端错误:URL请求错误:http://172.23.100.37:8888/api/v1/lcm/internal/nodes/8b7fd5dd-0045-44fb-b019-20c5565f297a/package_information”。有任何想法吗? – theoneandonly2

+0

我很惊讶在WILL_FAIL之前没有更清楚的东西(或作为WILL_FAIL消息的一部分)。我的spidey感觉告诉我,你的网络有些奇怪。发送事实可能是目标节点第一次尝试向LCM服务器“回电”。您确定没有防火墙或代理阻止您的目标节点访问172.23.100.27:8888吗?就像你可以从目标节点“curl http://172.23.100:8888/api/v1/lcm /'?如果没有,那就是你的问题,你需要整理你的网络问题以便进行沟通。 –

+0

如果不这样做,很可能我无法在此论坛中为您提供帮助。如果您有权访问DataStax支持,请联系他们,如果他们能够将您排除在外,他​​们可以将您升级为我在呼叫中一起进行故障排除。如果你在启动程序或其他什么东西,ping任何你的销售/任何联系人,并告诉他们你需要帮助...即使你没有正式的支持,我们会尽力让你分类。 –