2014-09-01 31 views
-1

我有一个网球比赛列表,其中包括时间,场地,表面,赢家/输家的排名,赢家/输家的比赛等信息。我打算用这些信息训练一个MLP网络(使用PyBrain)并将其映射到单个输出 - 如果第一个玩家是赢家,则为1.0,否则为0.0。目标是预测未来的匹配(其中一些输入未定义)。网球比赛人工神经网络的输入表示

每个玩家都由一个整数标识。有超过100名球员。我想知道我是否可以用这些整数直接表示球员,如果我应该使用小数(即除以100)还是我应该使用二进制表示?这很重要吗?

回答

1

我不太确定球员号码是如何表示的。

我假设神经网络将在时间,场地,表面,排名等方面接受培训,而不是玩家号码,所以玩家ID很可能独立于算法。

这听起来像你有一个数据结构,其中包含的球员和他们的历史业绩和排名,以及比赛时间表。所以玩家和时间表信息很可能会作为神经网络的参数输入,但是玩家ID将是一个管理评估过程的外部参数。如果这是真的,那么这是如何实现取决于你的评估算法,而不是神经网络。

+0

谢谢。我认为玩家ID可能会影响结果,通过让网络代表哪些玩家早先击败了谁。但也许这不是一个好主意,我应该只使用比赛统计数据 - 看起来就像在类似场景中完成的那样。 – 2014-09-02 22:13:21