2015-12-30 21 views
0

我想刮奖券的结果数据,但已经出现了两个问题。刮刮彩票数据直播 - 我可以找到合适的结果吗?我怎么能结合这么多来源?

我使用:

$a = file_get_contents('website.com/directory') 

将数据存储到一个数组,然后,使用的var_dump以输出结果。我的主要问题是,我没有找到任何网站提供多种渠道的彩票结果,这些渠道以各种方式进行安排。并且为每个彩票来源编写单独的功能似乎极其低效。加上所有的网站有不同的方式,他们的彩票结果正在上市

我知道我可能会收到很多票,但我真的不确定如何进行,这是我的最后一招,我可以预见很多由于将许多来源拼凑成一个数据库而产生的问题。我怎样才能确保数据的一致性?

我相信我不是唯一一个有这样的问题,从多个来源

刮我要对在错误的道路刮?任何指导将帮助我很多

+1

有许多站点/服务必须从多个来源中刮取/合并数据,然后清理数据以保持一致。对于您而言,您可能需要编写一些专门从不同站点上抓取的子刮板,并且可以根据您的目的处理将来自每个源的数据清理成统一格式的行为。 – birryree

回答

1

我做了一个快速的谷歌搜索,想出了一些我明白你的意思是他们不是很好。我确实找到了一个网站,虽然看起来相当容易刮。 https://www.hityah.com/lotto/

简单的彩票拥有自己的带有类拉托盒的div,而不是每个彩票的h3都是彩票的名称,所以你可以刮掉它,并且通过将彩票结果数字放在简单的类中也可以让它变得容易。

如果你去进一步地说https://www.hityah.com/lotto/mega-sena/就可以看到结果的大名单,他们甚至有存档的数据...

如果您需要的代码帮助不要犹豫,问!

+0

很有参考价值!如果只有其他网站会采取这种照顾!我将处理其他资源的个人需求,但现在将其作为我的主要来源! (我们仍在构建后端)。至于代码,我认为它会很好,只是反复试验,并组织成有意义的东西 –

+0

不用担心队友! –

1

如@birryree所述,您经常会遇到需要收集来自不同来源的信息的问题,这些问题都有不同的方法和方法来分享他们的数据。

我们也有面临同样问题的一个项目,我们做了以下内容:

我们将从不同的数据源来填充一个庞大的数据库。然后这些数据将从该导入数据库导入并合并到另一个数据库中,该数据库将包含所有数据源的一种模式中的所有信息。

然后,我们的网站从其中一个数据库中获取数据,其中来自其他来源的所有信息都合并在一起。

+0

感谢您的输入。这会发生吗?很显然,彩票结果中的时间延迟是一个主要因素。 你说“那些数据将被导入并合并......”这是否意味着你手动完成了? –

+1

@DannyMahoney不,它完全自动运行。 “合并”,因为可能有多个数据源用于同一条目。它完全运行在多个服务器脚本和cronjob上,它的体系结构非常复杂。但是,这是如何完成的。 – KhorneHoly

+0

令人印象深刻!绝对是我将要努力的方向(小步骤)。感谢您的帮助 –