2016-07-25 49 views

回答

2

对于性能和缓存的原因(想象一堆客户反复调用$order=rand()的影响......),我们没有任何种类的rand()或采样功能,但你可以创建自己的样本集与工作一点点:

  1. 执行$select=count(*)查询,以确定该组有多大
  2. 使用rand()本地拿出一些偏移
  3. 使用$limit$offset连同一个稳定的$order挑选出个人记录。例如:$order=facility_id&$limit=1&$offset=<some rand() number>

不幸的是,要获得1000的样本大小,将需要1001次API调用。请确保您注册了app token ...

0

上看为可能像随机种子进行处理,如按字母顺序排序total_charges一个字段(即,https://health.data.ny.gov/resource/s8d9-z734.json随机抽样?$极限= 1000 & $顺序= total_charges & $偏移= 10000),但事实证明Socrata知道这是一个数字字段,尽管在JSON中将它作为字符串返回并对其进行了数字排序。更明亮的想法,任何人?随机抽样是开放数据中的一个重要问题:-)

相关问题