我如何从Socrata API获得随机数据？

我如何从Socrata API获得随机数据样本？也就是说，我试图获得https://health.data.ny.gov/resource/s8d9-z734.json，但是现在不想整个下载它，因为它非常大。我如何从Socrata API获得随机数据？

来源

2016-07-25 avj

对于性能和缓存的原因（想象一堆客户反复调用$order=rand()的影响......），我们没有任何种类的rand()或采样功能，但你可以创建自己的样本集与工作一点点：

执行$select=count(*)查询，以确定该组有多大
使用rand()本地拿出一些偏移
使用$limit和$offset连同一个稳定的$order挑选出个人记录。例如：$order=facility_id&$limit=1&$offset=<some rand() number>

不幸的是，要获得1000的样本大小，将需要1001次API调用。请确保您注册了app token ...

来源

2016-07-25 18:19:48 chrismetcalf

上看为可能像随机种子进行处理，如按字母顺序排序total_charges一个字段（即，https://health.data.ny.gov/resource/s8d9-z734.json随机抽样？$极限= 1000 & $顺序= total_charges & $偏移= 10000），但事实证明Socrata知道这是一个数字字段，尽管在JSON中将它作为字符串返回并对其进行了数字排序。更明亮的想法，任何人？随机抽样是开放数据中的一个重要问题:-)

来源

2016-07-25 13:12:10

我如何从Socrata API获得随机数据？

回答

相关问题