2013-07-16 67 views
0

我有一个包含与我们合作的所有供应商的升学率的数据集。我需要将这些数据分成四分位数,以便每个提供商可以看到他们的费率与其他提供商相比较。率在7%到89%之间。任何人都可以建议我如何做到这一点?我不确定这是否是问这个问题的正确的地方,但如果有人能够帮助我,我会非常感激。将数据分成四分位数

另一个问题是,如果提供者的数字非常小,例如:2/4 = 50%,则提供者可能会陷入更差的四分位数,但这并不意味着提供者的表现不好,因为数字太小。我希望这是有道理的。请让我知道,如果我可以进一步澄清。

回答

0

首先关注:对于小ñ,不使用四分。 n是否小是任意的。

0

有办法获得位数没有做一个完整的排序,但除非你有大量的数据,没有点在执行这些算法,如果你还没有得到他们提供。假设你有一个sort()功能,所有你需要做的是:

  1. 鉴于ň数据点。
  2. 排序的数据点。
  3. 查找排序的数据n/4n/23*n/4个百分点,这是你的分位数。

正如你所说,如果ñ小于一定数量(即你必须为你自己决定),你可能想说的是,四分之一的结果是“不适用”或一些这样的。

+1

排序数据*上升*,否则解释是没有意义的。 – Jefftopia

+0

谢谢大家的回应。我会尝试你的建议。 @Jefftopia - 如果一个小的n不应该被认为是四分位数,那么一个小的n会在哪里呢? – datacentric

+0

我认为你的问题的答案取决于你想完成什么。一般来说,我建议不要使用四分位数,因为它们不能最好地捕获关于数字分布的重要信息。对于小'n',我想我会在@ Simon的帖子中的第2步中停止。 – Jefftopia