我有两组数据需要加入,但由于数据质量并不好,所以存在一个额外的问题。SSIS不匹配加入
这两个数据集是呼叫(电话)和通信(关于电话呼叫创建的记录)。它们分别具有名为call_id和comm_id的ID。通信记录还具有用于执行加入的call_id。问题在于数据收集系统无法正常工作,并且我有大量的通信无法与特定的通话匹配。并非所有的通话都会产生通信。
对于每一天我需要创建一个联合列表来执行一些分析。 的问题是,由于缺少某些环节,我得到3种不同的行类型:
- 只是调用,
- 只是通讯科,
- 链接通讯和呼叫。
我想要做的是每一行是给定日期的“Just Comm”行,我应该删除同一日期的“Just Call”行。我不需要任何来自通话的值,我只需要知道通话发生了。如果我这样做,我会得到正确的行数,因为所有的“只是通信”将删除一个“只是调用”行,就我所需要知道的是创建通信的调用。
我的问题是如何在SSIS中做到这一点。我已经到了拥有我的数据集的地步,其中包含我需要的所有数据,并且是我上面提到的3行类型的混合。您如何建议我通过删除“Just Call”行的过程?
这不会解决我的问题,因为我需要知道每天在哪里有多少个电话。这个解决方案会让我失去所有无法比拟的通话。 – 2009-04-22 11:00:21
然后,您需要准确定义您需要的数据和哪些数据。最好提供一个显示情况和所需输出的小例子。 – Tomalak 2009-04-22 12:42:12