我想从网站用户那里收集某种地理信息 - 对于给定的一组数据,他们将标记复选框,指示地点是否已经给予属性。是否有任何工具/框架基于整个收集的数据集(可能还有其他信息)来检测欺诈或垃圾邮件提交?我想获得过滤,更可靠的数据。众包可靠性测量 - 垃圾邮件/欺诈检测
1
A
回答
2
不知道如果这是你要求什么,但这里有使用Amazon土耳其人从我的经验的一些技巧:
有几个学术论文处理这样的问题。 here是一个不错的选择。 此外,根据以下一般建议,我创建了一个处理我的数据的自定义过程:
a。包括一个未解决的问题,并过滤掉未被回答的情况。自动回答这样的问题很难,对于欺诈者来说,这也可能更加耗时,因而不太吸引人。
b。如果可能的话,不要使用二进制标度(即复选框),而要使用一些等级(例如1-4或1-6)。这会给你更多的数据。
℃。如果可用,请过滤掉填写表单所用时间太短的情况。 (尤其有用的,如果你包括那个未解决的问题)
d。如果您有多个用户输入,请检查重复答案,以及始终如一地给出远超平均答案的用户。 如果每个用户只提交一个“表单”,请考虑在其中放置多个单元/问题,以便每个用户获得多个提交。
e。如果您每个用户或用户标识只有一个提交,则您的选项更受限制。如果您有足够的数据,我可以建议过滤outliars(例如数据点远离平均值3个标准偏差)。
f。在所有过滤之后,检查数据中的一致或不一致(例如,通过检查数据点的多少比例落在平均值的x个标准偏差范围内)。在达成一致的情况下,使用平均值;如果不同意,请收集更多数据。
希望它能帮助,
+0
我在考虑自定义数据收集和过滤(不使用MTurk),但所有建议也非常有价值,谢谢! – tomash
相关问题
- 1. 垃圾邮件检测网站
- 2. 使用imap php检测垃圾邮件
- 3. Swiftmailer垃圾邮件测试
- 4. python:数据清理 - 检测欺诈性电子邮件地址的模式
- 5. 垃圾邮件检测/ Java中的垃圾邮件过滤系统
- 6. 敲击检测垃圾值
- 7. Android - 检测垃圾收集
- 8. 可以贝叶斯网络检测垃圾邮件没有垃圾邮件训练集
- 9. 在单元测试中检测垃圾
- 10. 垃圾邮件与垃圾邮件
- 11. VSCode不自动检测垃圾文件
- 12. 垃圾邮件检查,垃圾邮件得分如何?
- 13. 检查txn_id防止欺诈
- 14. 如何检测代理/垃圾邮件访问者?
- 15. 如何使用Perl检测俄罗斯垃圾邮件?
- 16. 垃圾邮件检测服务的最佳语言选择
- 17. 多语言文本垃圾邮件检测
- 18. Android垃圾邮件检测应用程序?
- 19. 关于精确度和垃圾邮件检测的混淆
- 20. 垃圾邮件检测器的输入数据
- 21. php mail()函数检测为垃圾邮件
- 22. Python - 在字符串中检测(垃圾邮件)URLS
- 23. 使用朴素贝叶斯检测垃圾邮件
- 24. 如何触发Mollom检测表单提交为垃圾邮件?
- 25. 垃圾邮件
- 26. Zend应用程序和点击欺诈检测
- 27. neo4j欺诈检测 - 高效的数据结构
- 28. 系统设计:防止/检测投票欺诈
- 29. 如何检测垃圾邮件形式的垃圾邮件并记录IP和输入?
有现有的众包工具,如亚马逊的Mechanical Turk(大多数,顺便说一句,是不免费的)一些服务/工具/框架。你对此感兴趣吗?或者你想自己做点什么? – etov
@etov - 我认为从收集投票中提取“真相”假设欺诈投票是次要的,并且可以进行统计上的区分 – tomash