1
许多技术可以用于检测特定语言的垃圾邮件,如果采用了适当的技术,它可以使系统能够检测多种语言的垃圾邮件,但这需要一个文本在一个具体语言。多语言文本垃圾邮件检测
所以我的问题是如何检测由多种语言组成的文本?这不仅仅关于语言检测。我想知道一些做多语言文本垃圾邮件检测的最佳做法。
许多技术可以用于检测特定语言的垃圾邮件,如果采用了适当的技术,它可以使系统能够检测多种语言的垃圾邮件,但这需要一个文本在一个具体语言。多语言文本垃圾邮件检测
所以我的问题是如何检测由多种语言组成的文本?这不仅仅关于语言检测。我想知道一些做多语言文本垃圾邮件检测的最佳做法。
一个天真的解决方案仍然使用翻译API按照语言将文本分割成片段。然后通过语言对文本片段进行分类。
这是一个直截了当的解决方案,但由于经常调用翻译API,所以我担心性能。
我想知道大公司或一些优秀的项目如何处理这个问题?