0
我有从多个PCAP文件获取的请求的数据集,并已将这些PCAP文件加载到R.每个PCAP文件有效地引用单个观察(行)。令牌化SQL注入字符串
在这个数据集中有一个“请求”列,它给出了一个关于源请求的字符串。例如,请求可能会显示为:
http://111.22.33.1/ilove/usingR/extraextra/sqli/?id='or1=1--
我想标记每个请求字符串以便在其上运行一些机器学习算法。对这些字符串进行标记的最好方法是什么,以便对其进行一些分析?我知道存在诸如tm
这样的软件包,但对它们没有什么经验。
看一下'urltools'包,如果解析工具有任何不足,请让我知道您需要增强哪些内容。 – hrbrmstr
你能给出更实际的输入和输出吗? –