问题是,我必须扫描可执行文件并找出要分析的字符串,请使用sysinternals中的strings.exe。但是,如何区分有意义的字符串和不重要的字符串,有没有解决这个问题的算法或思想(统计概率?)。是否有任何算法来判断一个字符串是否有意义
例如:从strings.exe 提取字符串(所有的字符串的一部分)
S`A
waA
RmA
>rA
5xA
GetModuleHandleA
LocalFree
LoadLibraryA
LocalAlloc
GetCommandLineW
从经验判断,最后五个串是有意义的,并且所述第一5份的有不。 那么如何解决这个问题,不要使用黑名单或白名单等字典。
或使用一些字典中的字母 – Andrey 2011-04-19 09:25:25
坏正gramms至少在这个例子中, 'strings -n4'也可以用来区分。更复杂的是,您可以填充一个digram或trigram表并选择更接近英语digram或trigram表的单词。 – sarnold 2011-04-19 09:26:06