下面是一个代码,我试图从文件夹(测试器)中获取文件的内容,该文件夹中有一些文本文件。之后,我必须从文本文件中出现的所有单词中作出字典。我得到的字(字符串),但他们重复,我不得不删除重复的话。删除阵列/阵列列表中的重复字符串
实施例:
文件1 - John is coding
和file2 - John is really not coding
。
所以我想要的输出是 - John is coding really not
,即不重复。
此外,我必须制作所有单词和它所在的相应文本文件的矩阵(就像索引器一样)。 例子:
file1 file2
John 1 1
is 1 1
coding 1 1
really 0 1
not 0 1
任何帮助将非常感激,我坚持。
public static void main(String[] args) throws IOException {
File folder = new File("/home/gaurav/Tester");
File[] listOfFiles = folder.listFiles();
ArrayList<String> array = new ArrayList<String>();
for (int i = 0; i < listOfFiles.length; i++) {
File file = listOfFiles[i];
if (file.isFile() && file.getName().endsWith(".txt")) {
String content = FileUtils.readFileToString(file);
String[] a = content.split(" ");
for (String s : a) {
if (!array.contains(a)) {
array.add(s);
}
}
}
}
for (int j = 0; j < array.size(); j++) {
System.out.print(array.get(j));
}
}
“s.trim()” 工作长官......非常感谢。 –