我有一句话'现在对于完全不同的东西'。我想标记它,标记并将其存储到Excel文件中以供进一步处理。
<pre>sent = "And now for something completely different" words = nltk.word_tokenize(sent) tags = nltk.pos_tag() print tags</pre>
在Excel中写一个清单
上面的结果是带有嵌套列表格式的标签的单词。
[('And', 'CC'), ('now', 'RB'), ('for', 'IN'), ('something', 'NN'), ('completely', 'RB'), ('different', 'JJ')]
我想这个结果列表存储到一个Excel文件,在一列文字和标签其他。
我试着通过下面的代码来实现上述目的。
fd = open("output.txt",'w')
i=0
for words in tags:
for word in words:
i+=1
fd.write(word)
if i==1:
fd.write('\t')
fd.write('\n')
i=0
上述代码将字和标签完美地写入输出文件。如果我使用shutil方法从文本文件复制到excel格式,它将完美执行。当我尝试阅读转换时出现问题。我收到以下错误。
XLRDError: Unsupported format, or currupt file: Expected BOF record; founf 'And\tCC\n'
谁能告诉我,我该怎么写标记列表输出文件,这样我上面的错误能解决吗?
如何使用shutil从文本复制到excel格式?你知道excel格式不只是文件扩展名(.xlsx)。这意味着文件的内容应该以特殊的方式组织起来,以便Excel应用程序知道如何阅读它。一般来说,您可以使用[xlsxWriter](https://pypi.python.org/pypi/XlsxWriter)模块,也可以使用[CSV]编写文件(https://en.wikipedia.org/wiki/Comma-separated_values )格式,然后在Excel中导入它。 –