即时通讯新的python,我想在txt文件中做一些搜索字符串。 我一直在使用TwitterSearch API Twitter抓取一些推文,然后将其导出到txt文件中。 在我的txt文件,它有一些这样的句子:Python - 在文本文件中搜索字符串
1|@tephen_ian|@mypreviana ya yg tabrakan maut itu lo... Antara KA 225 sama 220 thn 1987 itu... Yg bintaro 2 itu td pagi|None
2|@adibnurazis|Warga Jakarta korban tabrakan Bintaro ditanggung Pemprov DKI http://t.co/joKjmTKc0S http://t.co/8ebRc8AjzK|None
3|@randhika1991|Turut brduka cita utk Tabrakan KRL vs Truk LPG di Bintaro. Smg Amal Ibadah Korban yg mninggal ditrima oleh Tuhan YME, Aamiin... :(@KAI121|None
4|@ErhamORI|#Bagas Korban KRL vs Truk BBM: Tewas 5 Orang, Luka Berat 9, Luka Ringan 82: Kecelakaan tabrakan KRL dengan tru... http://t.co/a0lmnWQ0TQ|None
5|@appsari|@rararararatri iya. Ada tabrakan KRL jurusan serpong-tanah abang, nabrak truk solar, trs kebakar. Bnyk korban jiwanya..|None
,并从txt文件,我想搜索包含像“tabrakan”,“二”,“安塔拉”几个字/查询一些句子, 'tewas','luka','selamat',然后打印包含该单词的句子。
到目前为止,香港专业教育学院这样做:
#!/usr/bin/python
data = open("dataset.txt", "r")
for line in data:
line_split = line.rstrip("\n").split("|")
if line_split[2] == 'tabrakan' 'di' 'antara' 'tewas' 'luka' 'selamat':
print(line_split[0])
,并没有任何结果。
我做错了吗? 希望有人可以帮助,造成即时通讯使用做嗖或任何文本分类:( 我,如果即时通讯在我的抓取数据集中使用印尼对不起尝试。
的[搜索字符串可能重复在txt文件中Python](http://stackoverflow.com/questions/4940032/search-for-string-in-txt-file-python) – guisantogui
尝试打印''tabrakan''di''antara''tewas'' luka''selamat'',看看它实际上等于什么。 –
@guisantogui:这与手头的实际问题有什么关系? –