我正在写函数,试图从Resume中提取用户名。在嵌套循环中检查字符串存在
大部分时间第一行包含用户名,但有时候我的学生还会在第一行写上简历,简历标题。所以我想忽略这条线并检查下一行。
如果在没有前四线的简历中跳过的话行中出现,再考虑它作为一个人的名字
def name_extractor(self, text):
skip_words = ['CURRICULUM', 'VITAE', 'resume']
text_lines = text.split('\n')
name = ''
# pdb.set_trace()
for i in range(0,4):
if text_lines[i]:
for word in skip_words:
if word.lower() in text_lines[i]:
break
else:
name = text.split('\n')[i]
# print name
return name
return name
在这里,我试着写的逻辑,但它不能正常工作。如果有第一行作为简历,即使它的名称为简历。
如何跳过任何具有skip_list中的单词的开始行并打印正确的名称。
我欣赏这方面的任何帮助。
你的问题是? –
@CarlosMonroyNieblas:对不起,更新了这个问题。请让我知道,如果仍然不清楚 – honeyboney
你正在搜索名称的文件的例子,将有助于生产更好的代码! –