下面是我的数据框的样子,你会看到我的一个dataframe列是URL,其他的是timestamp count。当我运行此代码时:busiest_hosts[busiest_hosts['host'].str.contains('***.novo.dk')==True]我收到错误:error: nothing to repeat at position 0。我认为这是因为我的网址的第一个元素是*。它
我是一个绝对的Python初学者。我正在对希腊语剧本进行文本分析并计算每个单词的单词频率。由于游戏时间很长,我无法看到我的全套数据,它只显示频率最低的单词,因为Python窗口中没有足够的空间。我正在考虑将其转换为.csv文件。我的完整代码如下: #read the file as one string and spit the string into a list of separate wor