我有一个数据框在一列中有大约10,000个字,而在另一列中有相应的频率。我也有一个约600字的矢量。每个600字是数据帧中的一个字。如何从10,000字数据帧中查找600字矢量的频率?如何提取R中单词子集的词频?
0
A
回答
0
使用dplyr
的连接函数。
# make the 600 vector into a dataframe
600_df <- as.data.frame(600_vec)
# left join the two dataframes
df <- left_join(x = 600_df, y = 10000_df, by = "word")
其中 “字” 是变量名两个dataframes
0
在众多的解决方案,与df$words
是您的data.frame的话和wordsvector
作为载体的柱:
library(plyr)
freqwords <- ddply(df, .(words), summarize, n = length(words)) #shows frequency of all the words in the data.frame
freqwords[freqwords$words %in% wordsvector,] #keeping only the words that appear in your vector
下一次,如果你提供一些虚拟的数据,所以我们会有所帮助可以帮助你更好。
相关问题
- 1. 如何获取R中的单词频率和相应的单词
- 2. 从音频剪辑中提取单词
- 3. 如何提取单词“0U47NN4XMD8V”?
- 4. 从R中的句子中提取单词
- 5. 如何通过查找前面的单词从句子中提取名词?
- 6. 如何从URL中提取单词?
- 7. 如何从行中提取单词
- 8. 提取单词的同义词
- 9. 如何从Linux Shell中的句子中提取单词?
- 10. 如何提取用于Doc2Vec的单词
- 11. 需要提取整个句子,其中中间单词以R中的特定单词开始
- 12. NLP从句子提取字典单词
- 13. 从R中的语料库创建单词的子集
- 14. 检查,如果单词词典[R
- 15. 如何通过R中的句子中的行(单词)来获取特定子串的频率?
- 16. R:从一列中提取单词到不同的列中
- 17. 从R中的文本中提取英文单词
- 18. 如何在单词中搜索句子的第一个单词
- 19. 如何提取句子的最后一个单词
- 20. Python中的频繁单词
- 21. 从文件中提取单词但每个单词一次
- 22. 单词嵌入提取
- 23. 提取整个单词
- 24. 使用Perl提取单词
- 25. 使用str_extract_all只提取R中的前两个单词?
- 26. 提取字符串中的最后一个单词R
- 27. 提取R中前两个单词后的所有内容
- 28. 如何在给定单词的单词袋词汇中获得单词的id?
- 29. 用python提取语料库中最频繁的单词
- 30. 用于从音频流中提取单词(语音)的库?
'match'或'merge'之间恒定。 – Gregor
建议R-FAQ重复[如何加入数据](https://stackoverflow.com/q/1299871/903061) – Gregor