如果我有一个字符串“你好,我是XYZ”它可以被标记为标记: - “你好”,“我”,“上午”,“XYZ”。但是,我将如何标记一个非空格分隔的字符串。 例如:“你好,IamXYZ”?我如何标记非空格分隔的字符串?
0
A
回答
0
如果字符串中没有空格,则使用字典对其进行标记。
另一种方法是使用ngrams,但要小心字符串的长度,因为它可能会创建许多ngram!
+0
我将如何使用字典?我可以使用ngrams,但它会很耗时,我必须将它与我的字典中存在的每个单词的ngram进行比较。例如,如果它是WhereisIndia? (wh,he,er,re,ei,sI ....},我必须把{wh,他}与所有单词的重音进行比较,然后{wh,他,呃}与每个单词的二元组进行比较,等等。 –
相关问题
- 1. 带分隔符的标记字符串“/”
- 2. 分裂空格分隔字符串
- 3. 字符串标记,分隔符
- 4. Java字符串标记器分隔符
- 5. (C++)在由空格分隔的字符串中分隔数字
- 6. 如何使用Python为字符串中的数字标识空格分隔符?
- 7. 如何提取一部分由空格分隔的字符串?
- 8. 空格分隔MySQL字符串搜索
- 9. 使用空格分隔字符串
- 10. 如何标记没有空格分隔符的连续单词?
- 11. 以空格分隔字符串作为分隔符
- 12. 做空格将字符串分隔成不同的字符串?
- 13. 字符串标记化,按标记分隔而不是分隔符
- 14. 如何计算字符串中空格分隔的子字符串的数量
- 15. 如何读取由C++中的空格分隔的字符串?
- 16. 拆分空间和非数字...包括非数字分隔符,不包括空格分隔符
- 17. 空格上的标记字符串,除非在引号之间
- 18. Java的 - 如何将字符串与空格分隔为变量?
- 19. 如何解析PHP中的空格分隔字符串?
- 20. 如何将空格分隔的字符串分隔为多个变量?
- 21. php5从字符串复制子字符串由空格分隔?
- 22. 如何用空格分隔字符串,除非用##或“”括起来“
- 23. bash脚本用空格分隔标记字符串转换成数组
- 24. 创建由字符串空格分隔的字符列表
- 25. 如何分割没有连续分隔符的空格的字符串
- 26. 迭代在字符串中没有空格作为分隔符的分隔符
- 27. 如何以空格或逗号分隔JavaScript字符串?
- 28. 如何在C#中用空格分隔字符串?
- 29. 如何使用空格分隔字符串和“|”在javascript中
- 30. 如何解析,保留和检索标签以空格分隔的字符串?
Tokenize是什么,英文单词?阅读字典并查看是否有任何组合匹配。但我期望很多字符串都会模糊(两个或多个有效的解析) – Kevin