借助SAP HANA,您可以进行文本分析,全文搜索甚至情感分析。如何在SAP HANA全文搜索索引中自定义tokanization
在SAP HANA中定制托管的选项有哪些?
我知道我可以为spezial单词创建一个自定义字典。例如,我可以让HANA将“堆栈溢出”识别为单个实体/令牌。
但有时HANA会从多个不是一个令牌/实体的单词中创建令牌,例如“SAP以经验”在这里我要2个令牌“SAP”和“体验”(不是“SAP经验)
所以你怎么可以自定义tokanization(比自定义字典等)
借助SAP HANA,您可以进行文本分析,全文搜索甚至情感分析。如何在SAP HANA全文搜索索引中自定义tokanization
在SAP HANA中定制托管的选项有哪些?
我知道我可以为spezial单词创建一个自定义字典。例如,我可以让HANA将“堆栈溢出”识别为单个实体/令牌。
但有时HANA会从多个不是一个令牌/实体的单词中创建令牌,例如“SAP以经验”在这里我要2个令牌“SAP”和“体验”(不是“SAP经验)
所以你怎么可以自定义tokanization(比自定义字典等)
我无意中发现这个信息和思想如果它有帮助,我会把它传下去。
查看可用于定制HANA中文本索引的众多参数。要查看全文索引的配置,请使用SYS.FULLTEXT_INDEXES视图。你对PHRASE INDEX RATIO有什么价值?