mining

    1热度

    2回答

    我正在进入一个项目,以进行意见挖掘(数据挖掘 - > Web挖掘 - >意见挖掘)以获取所包含单词的语义定位。我们将使用抓取工具获取网页意见。现在的问题是,我应该使用什么类型的DataBase(OO,Relational,hierachycal等),最好在这种类型的项目中使用。 我知道这是一个具体的问题,我没有期待每个人的回应,但至少有人已经做到了,这会有所帮助。 问候!

    1热度

    2回答

    简而言之,我需要一些关于我试图实现的解决方案的建议。 我正在实施一个社交网络,使用.net技术,我需要从数据库中收集并保存的数据(一种图形/链接挖掘)推断知识。 我的问题是: 此任务应该由商业智能工具执行? 你知道任何.net框架来处理这种类型的信息(图)吗? 我该如何坚持结果数据?使用单独的数据库?

    1热度

    3回答

    是否有人知道如何生成可能的拼写错误? 如失业 - uemployment - onemploymnet - 等

    0热度

    1回答

    我是一名在图挖掘领域工作的博士生。 人们在图中通过遍历和计算节点之间的相似性时使用了图中的随机游走概念。 任何人都可以告诉我,随机游走是如何在图上起作用的吗? 特别是,当它被用来测量图中的任意两个任意节点/顶点时...... 等待有效的和内容丰富的答复...:roll:

    14热度

    3回答

    让我们做一些文本挖掘 我站在这里与文件项矩阵(从tm包) dtm <- TermDocumentMatrix( myCorpus, control = list( weight = weightTfIdf, tolower=TRUE, removeNumbers = TRUE, minWordLength = 2, rem

    1热度

    3回答

    我正在寻找最好的工具来提取嵌入最流行的图像文件格式(特别是JPEG和PNG)内的任何和所有元数据。我想知道那里有什么(XMP,Exif,IPTC/IIM等)。理想情况下,我正在寻找一种可以从命令行运行的一体化解决方案,但有兴趣了解此领域中任何有价值的其他工具。 我发现下面,各具优势/劣势: ExifTool是好的,但输出的是多一点横行霸道,我想。 DumpImage来自Metadata Worki

    2热度

    2回答

    我需要做一个实验,我是NLP中的新成员。我已经阅读了解释理论问题的书籍,但在实际操作中,我发现很难找到指南。所以请谁知道NLP中的任何内容,特别是实际问题告诉我,并指向正确的道路,因为我觉得我迷路了(有用的书籍,有用的工具和有用的网站) 我想要做的是采取文本并找到特定的单词,例如动物,如狗,猫,等等,然后我需要提取这个单词和两个单词。 例如 I was watching TV with my lo

    1热度

    2回答

    我正在寻找以图形方式实现即席查询功能的常见模式。我查看了Access和TOAD中的SQL查询构建器,但是如果有人知道已经针对特定于领域的数据仓库(例如临床数据库)构建了这种工具的产品,我很感兴趣。 感谢,