word-count

    0热度

    2回答

    我想执行的文本文件一个简单的MapReduce,但它不是做的输出。这是我的代码: import java.io.IOException; import java.util.StringTokenizer; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.Path; import org.apa

    0热度

    4回答

    我有文本的链接:https://process.filestackapi.com/output=format:txt/3i0kHfrRXyGHg9StS8zf ,我想将这些内容在一个文本,并得到字数,所以我在HTML这样做: <textarea id="dkd" cols="30" rows="10"></textarea> <br><br><br> <div id="count"></div

    0热度

    1回答

    对不起,我真的很基本的问题,我知道有关于这个问题的帖子无处不在,但我似乎无法绕过它所有的帮助其他网页。 对于初学者来说,我是一个初学者,非常抱歉模糊的代码。但我只想要计算第2列中某个字符串出现的次数,第1列中的值保持不变。如果此值更改,则循环应重新开始。这听起来很简单,但我很困惑python阅读我的文本文件作为一个字符串(给我带钢和拆分等问题)。我似乎无法得到此代码的工作。请有人帮忙解决这个苦恼的

    1热度

    1回答

    我正在学习mapreduce。从MapReduce WordCount所示的WordCount示例开始,当我在eclipse中执行代码时,它的输出是正确的字数。 I/P文件内容如下: - 的Hello World再见世界 它的输出是 再见1 你好1 世界2 之后,我通过在输入文件中的每个单词之后用逗号替换空格来测试代码。 现在我已将输入恢复为与之前相同,但现在输出中的WordCount是预期结果的

    2热度

    2回答

    我的元组下面的列表:[('a', 1), ('a', 1), ('b', 1), ('c',1), ('a', 1), ('c', 1)] 我想知道我是否可以使用Python的reduce功能聚集并出示以下的输出:[('a', 3), ('b', 1), ('c', 2)] 或者有其他的方式,我会喜欢知道(循环很好)

    0热度

    1回答

    我想计算包含单词的句子数。我有2个文件,一个包含句子,另一个包含单词,所以对于每个单词我都会计算包含这个单词的句子数。 这是我的代码: use strict; use autodie; use autodie; open my $fh_resultat, ">:utf8", 'out'; use constant CORPUS_MOT => 'test'; use constant C

    1热度

    2回答

    据我所知,这个话题在过去进行了讨论。但不幸的是我无法解决这个问题。我一直得到相同的IOException错误。我对Java & Hadoop非常陌生,这是我第一次尝试WordCount练习。对于任何语法错误或格式问题,我表示歉意。请让我知道我要去哪里错了。 Error: java.lang.Exception: java.io.IOException: Type mismatch in key f

    0热度

    1回答

    所以基本上我用mapreduce for wordcount来保存我在hadoop中保存的文本文件,现在我想查看输出结果。 目前这是唯一的命令,我在网上看到: bin/hadoop fs -cat output/part-r-00000 | sort -k 2 -n -r | less 到目前为止,我只是通过这个命令困惑,又或许只是排序的输出?我可以查看输出而不分类吗? 此命令是否按字母顺序排

    1热度

    1回答

    我想用java来做一个巨大文件的字数统计。由于单台机器,我无法使用地图缩小功能。我不想使用哈希映射,而是使用Redis来存储单词的频率。实际数据正在流入。 我以为我会推动在redis排序集每个字计数。但我不知道这是最佳解决方案。请提供最佳解决方案来统计流数据的字数。 一个字Java代码计数 - public class WordCount { public static void mai

    -1热度

    3回答

    我正在研究一个程序,该程序在用户输入的句子中检查句子中有多少个回文词。 实施例: 输入: 演出校平再见 输出: 2. 问:我怎样才能建立一个循环来标记的话,同时进行计数? 注意:我不能使用strrev函数,也不能逐个插入单词(用户必须输入单个字符串)。 以下是我已编码到目前为止。 /* My basic idea is: 1) I will retrieve words from a sent