word-count

0热度

2回答

我想执行的文本文件一个简单的MapReduce，但它不是做的输出。这是我的代码： import java.io.IOException; import java.util.StringTokenizer; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.Path; import org.apa

0热度

4回答

加载一个txt链接在一个文本，并得到字数

我有文本的链接：https://process.filestackapi.com/output=format:txt/3i0kHfrRXyGHg9StS8zf ，我想将这些内容在一个文本，并得到字数，所以我在HTML这样做： <textarea id="dkd" cols="30" rows="10"></textarea> <br><br><br> <div id="count"></div

0热度

1回答

根据其他列中的值计算一列中字符串的出现次数Python

对不起，我真的很基本的问题，我知道有关于这个问题的帖子无处不在，但我似乎无法绕过它所有的帮助其他网页。对于初学者来说，我是一个初学者，非常抱歉模糊的代码。但我只想要计算第2列中某个字符串出现的次数，第1列中的值保持不变。如果此值更改，则循环应重新开始。这听起来很简单，但我很困惑python阅读我的文本文件作为一个字符串（给我带钢和拆分等问题）。我似乎无法得到此代码的工作。请有人帮忙解决这个苦恼的

1热度

1回答

Mapreduce WordCount错误输出示例

我正在学习mapreduce。从MapReduce WordCount所示的WordCount示例开始，当我在eclipse中执行代码时，它的输出是正确的字数。 I/P文件内容如下： - 的Hello World再见世界它的输出是再见1 你好1 世界2 之后，我通过在输入文件中的每个单词之后用逗号替换空格来测试代码。现在我已将输入恢复为与之前相同，但现在输出中的WordCount是预期结果的

2热度

2回答

如何使用reduce函数在python中创建字数输出？

我的元组下面的列表：[('a', 1), ('a', 1), ('b', 1), ('c',1), ('a', 1), ('c', 1)] 我想知道我是否可以使用Python的reduce功能聚集并出示以下的输出：[('a', 3), ('b', 1), ('c', 2)] 或者有其他的方式，我会喜欢知道（循环很好）

0热度

1回答

为什么`last`不让我退出foreach循环？

我想计算包含单词的句子数。我有2个文件，一个包含句子，另一个包含单词，所以对于每个单词我都会计算包含这个单词的句子数。这是我的代码： use strict; use autodie; use autodie; open my $fh_resultat, ">:utf8", 'out'; use constant CORPUS_MOT => 'test'; use constant C

1热度

2回答

IOException异常：从地图键类型不匹配：文本，收到LongWritable

据我所知，这个话题在过去进行了讨论。但不幸的是我无法解决这个问题。我一直得到相同的IOException错误。我对Java & Hadoop非常陌生，这是我第一次尝试WordCount练习。对于任何语法错误或格式问题，我表示歉意。请让我知道我要去哪里错了。 Error: java.lang.Exception: java.io.IOException: Type mismatch in key f

0热度

1回答

对hadoop中的输出文本文件进行排序，有没有办法在不排序的情况下查看输出？或者使用不同的排序方法？

所以基本上我用mapreduce for wordcount来保存我在hadoop中保存的文本文件，现在我想查看输出结果。目前这是唯一的命令，我在网上看到： bin/hadoop fs -cat output/part-r-00000 | sort -k 2 -n -r | less 到目前为止，我只是通过这个命令困惑，又或许只是排序的输出？我可以查看输出而不分类吗？此命令是否按字母顺序排

1热度

1回答

使用Redis的一个巨大文件的字数的最佳解决方案

我想用java来做一个巨大文件的字数统计。由于单台机器，我无法使用地图缩小功能。我不想使用哈希映射，而是使用Redis来存储单词的频率。实际数据正在流入。我以为我会推动在redis排序集每个字计数。但我不知道这是最佳解决方案。请提供最佳解决方案来统计流数据的字数。一个字Java代码计数 - public class WordCount { public static void mai

-1热度

3回答

C程序。 - 在一个句子中找到回文数 - 如何在执行计数时设置一个循环来标记词汇

我正在研究一个程序，该程序在用户输入的句子中检查句子中有多少个回文词。实施例：输入：演出校平再见输出： 2. 问：我怎样才能建立一个循环来标记的话，同时进行计数？注意：我不能使用strrev函数，也不能逐个插入单词（用户必须输入单个字符串）。以下是我已编码到目前为止。 /* My basic idea is: 1) I will retrieve words from a sent