第33次CSP认证Q1:词频统计

05-14 896阅读

🍄题目描述

在学习了文本处理后,小 P 对英语书中的 𝑛n 篇文章进行了初步整理。 具体来说,小 P 将所有的英文单词都转化为了整数编号。假设这 𝑛n 篇文章中共出现了 𝑚m 个不同的单词,则把它们从 11 到 𝑚m 进行编号。 这样,每篇文章就简化为了一个整数序列,其中每个数都在 11 到 𝑚m 范围内。

第33次CSP认证Q1:词频统计
(图片来源网络,侵删)

现给出小 P 处理后的 𝑛n 篇文章,对于每个单词 𝑖i(1≤𝑖≤𝑚1≤i≤m),试统计:

  1. 单词 𝑖i 出现在了多少篇文章中?
  2. 单词 𝑖i 在全部文章中总共出现了几次?
输入格式

从标准输入读入数据。

输入共 𝑛+1n+1 行。

输入的第一行包含两个正整数 𝑛n 和 𝑚m,分别表示文章篇数和单词编号上限。

输入的第 𝑖+1i+1 行(1≤𝑖≤𝑛1≤i≤n)包含由空格分隔的若干整数, 其中第一个整数 𝑙𝑖li​ 表示第 𝑖i 篇文章的长度(单词个数); 接下来 𝑙𝑖li​ 个整数表示对应的整数序列,序列中每个整数均在 11 到 𝑚m 范围内,各对应原文中的一个单词。

输出格式

输出到标准输出。

输出共 𝑚m 行。

第 𝑖i 行(1≤𝑖≤𝑚1≤i≤m)输出由空格分隔的两个整数 𝑥𝑖xi​ 和 𝑦𝑖yi​,表示共有 𝑥𝑖xi​ 篇文章包含单词 𝑖i,总计出现次数为 𝑦𝑖yi​。

🍄AC代码

#include
using namespace std;
const int N=110;
int main(){
    int n,m,k,x;
    int a[N]={0},b[N]={0};
    cin>>n>>m;
    for(int i=0;i>k;
        int flag[N]={0};
        for(int j=0;j>x;
            a[x]++;
            flag[x]++;
        }
        for(int j=1;j0)
                b[j]++;
        }
    }
    for(int i=1;i
VPS购买请点击我

文章版权声明:除非注明,否则均为主机测评原创文章,转载或复制请以超链接形式并注明出处。

目录[+]