7-3 哈夫曼编码 (30分) AC代码_给定一段文字,如果我们统计出字母出现的频率,是可以根据哈夫曼算法给出一套编码,-程序员宅基地

技术标签: 算法  编程语言---C语言  数据结构  

题目

####### 给定一段文字,如果我们统计出字母出现的频率,是可以根据哈夫曼算法给出一套编码,使得用此编码压缩原文可以得到最短的编码总长。然而哈夫曼编码并不是唯一的。例如对字符串"aaaxuaxz",容易得到字母 ‘a’、‘x’、‘u’、‘z’ 的出现频率对应为 4、2、1、1。我们可以设计编码 {‘a’=0, ‘x’=10, ‘u’=110, ‘z’=111},也可以用另一套 {‘a’=1, ‘x’=01, ‘u’=001, ‘z’=000},还可以用 {‘a’=0, ‘x’=11, ‘u’=100, ‘z’=101},三套编码都可以把原文压缩到 14 个字节。但是 {‘a’=0, ‘x’=01, ‘u’=011, ‘z’=001} 就不是哈夫曼编码,因为用这套编码压缩得到 00001011001001 后,解码的结果不唯一,“aaaxuaxz” 和 “aazuaxax” 都可以对应解码的结果。本题就请你判断任一套编码是否哈夫曼编码。

输入格式:

首先第一行给出一个正整数 N(2≤N≤63),随后第二行给出 N 个不重复的字符及其出现频率,格式如下:
c[1] f[1] c[2] f[2] ... c[N] f[N]

####### 其中c[i]是集合{‘0’ - ‘9’, ‘a’ - ‘z’, ‘A’ - ‘Z’, ‘_’}中的字符;f[i]是c[i]的出现频率,为不超过 1000 的整数。再下一行给出一个正整数 M(≤1000),随后是 M 套待检的编码。每套编码占 N 行,格式为:

c[i] code[i]

####### 其中c[i]是第i个字符;code[i]是不超过63个’0’和’1’的非空字符串。

输出格式:

对每套待检编码,如果是正确的哈夫曼编码,就在一行中输出"Yes",否则输出"No"。注意:最优编码并不一定通过哈夫曼算法得到。任何能压缩到最优长度的前缀编码都应被判为正确。

解析:

编码不唯一,但WPL唯一,当WPL正确时,看一下是否有前缀重合的编码,比如0001和00011这样子的,这样的会有歧义,所以不行。关于WPL,建议读者可以自己百度,我这边也给出一张图来解释一下。解释

输入样例:

7
A 1 B 1 C 1 D 3 E 3 F 6 G 6
4
A 00000
B 00001
C 0001
D 001
E 01
F 10
G 11
A 01010
B 01011
C 0100
D 011
E 10
F 11
G 00
A 000
B 001
C 010
D 011
E 100
F 101
G 110
A 00000
B 00001
C 0001
D 001
E 00
F 10
G 11

输出样例:

Yes
Yes
No
No
一、头文件和结构体:结构体的话,因为是哈夫曼树,所以就只有。本身的权重,还有他的父亲以及左孩子和右孩子的大小就可以了,这里面结构体变量的定义用的不是普通的整数,而是不能为负数的整数。

(需要指出的是这里的第二个结构体仅仅是为了好看)

#include <bits/stdc++.h>//万能头文件 
using namespace std;
 
typedef struct{
    
    unsigned int weight;
    unsigned int parent,lchild,rchild;
}HTNode,*HuffmanTree;
 
typedef struct Code{
    
    string str;
}Code;
二、 自定义函数:找到两个最小的数值的下标。
void Select(HuffmanTree ht,int n,int *s1,int *s2)
{
    
    int i;
    int minn=999999;
    int lable1=0,lable2=0;
    for(i=1;i<=n;i++)
    {
    
        if(ht[i].parent==0 && ht[i].weight<minn)
        {
    
            minn=ht[i].weight;
            lable1=i;
        }
    }
    *s1=lable1;
    minn=999999;
    for( i=1;i<=n;i++)
    {
    
        if(ht[i].parent==0 && ht[i].weight<minn && lable1 != i)
        {
    
            minn=ht[i].weight;
            lable2=i;
        }
    }
    *s2=lable2;
}
三、构建哈夫曼树,也就是建立起不同结点之间的关系。先是初始化,然后再更新。要注意函数的形参以及函数调用时的实参。
void HuffmanCoding(HuffmanTree &HT,int *w,int n)
{
    
    if(n<=1)
        return;
    //初始化
    int m=2*n-1;
    HT=(HuffmanTree)malloc((m+1)*sizeof(HTNode));
    HTNode *p=HT;
    int i=1;
    for(p=HT+1,i=1;i<=n;++i,++p,++w)
    {
    
        p->weight=*w;//涉及指针和数组的关系
        p->lchild=0;
        p->rchild=0;
        p->parent=0;
    }
    for(i=n+1;i<=m;++i,++p)
    {
    
        p->weight=0;
        p->lchild=0;
        p->rchild=0;
        p->parent=0;
    }
    //构造Huffman树
    for(i=n+1;i<=m;++i)
    {
    
        int s1,s2;
        Select(HT,i-1,&s1,&s2);
        HT[s1].parent=i;
        HT[s2].parent=i;
        HT[i].lchild=s1;
        HT[i].rchild=s2;
        HT[i].weight=HT[s1].weight+HT[s2].weight;
    }
}
四、主函数,因为我们只是在判断是否为哈夫曼编码,所以我们不用去输出一定的哈夫曼编码,题目也指出了不唯一的。那么怎么样的算是正确的呢…WPL值正确同时编码前缀不重合就可以。这里的话注意一下getchar()就可以。
int main()
{
    
    int n=0;
    cin>>n;
    getchar();
    int w[64];
    for(int i=0;i<n;++i)
    {
    
        char c;
        scanf("%c %d",&c,&w[i]);
        getchar();
    }
    
    HuffmanTree HT;
    HuffmanCoding(HT,w,n);
    //获得WPL的值
    int weight=0;
    for(int i=1;i<=2*n-1;++i)
    {
    
        if(HT[i].lchild!=0&&HT[i].rchild!=0)
        {
    
            weight+=HT[i].weight;
        }
    }
    //printf("%d##",weight);
    int m;
    cin>>m;
    getchar();
    Code code[65];
    for(int i=0;i<m;++i)
    {
    
        for(int i=1;i<=n;++i)
        {
    
            char c;
            cin>>c>>code[i].str;
        }
        //获得临时的WPL并和上面算出的比较
        int ThisWeight=0;
        for(int i=1;i<=n;++i)
        {
    
            ThisWeight+=code[i].str.length()*w[i-1];
        }
        if(ThisWeight>weight)
        {
    
            cout<<"No"<<endl;
            continue;
        }
	    //如果WPL一样的话再接着判断   
        int flag=0;
        for(int j=n;j>=1;--j)
        {
    
            for(int k=n;k>=1;--k)
            {
    
                if(j==k)//每一个都要和除了他自身以外的字符串进行比较 
                    continue;
                    
                if(code[j].str.length()>code[k].str.length())
                {
    
                    if(code[j].str.substr(0,code[k].str.length())==code[k].str)
                    //如果发现长的那个的前一部分和短的整个相等
                    {
    
                        flag=1;
                        break;
                    }
                }
                
                else
                {
    
                   if(code[k].str.substr(0,code[j].str.length())==code[j].str)
                   //如果发现长的那个的前一部分和短的整个相等
                    {
    
                        flag=1;
                        break;
                    }
                }
            }
        } 
        if(flag==1)
            cout<<"No"<<endl;
        else
            cout<<"Yes"<<endl;
    }
    return 0;
}
五、提交。

通过

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/weixin_45880844/article/details/106448272

智能推荐

Docker 快速上手学习入门教程_docker菜鸟教程-程序员宅基地

文章浏览阅读2.5w次,点赞6次,收藏50次。官方解释是,docker 容器是机器上的沙盒进程,它与主机上的所有其他进程隔离。所以容器只是操作系统中被隔离开来的一个进程,所谓的容器化,其实也只是对操作系统进行欺骗的一种语法糖。_docker菜鸟教程

电脑技巧:Windows系统原版纯净软件必备的两个网站_msdn我告诉你-程序员宅基地

文章浏览阅读5.7k次,点赞3次,收藏14次。该如何避免的,今天小编给大家推荐两个下载Windows系统官方软件的资源网站,可以杜绝软件捆绑等行为。该站提供了丰富的Windows官方技术资源,比较重要的有MSDN技术资源文档库、官方工具和资源、应用程序、开发人员工具(Visual Studio 、SQLServer等等)、系统镜像、设计人员工具等。总的来说,这两个都是非常优秀的Windows系统镜像资源站,提供了丰富的Windows系统镜像资源,并且保证了资源的纯净和安全性,有需要的朋友可以去了解一下。这个非常实用的资源网站的创建者是国内的一个网友。_msdn我告诉你

vue2封装对话框el-dialog组件_<el-dialog 封装成组件 vue2-程序员宅基地

文章浏览阅读1.2k次。vue2封装对话框el-dialog组件_

MFC 文本框换行_c++ mfc同一框内输入二行怎么换行-程序员宅基地

文章浏览阅读4.7k次,点赞5次,收藏6次。MFC 文本框换行 标签: it mfc 文本框1.将Multiline属性设置为True2.换行是使用"\r\n" (宽字符串为L"\r\n")3.如果需要编辑并且按Enter键换行,还要将 Want Return 设置为 True4.如果需要垂直滚动条的话将Vertical Scroll属性设置为True,需要水平滚动条的话将Horizontal Scroll属性设_c++ mfc同一框内输入二行怎么换行

redis-desktop-manager无法连接redis-server的解决方法_redis-server doesn't support auth command or ismis-程序员宅基地

文章浏览阅读832次。检查Linux是否是否开启所需端口,默认为6379,若未打开,将其开启:以root用户执行iptables -I INPUT -p tcp --dport 6379 -j ACCEPT如果还是未能解决,修改redis.conf,修改主机地址:bind 192.168.85.**;然后使用该配置文件,重新启动Redis服务./redis-server redis.conf..._redis-server doesn't support auth command or ismisconfigured. try

实验四 数据选择器及其应用-程序员宅基地

文章浏览阅读4.9k次。济大数电实验报告_数据选择器及其应用

随便推点

灰色预测模型matlab_MATLAB实战|基于灰色预测河南省社会消费品零售总额预测-程序员宅基地

文章浏览阅读236次。1研究内容消费在生产中占据十分重要的地位,是生产的最终目的和动力,是保持省内经济稳定快速发展的核心要素。预测河南省社会消费品零售总额,是进行宏观经济调控和消费体制改变创新的基础,是河南省内人民对美好的全面和谐社会的追求的要求,保持河南省经济稳定和可持续发展具有重要意义。本文建立灰色预测模型,利用MATLAB软件,预测出2019年~2023年河南省社会消费品零售总额预测值分别为21881...._灰色预测模型用什么软件

log4qt-程序员宅基地

文章浏览阅读1.2k次。12.4-在Qt中使用Log4Qt输出Log文件,看这一篇就足够了一、为啥要使用第三方Log库,而不用平台自带的Log库二、Log4j系列库的功能介绍与基本概念三、Log4Qt库的基本介绍四、将Log4qt组装成为一个单独模块五、使用配置文件的方式配置Log4Qt六、使用代码的方式配置Log4Qt七、在Qt工程中引入Log4Qt库模块的方法八、获取示例中的源代码一、为啥要使用第三方Log库,而不用平台自带的Log库首先要说明的是,在平时开发和调试中开发平台自带的“打印输出”已经足够了。但_log4qt

100种思维模型之全局观思维模型-67_计算机中对于全局观的-程序员宅基地

文章浏览阅读786次。全局观思维模型,一个教我们由点到线,由线到面,再由面到体,不断的放大格局去思考问题的思维模型。_计算机中对于全局观的

线程间控制之CountDownLatch和CyclicBarrier使用介绍_countdownluach于cyclicbarrier的用法-程序员宅基地

文章浏览阅读330次。一、CountDownLatch介绍CountDownLatch采用减法计算;是一个同步辅助工具类和CyclicBarrier类功能类似,允许一个或多个线程等待,直到在其他线程中执行的一组操作完成。二、CountDownLatch俩种应用场景: 场景一:所有线程在等待开始信号(startSignal.await()),主流程发出开始信号通知,既执行startSignal.countDown()方法后;所有线程才开始执行;每个线程执行完发出做完信号,既执行do..._countdownluach于cyclicbarrier的用法

自动化监控系统Prometheus&Grafana_-自动化监控系统prometheus&grafana实战-程序员宅基地

文章浏览阅读508次。Prometheus 算是一个全能型选手,原生支持容器监控,当然监控传统应用也不是吃干饭的,所以就是容器和非容器他都支持,所有的监控系统都具备这个流程,_-自动化监控系统prometheus&grafana实战

React 组件封装之 Search 搜索_react search-程序员宅基地

文章浏览阅读4.7k次。输入关键字,可以通过键盘的搜索按钮完成搜索功能。_react search