One - One Code All

Blog Content

哈夫曼树,最优二叉树

自然语言处理 算法   2011-01-01 16:32:20

哈夫曼树 Huffman Tree,给定n个权值作为n个叶子结点,构造一棵二叉树,若带权路径长度达到最小,称这样的二叉树为最优二叉树,也称为哈夫曼树(Huffman Tree)。哈夫曼树是带权路径长度最短的树,权值较大的结点离根较近。

路径长度:根结点到第L层结点路径长度为L-1
带权路径长度:WPL

路径: 树中一个结点到另一个结点之间的分支构成这两个结点之间的路径。
路径长度:路径上的分枝数目称作路径长度。根结点到第L层结点路径长度为L-1 。
树的路径长度:从树根到每一个结点的路径长度之和。
 
结点的带权路径长度WPL:在一棵树中,如果其结点上附带有一个权值,通常把该结点的路径长度与该结点上的权值之积称为该结点的带权路径长度(weighted path length)

权值:定义的路径上面的值。可以这样理解为节点间的距离。通常指字符对应的二进制编码出现的概率。
霍夫曼树中的权值可以理解为:权值大表明出现概率大!
一个结点的权值实际上就是这个结点子树在整个树中所占的比例.
abcd四个叶子结点的权值为7,5,2,4. 这个7,5,2,4是根据实际情况得到的,比如说从一段文本中统计出abcd四个字母出现的次数分别为7,5,2,4. 说a结点的权值为7,意思是说a结点在系统中占有7这个份量.实际上也可以化为百分比来表示,但反而麻烦,实际上是一样的.

树的带权路径长度:如果树中每个叶子上都带有一个权值,则把树中所有叶子的带权路径长度之和称为树的带权路径长度。

一般来说,用n(n>0)个带权值的叶子来构造二叉树,限定二叉树中除了这n个叶子外只能出现度为2的结点。那么符合这样条件的二叉树往往可构造出许多颗,其中带权路径长度最小的二叉树就称为哈夫曼树或最优二叉树。

哈夫曼树的构造:根据哈弗曼树的定义,一棵二叉树要使其WPL值最小,必须使权值越大的叶子结点越靠近根结点,而权值越小的叶子结点越远离根结点。

一个节点只能生出两个“枝桠”。
手工构造哈夫曼树:选择两个最小的数字(哈夫曼树是从下往上排列的),用一个类似于树杈的“树枝”连接上两个最小的数。在顶点处计算出这两个数字的和并写在上面。然后再比较剩下的数字和这个和的大小,再取出两个最小的数字进行排列,如果两个数的和正好是下一步的两个最小数的其中的一个那么这个树直接往上生长就可以了。如果这两个数的和比较大不是下一步的两个最小数的其中一个那么,就并列生长。

#include
#include
#include
using namespace std;

#define N 10         // 带编码字符的个数,即树中叶结点的最大个数
#define M (2*N-1)    // 树中总的结点数目

class HTNode{        // 树中结点的结构
public: 
    unsigned int weight;
    unsigned int parent,lchild,rchild;
};                    

class HTCode{
public:
    char data;      // 待编码的字符
    int weight;     // 字符的权值
    char code[N];   // 字符的编码
};

void Init(HTCode hc[], int *n){
// 初始化,读入待编码字符的个数n,从键盘输入n个字符和n个权值
    int i;
    printf("input n = ");
    scanf("%d",&(*n));

    printf("\ninput %d character\n",*n);
    
    fflush(stdin);
    for(i=1; i<=*n; ++i)
        scanf("%c",&hc[i].data);

    printf("\ninput %d weight\n",*n);
    
    for(i=1; i<=*n; ++i)
        scanf("%d",&(hc[i].weight) );
    fflush(stdin);
}//

void Select(HTNode ht[], int k, int *s1, int *s2){
// ht[1...k]中选择parent为0,并且weight最小的两个结点,其序号由指针变量s1,s2指示
    int i;
    for(i=1; i<=k && ht[i].parent != 0; ++i){ 
        ; ;
    }
    *s1 = i;

    for(i=1; i<=k; ++i){
        if(ht[i].parent==0 && ht[i].weight



上一篇:python日历模块calendar
下一篇:消渴穴对治糖尿病

The minute you think of giving up, think of the reason why you held on so long.