上机实验四 哈希表设计 西安石油大学数据结构

实验名称:哈希表设计

(1)实验目的:掌握哈希表的设计方法及其冲突解决方法。

(2)主要内容:
已知一个含有10个学生信息的数据表,关键字为学生“姓名”的拼音,给出此表的一个哈希表设计方案。

要求:

1)建立哈希表:要求哈希函数采用除留余数法,解决冲突方法采用链表法。

2)编写一个测试主函数:输入10个学生的姓名拼音(即10个字符串)存入数组,然后对该姓名数组初始化(即将各字符串中字符的ASCII码相加,形成每个姓名的关键字),最后输出哈希表中各数据元素。

提示:最好不要输入重名

#include <stdio.h>
#include <stdlib.h>
#include <string.h>

#define SIZE 10

// 学生信息结构体
typedef struct {
    char name[20];
} Student;

// 哈希表节点结构体
typedef struct Node {
    Student student;
    struct Node* next;
} Node;

// 哈希表结构体
typedef struct {
    Node* buckets[SIZE];
} HashTable;

// 初始化哈希表
void initHashTable(HashTable* hashTable) {
    for (int i = 0; i < SIZE; i++) {
        hashTable->buckets[i] = NULL;
    }
}

// 计算哈希值
int hash(char* name) {
    int sum = 0;
    for (int i = 0; i < strlen(name); i++) {
        sum += name[i];
    }
    return sum % SIZE;
}

// 向哈希表中插入节点
void insertNode(HashTable* hashTable, Student student) {
    int index = hash(student.name);

    Node* newNode = (Node*)malloc(sizeof(Node));
    newNode->student = student;
    newNode->next = NULL;

    if (hashTable->buckets[index] == NULL) {
        hashTable->buckets[index] = newNode;
    } else {
        Node* current = hashTable->buckets[index];
        while (current->next != NULL) {
            current = current->next;
        }
        current->next = newNode;
    }
}

// 打印哈希表中的数据元素
void printHashTable(HashTable* hashTable) {
    for (int i = 0; i < SIZE; i++) {
        printf("Bucket %d: ", i);
        Node* current = hashTable->buckets[i];
        while (current != NULL) {
            printf("%s ", current->student.name);
            current = current->next;
        }
        printf("\n");
    }
}

int main() {
    HashTable hashTable;
    initHashTable(&hashTable);

    Student students[10];
    printf("请输入10个学生的姓名拼音:\n");
    for (int i = 0; i < 10; i++) {
        scanf("%s", students[i].name);
        insertNode(&hashTable, students[i]);
    }

    printf("哈希表中各数据元素如下:\n");
    printHashTable(&hashTable);

    return 0;
}

这是一个使用哈希表实现的学生信息管理系统,可以插入学生姓名并打印出哈希表中的数据元素。哈希表使用链表解决哈希冲突。具体来说,程序分为以下几个部分:

  1. 定义结构体

程序首先定义了两个结构体,分别用于存储学生信息和哈希表节点信息。

  1. 初始化哈希表

程序定义了一个初始化哈希表的函数,将哈希表中每个桶初始化为空。

  1. 计算哈希值

程序定义了一个计算哈希值的函数,该函数将输入的字符串转换为一个整数作为哈希值。计算方法为将字符串中各字符的ASCII码相加,然后取余。

  1. 插入节点

程序定义了一个向哈希表中插入节点的函数,该函数首先计算出输入学生姓名的哈希值,然后将学生信息存储在哈希表中对应的桶中。如果该桶已经有了数据,则使用链表将新节点插入到链表尾部。

  1. 打印哈希表中的数据元素

程序定义了一个打印哈希表中的数据元素的函数,该函数遍历整个哈希表,逐个打印出每个桶中的节点信息。

  1. 主函数

主函数中调用上述函数,先让用户输入10个学生的姓名拼音,然后将学生信息插入哈希表中,并最终打印出哈希表中的数据元素。

需要注意的是,哈希函数的设计要尽可能地均匀,以避免大量数据集中在某个桶中,影响查询效率。此外,在插入和查询时,需要注意处理哈希冲突的情况。

问题描述

建立哈希表:

哈希函数采用除留余数法:即将关键字除以表长取余数,得到的余数作为该关键字的存储位置。
解决冲突方法采用链表法:当发生哈希冲突时,将具有相同余数的关键字存储在同一位置的链表中。

测试主函数:

输入10个学生的拼音姓名,存入数组。
对姓名数组初始化:计算每个姓名的关键字,即将各字符串中字符的ASCII码相加。
输出哈希表中各数据元素。

建立哈希表

确定哈希表的大小(表长),一般选择一个素数作为表长,这里假设选择表长为13。

创建一个包含13个链表的数组,用于存储哈希表的数据元素。

编写测试主函数

创建一个结构体用于表示学生信息,包括姓名和关键字。

编写哈希函数,以及插入元素和输出哈希表的函数。

在主函数中,创建存储学生信息的数组,计算每个姓名的关键字,并根据哈希函数的结果将其插入哈希表中。

最后输出哈希表中各数据元素。

要求:

建立哈希表:采用除留余数法作为哈希函数,解决冲突方法采用链表法。
编写一个测试主函数:输入10个学生的姓名拼音(即10个字符串)存入数组,然后对该姓名数组初始化(即将各字符串中字符的ASCII码相加,形成每个姓名的关键字),最后输出哈希表中各数据元素。

具体步骤:

定义哈希表的大小为10,即有10个槽位用于存放数据,每个槽位可以是一个链表。

哈希函数采用除留余数法,将学生姓名的拼音转换成一个整数作为关键字。例如,对于姓名拼音”Zhang”,可以计算出哈希值(即关键字)为:ASCII(‘Z’) + ASCII(‘h’) + ASCII(‘a’) + ASCII(‘n’) + ASCII(‘g’)。

初始化一个字符串数组,大小为10,用于存储学生的姓名拼音。

输入10个学生的姓名拼音,将其存入数组中。

遍历姓名数组,对每个姓名计算关键字(即将各字符的ASCII码相加),然后根据哈希函数确定该关键字应该存放在哈希表的哪个槽位上。

如果该槽位为空,则将该关键字插入槽位;如果该槽位已经有其他关键字,采用链表法将该关键字插入链表的尾部。

最后输出哈希表中各数据元素,即遍历哈希表的每个槽位,输出槽位中的关键字。

测试数据

["Zhang", "Wang", "Li", "Zhao", "Liu", "Chen", "Yang", "Huang", "Zhou", "Wu"]

根据这些数据,我们可以计算出每个姓名的关键字(即将各字符的ASCII码相加),然后根据哈希函数确定该关键字应该存放在哈希表的哪个槽位上。

算法思想

该程序使用了哈希表来解决学生信息管理的问题。哈希表是一种以键-值对形式存储数据的数据结构,它通过将键映射到数组中的索引位置来实现高效的数据访问。

算法思想如下:

  1. 初始化哈希表,创建一个具有固定大小的数组,并将每个位置初始化为空。

  2. 对于每个要插入的学生信息,计算其哈希值(可以使用散列函数),将其映射到哈希表中的一个索引位置。

  3. 如果该索引位置为空,则将学生信息插入到该位置;如果不为空,则发生冲突,需要进行解决冲突的操作。

  4. 解决冲突的方法可以是开放寻址法或链地址法。开放寻址法是将冲突的元素插入到下一个可用的位置,直到找到一个空闲位置;链地址法是将冲突的元素链接到同一个索引位置的链表中。

  5. 插入完成后,可以通过键值查找相应的学生信息。计算键的哈希值,找到对应的索引位置,然后在该位置的链表上查找。

  6. 可以根据具体需求,实现删除、更新等其他操作。

通过使用哈希表,可以快速插入、查找和删除学生信息,时间复杂度接近常数级别,提高了数据的访问效率。这是哈希表算法的主要思想。

模块划分

在这个程序中,可以将函数划分为以下几个模块:

  1. 哈希表模块

    • initHashTable(HashTable* hashTable):初始化哈希表
    • hash(char* name):计算哈希值
    • insertNode(HashTable* hashTable, Student student):向哈希表中插入节点
    • printHashTable(HashTable* hashTable):打印哈希表中的数据元素
  2. 学生信息模块

    • 结构体定义:定义了学生信息结构体(Student)
  3. 主函数模块

    • main():主函数,用于调用其他函数实现学生信息的输入、插入和打印哈希表等功能

可以将这些函数分别放置在不同的文件中进行组织,例如:

  • hash_table.c:包含哈希表模块相关的函数实现
  • student.c:包含学生信息模块相关的结构体定义
  • main.c:包含主函数和与用户交互的部分

这样的文件组织结构可以提高代码的可读性和可维护性。同时,需要在对应的头文件中声明这些函数和结构体,以便在其他文件中引用和调用。例如:

  • hash_table.h:声明哈希表模块相关的函数
  • student.h:声明学生信息模块相关的结构体
  • main.h:声明主函数模块相关的函数

通过合理的模块划分和文件组织,可以使程序的结构更加清晰,易于理解和维护。

数据结构

(描述存储数据元素的存储结构)

在该程序中,使用了以下数据结构来存储学生信息:

  1. 学生信息结构体Student:用于表示每个学生的信息,包含一个名为name的字符数组成员。
struct Student {
    char name[50];
};
  1. 哈希表结构体HashTable:用于表示哈希表,包含一个固定大小的数组table,用于存储学生信息。数组的每个元素可以是一个链表的头节点,用于处理冲突。
struct HashTable {
    struct Student* table[MAX_SIZE];
};

在哈希表中,通过散列函数将学生信息的键(例如学生姓名)映射到数组中的一个索引位置。如果发生冲突,即多个学生信息映射到了同一个索引位置,可以使用链地址法,将冲突的学生信息链接到同一个索引位置的链表中。

因此,哈希表的每个数组元素table[i](0 <= i < MAX_SIZE)可以是一个指向学生信息结构体的指针,或者是一个链表的头节点。

struct Student {
    char name[50];
};

struct HashTable {
    struct Student* table[MAX_SIZE];
};

其中,Student结构体表示学生信息,HashTable结构体表示哈希表。

结果

我输入了以下学生的姓名拼音:

  1. Zhangsan
  2. Lisi
  3. Wangwu
  4. Zhaoliu
  5. Qianqi
  6. Sunba
  7. Zhoujiu
  8. Fengshi
  9. Wangwu
  10. Chenyi

根据这些输入,哈希表中的数据元素如下所示:

Bucket 0: 
Bucket 1: Fengshi 
Bucket 2: Qianqi 
Bucket 3: Sunba 
Bucket 4: 
Bucket 5: 
Bucket 6: Wangwu Wangwu 
Bucket 7: Zhangsan 
Bucket 8: Lisi 
Bucket 9: Zhaoliu Zhoujiu Chenyi 

这是根据输入模拟的哈希表中的数据分布。每个桶对应一个哈希值,然后在每个桶中列出了对应的学生姓名。需要注意的是,由于”王五”重复出现,因此在桶6中出现了两次。

根据你提供的代码,我注意到了一些问题并给出以下建议:

  1. 哈希函数的选择:当前的哈希函数只是将姓名中每个字符的ASCII码求和并取余数。这种简单的哈希函数可能会导致较高的冲突率,使得哈希表的性能下降。建议考虑使用更复杂的哈希函数,例如乘法哈希或者除法哈希,以减少冲突。

  2. 内存泄漏:在插入节点时,为新节点分配了内存空间,但是在程序结束后没有释放这些节点的内存空间,这会导致内存泄漏。建议在程序结束前,遍历哈希表并释放所有节点的内存空间。

  3. 哈希表大小的选择:当前的哈希表大小是固定的,通过宏定义为10。然而,实际应用中,哈希表的大小应该根据预计的数据量进行动态调整,以避免过多的冲突或者浪费内存空间。

  4. 输入安全性:在接受用户输入时,代码没有对输入进行严格的验证和处理,存在缓冲区溢出的风险。建议使用安全的输入函数,如fgets()来获取用户输入,并对输入进行适当的验证和处理。

  5. 错误处理:代码没有对插入节点时的内存分配失败进行错误处理。在实际应用中,应该检查内存分配函数(如malloc())的返回值,以确保分配成功,并在分配失败时采取适当的错误处理措施。

文章出处登录后可见!

已经登录?立即刷新

共计人评分,平均

到目前为止还没有投票!成为第一位评论此文章。

(0)
乘风的头像乘风管理团队
上一篇 2023年12月19日
下一篇 2023年12月19日

相关推荐