数据结构:图及相关算法讲解

    • 1.图的基本概念
    • 2. 图的存储结构
      • 2.1邻接矩阵
      • 2.2邻接表
      • 2.3两种实现的比较
    • 3.图的遍历
      • 3.1 图的广度优先遍历
      • 3.2 图的深度优先遍历
    • 4.最小生成树
      • 4.1 Kruskal算法
      • 4.2 Prim算法
      • 4.3 两个算法比较
    • 5.最短路径
      • 5.1两个抽象存储
      • 5.2单源最短路径–Dijkstra算法
      • 5.3单源最短路径–Bellman-Ford算法
      • 5.4 多源最短路径–Floyd-Warshall算法
      • 5.5 几个算法的比较

1.图的基本概念

概念多,但是不难理解,难的算法部分基本都是图解。

图是由顶点集合及顶点间的关系组成的一种数据结构:G = (V, E),其中V为顶点集合,E为边集合

顶点和边:图中结点称为顶点,第i个顶点记作vi。两个顶点vi和vj相关联称作顶点vi和顶点vj之间有一条边,图中的第k条边记作ek,ek = (vi,vj)或<vi,vj>

有向图:在有向图中,顶点对<x, y>是有序的,顶点对<x,y>称为顶点x到顶点y的一条边(弧),<x, y>和<y, x>是两条不同的边,比如下图G3和G4为有向图。
无向图:顶点对(x, y)是无序的,顶点对(x,y)称为顶点x和顶点y相关联的一条边,这条边没有特定方向,(x, y)和(y,x)是同一条边,比如下图G1和G2为无向图。

无向完全图:在有n个顶点的无向图中,若有n * (n-1)/2条边,即任意两个顶点之间有且仅有一条边,则称此图为无向完全图,比如上图G1;
有向完全图:在n个顶点的有向图中,若有n * (n-1)条边,即任意两个顶点之间有且仅有方向相反的边,则称此图为有向完全图,比如上图G4。

邻接顶点:在无向图G中,若 (u, v)是E(G)中的一条边,则称u和v互为邻接顶点,并称边(u,v)依附于顶点u和v;在有向图G中,若 <u, v>是E(G)中的一条边,则称顶点u邻接到v,顶点v邻接自顶点u,并称边<u, v>与顶点u和顶点v相关联。

顶点的度顶点v的度是指与它相关联的边的条数,记作deg(v)。在有向图中,顶点的度等于该顶点的入度与出度之和,其中顶点v的入度是以v为终点的有向边的条数,记作indev(v);顶点v的出度是以v为起始点的有向边的条数,记作outdev(v)。因此:dev(v) = indev(v) + outdev(v)。注意:对于无向图,顶点的度等于该顶点的入度和出度,即dev(v) = indev(v) = outdev(v)。

权值边附带的数据信息
路径:在图G = (V, E)中,若从顶点vi出发有一组边使其可到达顶点vj,则称顶点vi到顶点vj的顶点序列为从顶点vi到顶点vj的路径。
路径长度对于不带权的图,一条路径的路径长度是指该路径上的边的条数
对于带权的图,一条路径的路径长度是指该路径上各个边权值的总和。

简单路径与回路:若路径上各顶点v1,v2,v3,…,vm均不重复,则称这样的路径为简单路径。若路径上第一个顶点v1和最后一个顶点vm重合,则称这样的路径为回路或环。

子图:设图G = {V, E}和图G1 = {V1,E1},若V1属于V且E1属于E,则称G1是G的子图

连通图:在无向图中,若从顶点v1到顶点v2有路径,则称顶点v1与顶点v2是连通的。如果图中任意一对顶点都是连通的,则称此图为连通图

强连通图:在有向图中,若在每一对顶点vi和vj之间都存在一条从vi到vj的路径,也存在一条从vj到vi的路径,则称此图是强连通图。

生成树:一个连通图的最小连通子图称作该图的生成树(形成连通图并且使用的边数量少)。有n个顶点的连通图的生成树有n个顶点和n-1条边

图与树的关系

  1. 树是一种特殊的无环连通图
  2. 树关注的节点(顶点)存储的值。
  3. 图关注的是顶点关系以及边的权值。

2. 图的存储结构

因为图中既有节点,又有边(节点与节点之间的关系),因此,在图的存储中,只需要保存:节点和边关系即可。节点保存比较简单,只需要一段连续空间即可,那边关系该怎么保存呢?

2.1邻接矩阵

因为节点与节点之间的关系就是连通与否,即为0或者1,因此邻接矩阵(二维数组)即是:先用一个数组将定点保存,然后采用矩阵来表示节点与节点之间的关系

注意:

  1. 无向图的邻接矩阵是对称的,第i行(列)元素之和,就是顶点i的度。有向图的邻接矩阵则不一定是对称的,第i行(列)元素之后就是顶点i 的出(入)度
  2. 如果边带有权值,并且两个节点之间是连通的,上图中的边的关系就用权值代替,如果两个顶点不通,则使用无穷大(自己设定值表示无穷)代替。

代码实现

namespace maritx
{
	//V为顶点类型,无论什么类型都可以转换位对于的下标,访问时使用哈希表转换出下标
	//W为边类型,一般为数值类型,MAX_W代表边不存在
	//Direction表示方向,默认无向
	template<class V, class W, W MAX_W = INT_MAX, bool Direction = false>  //默认无向
	class Graph
	{
	private:
		vector<V> _vertexs;  //顶点
		map<V, size_t>  _VIndexMap;  //顶点 :下标
		vector<vector<W>> _matrix;  //邻接矩阵
		
	public:
		typedef Graph<V, W, MAX_W, Direction> self;

		Graph() = default;
		Graph(const V* vertexs, size_t n)
		{
			_vertexs.resize(n);
			for (size_t i = 0; i < n; i++)
			{
				_vertexs[i] = vertexs[i];
				_VIndexMap[vertexs[i]] = i;
			}
			//初始化邻接矩阵
			_matrix.resize(n);
			for (int i = 0; i < n; i++)
			{
				_matrix[i].resize(n, MAX_W);
			}
		}

		size_t GetVIndex(const V& v)
		{
			if (_VIndexMap.count(v))
			{
				return _VIndexMap[v];
			}
			else   //如果没有这个顶点
			{
				throw invalid_argument("不存在的顶点");
				//assert(false);
				return -1;
			}
		}

		void AddEdge(const V& src, const V& dst, const W& w)
		{
			size_t srci = GetVIndex(src);
			size_t dsti = GetVIndex(dst);
			_AddEdge(srci, dsti, w);
		}

		void _AddEdge(int srci, int dsti, const W& w)
		{
			_matrix[srci][dsti] = w;  //有向图只需添加一边
			if (Direction == false)
			{
				_matrix[dsti][srci] = w;
			}
		}
	};
}

2.2邻接表

邻接表:使用数组表示顶点的集合,使用链表表示边的关系

  1. 无向图邻接表存储

  2. 有向图邻接表存储

代码实现:

namespace link_table
{
	template<class W>
	struct Edge
	{
		W _w;  //权值
		int _dsti;
		Edge<W>* _next;
		Edge(int dsti,const W& w)
			:_dsti(dsti)
			,_w(w)
			,_next(nullptr)
		{}
	};

	template<class V, class W, bool Direction = false>  //默认无向
	class Graph
	{
	public:
		typedef Edge<W> Edge;
		Graph(const V* vertexs, size_t n)
		{
			_vertexs.resize(n);
			for (size_t i = 0; i < n; i++)
			{
				_vertexs[i] = vertexs[i];
				_VIndexMap[vertexs[i]] = i;
			}
			//初始化邻接矩阵
			_tables.resize(n, nullptr);
		}

		size_t GetVIndex(const V& v)
		{
			if (_VIndexMap.count(v))
			{
				return _VIndexMap[v];
			}
			else   //如果没有这个顶点
			{
				throw invalid_argument("不存在的顶点");
				//assert(false);
				return -1;
			}
		}

		void AddEdge(const V& src, const V& dst, const W& w)
		{
			size_t srci = GetVIndex(src);
			size_t dsti = GetVIndex(dst);
			Edge* newnode = new Edge(dsti, w);
			newnode->_next = _tables[srci];
			_tables[srci] = newnode; //有向图只需添加一边

			if (Direction == false)
			{
				Edge* newnode = new Edge(srci, w);
				newnode->_next = _tables[dsti];
				_tables[dsti] = newnode;
			}
		}

		void Print()
		{
			// 打印顶点和下标映射关系
			for (size_t i = 0; i < _vertexs.size(); ++i)
			{
				cout << _vertexs[i] << "-" << i << " ";
			}
			cout << endl << endl;
			for (int i = 0; i < _tables.size(); i++)
			{
				Edge* cur = _tables[i];
				if(cur)  cout << i;
				while (cur)
				{
					cout << "->" << cur->_dsti ;
					cur = cur->_next;
				}
				cout << endl;
			}
			
		}

	private:
		vector<V> _vertexs;  //顶点
		map<V, int>  _VIndexMap;  //顶点:下标
		vector<Edge*> _tables;  //邻接表
	};
}

2.3两种实现的比较

  1. 对于邻接矩阵优点是确定AB两点间关系时方便。缺点是对于边数量少的情况,想遍历与某点的出(入)边,需要遍历矩阵的一行(N),空间也会很浪费。
  2. 对于邻接表优点是边少时遍历点的出(入)边,有几条边就走几次缺点是想确定AB两点间关系时需要遍历一次邻接表
  3. 推荐关系复杂,边多时使用邻接矩阵。 关系简单,边少时使用邻接表
  4. 两种存储实现图相关算法差别不大,后面的算法都是基于邻接矩阵的

3.图的遍历

给定一个图G和其中任意一个顶点v0,从v0出发,沿着图中各边访问图中的所有顶点,且每个顶点仅被遍历一次。”遍历”即对结点进行某种操作的意思。
树的遍历是自顶点向下,图的遍历是选定一个顶点作为起点。

3.1 图的广度优先遍历


//遍历
void BFS(const V& v)
{
	size_t n = _vertexs.size();
	size_t srci = GetVIndex(v);
	vector<bool> visited(n);
	queue<size_t> q;
	q.push(srci);
	visited[srci] = true;
	while (!q.empty())
	{
		size_t sz = q.size();
		for (size_t i = 0; i < sz; i++)
		{
			size_t top = q.front();  q.pop();
			cout << _vertexs[top] << " ";
			for (size_t j = 0; j < n; j++)
			{
				if (_matrix[top][j] != MAX_W && visited[j] != true)  //存在并且没有访问过
				{
					q.push(j);
					visited[j] = true;
				}
			}
		}
	}
	//有可能存在从v点出发到不了某些点的情况,这时可遍历vis数组
	for (int i = 0; i < n; i++)
	{
		if (visited[i] == false)
		{
			cout << _vertexs[i] << " ";
		}
	}
	cout << endl;
}

3.2 图的深度优先遍历

void DFS(const V& v)
{
	size_t srci = GetVIndex(v);
	vector<bool> visited(_vertexs.size());
	dfs(srci, visited);
	//有可能存在从v点出发到不了某些点的情况,这时可遍历vis数组
	for (int i = 0; i < n; i++)
	{
		if (visited[i] == false)
		{
			cout << _vertexs[i] << " ";
		}
	}
}

void dfs(size_t srci, vector<bool>& visited)
{
	cout << _vertexs[srci] << " ";
	visited[srci] = true;
	for (int i = 0; i < _vertexs.size(); i++)
	{
		if (_matrix[srci][i] != MAX_W && visited[i] != true)
		{
			dfs(i, visited);
		}
	}
}

4.最小生成树

连通图中的每一棵生成树,都是原图的一个极大无环子图,即:从其中删去任何一条边,生成树就不在连通;反之,在其中引入任何一条新边,都会形成一条回路

若连通图由n个顶点组成,则其生成树必含n个顶点和n-1条边。因此构造最小生成树的准则有三条:

  1. 只能使用图中的边来构造最小生成树
  2. 只能使用恰好n-1条边来连接图中的n个顶点
  3. 选用的n-1条边不能构成回路

构造最小生成树的方法:Kruskal算法和Prim算法。这两个算法都采用了逐步求解的贪心策略

贪心算法:是指在问题求解时,总是做出当前看起来最好的选择。也就是说贪心算法做出的不是整体最优的的选择,而是某种意义上的局部最优解。贪心算法不是对所有的问题都能得到整体最优解,Kruskal算法和Prim算法都可保证最优,两种策略相当容易记忆,证明难度较大,本文不做证明

4.1 Kruskal算法

  1. 每次都选用图中权值最小的边来构造,可以使用堆实现。
  2. 只能选n – 1条边
  3. 选用的边不可构成回路,可以使用并查集来判断环是否存在。
    不了解并查集的可以看这篇文章(很简单的):并查集
    不了解堆的可以看这篇文章:堆

struct Edge   //存储边信息
{
	int _srci;
	int _dsti;
	W _w;
	Edge(int srci, int dsti, W w)
		:_srci(srci)
		,_dsti(dsti)
		,_w(w)
	{}
	bool operator>(const Edge& edge) const
	{
		return _w > edge._w;
	}
};

//Kruskal(克鲁斯卡尔),生成的了返回权值,生成不了返回W默认值
W Kruskal(self& minTree)
{
	//初始化一下最小生成树
	size_t n = _vertexs.size();
	minTree._vertexs = _vertexs;
	minTree._VIndexMap = _VIndexMap;
	minTree._matrix.resize(n);
	for (auto& e : minTree._matrix)
	{
		e.resize(_vertexs.size(), MAX_W);
	}
	UnionFindSet ufs(n);  //并查集
	priority_queue<Edge, vector<Edge>, greater<Edge>> pq;  //堆
	//入边
	for (int i = 0; i < n; i++)
	{
		for (int j = i; j < n; j++)  //无向图只需要一半即可
		{
			if(_matrix[i][j] != MAX_W)
				pq.push(Edge(i, j, _matrix[i][j]));
		}
	}
	//依次选最小边,选n - 1
	size_t esum = 0;
	W ret = 0;
	//不断选最小边即可
	while (!pq.empty())
	{
		Edge e = pq.top();  pq.pop();
		if (!ufs.InSet(e._srci, e._dsti)) //不在一个集合(不构成回路),当前边可选
		{
			minTree.AddEdge(e._srci, e._dsti, e._w);
			esum++;
			ret += e._w;
			ufs.Union(e._srci, e._dsti);
		}
	}
	//判断可否形成最小生成树
	if (esum == n - 1)
	{
		return ret;
	}
	else
	{
		return W();
	}
}

4.2 Prim算法

  1. Kruskal算法侧重边,Prim算法侧重点
  2. 有X,Y两个点集合,X表示已在最小生成树中的点,Y表示还未在最小生成树中的点。故选边时选的是X->Y所有边中的最小权值。
  3. 只能选n – 1条边
  4. 选用的边不可构成回路,只需选的边起点在X,终点在Y即可。
//prim(普利姆算法)
W Prim(self& minTree, const V& src)
{
	//初始化一下最小生成树
	size_t n = _vertexs.size();
	minTree._vertexs = _vertexs;
	minTree._VIndexMap = _VIndexMap;
	minTree._matrix.resize(n);
	for (auto& e : minTree._matrix)
	{
		e.resize(_vertexs.size(), MAX_W);
	}
	size_t srci = GetVIndex(src);  //起点
	//存储边的堆
	priority_queue<Edge, vector<Edge>, greater<Edge>> pq;
	//X和Y集合(不在X就在Y)
	vector<bool> X(n, false);
	X[srci] = true;
	//把X初始点的边入进去
	for (size_t i = 0; i < n; i++)
	{
		if (_matrix[srci][i] != MAX_W)
		{
			pq.push(Edge(srci, i, _matrix[srci][i]));
		}
	}
	//选出边的条数
	size_t esum = 0;
	W ret = 0;
	
	while (!pq.empty())
	{
		Edge e = pq.top();  pq.pop();
		if (X[e._dsti] != true)  //终点在Y,选了不成环
		{
			minTree.AddEdge(e._srci, e._dsti, e._w);		
			esum++;
			ret += e._w;
			X[e._dsti] = true;  
			for (int i = 0; i < n; i++)
			{
				//入边为X-Y,X-X的边没必要入
				if (_matrix[e._dsti][i] != MAX_W && X[i] != true)  
				{
					pq.push(Edge(e._dsti, i, _matrix[e._dsti][i]));
				}
			}
		}
	}
	//判断可否形成最小生成树
	if (esum == n - 1)
	{
		return ret;
	}
	else
	{
		return W();
	}
}

4.3 两个算法比较

  1. Kruskal算法适用于稀疏图,即边少的图,因为该算法需要用堆维护所有的边
  2. Prim算法适用于稠密图,即边多的图,因为该算法的要点在点,并不需要维护所有的边(X-X的边无需维护)。

5.最短路径

5.1两个抽象存储


基于这两个抽象数据结构还原最短路径

//打印最短路径的算法
void PrinrtShotPath(const V& src, const vector<W>& dist, const vector<int>& pPath)
{
	size_t n = _vertexs.size();
	size_t srci = GetVIndex(src);
	for (size_t i = 0; i < n; i++)
	{
		if (i != srci)  //源到源不打印
		{
			size_t par = i;
			vector<size_t> path;  //先从结尾开始添加
			while (par != srci)
			{
				path.push_back(par);
				par = pPath[par];
			}
			path.push_back(srci); 
			reverse(path.begin(), path.end());  //翻转过来
			for (auto pos : path)
			{
				cout << _vertexs[pos] << "->";
			}
			cout << dist[i] << endl;  //打印长度
		}
	}
}

5.2单源最短路径–Dijkstra算法

  1. 贪心,分为两个集合Q和S,其中Q表示已经确定最短路径的顶点集合,S表示未确定最短路径的顶点集合
  2. 在已有最短路径的基础上更新到其他顶点的路径,如果更短就更新,这个操作称为松弛顶点。(建议配合图解看)
  3. Dijkstra算法不适用于带负权的最短路径问题(后面解释)。

图解:

正确性证明:

  1. 边权没有负数
    (1)如果现在遍历 起点->S(未确定最短路径点集合)的边,找到一条s->x(记和为len)的最短,那就可以确定这条是s->x的最短
    (2)因为如果存在s->……(和一定小于len)->x的一条更短路径,那遍历时就会先选中s->……中的顶点进行松弛,而不是选中x进行松弛。
  2. 边权有负数
    (1)遍历 起点->S(未确定最短路径点集合)的边,找到一条s->x(记和为len)的最短,不能确定这条是s->x的最短
    (2)因为可能存在s->……(大于len)->负权->x(小于len),这时候就会更新不到这条真正的最短
//单源最短路径:dijkstra算法(不带负权)
//每次都可以确定一个点的最短路径,然后围绕这个点松弛
//准确性:如果当前选的不是最短,那就不会选中当前,而是其他的点,在松弛操作中更新出最短
//两个输出型参数,dist为路径长,pPath记录路径
void Dijkstra(const V& src, vector<W>& dist, vector<int>& pPath)  
{
	size_t n = _vertexs.size();
	size_t srci = GetVIndex(src);
	//初始化
	dist.resize(n, MAX_W);
	pPath.resize(n, -1);
	dist[srci] = W();
	//Q中为true,说明已经确认最短路径
	vector<bool> Q(n, false);
	//要确定N个顶点的最短,循环N次(其实只要N-1次即可,但为了逻辑就多循环一次)
	for (size_t i = 0; i < n; i++)
	{
		size_t u = srci;
		W min = MAX_W;
		//找到最短的路径,该路径已经可确认为最短
		for (size_t j = 0; j < n; j++)
		{
			if (Q[j] == false && dist[j] < min)
			{
				u = j;
				min = dist[j];
			}
		}
		Q[u] = true;
		//松弛顶点  srci-u  u-v  ->  srci-v
		for (size_t v = 0; v < n; v++)
		{
			if (_matrix[u][v] != MAX_W  && dist[u] + _matrix[u][v] < dist[v])
			{
				dist[v] = dist[u] + _matrix[u][v];
				pPath[v] = u;
			}
		}	
	}
}

5.3单源最短路径–Bellman-Ford算法

  1. Bellman-Ford算法本质是暴力算法。
  2. Bellman-Ford算法可以解决带负权的问题。
  3. Bellman-Ford算法的核心在于松弛顶点。

图解:

负权回路:

//单源最短路径:BellmanFord算法(带负权,注意负权成环)
bool BellmanFord(const V& src, vector<W>& dist, vector<int>& pPath)
{
	size_t n = _vertexs.size();
	size_t srci = GetVIndex(src);
	//初始化
	dist.resize(n, MAX_W);
	pPath.resize(n, -1);
	dist[srci] = W();
	//最多更新n - 1
	for (size_t k = 0; k < n - 1; k++)
	{
		//优化的标志位,如果没有松弛更短,说明所有顶点最短路径都找到了
		bool flag = true;
		//所有顶点做一次松弛
		for (size_t i = 0; i < n; i++)
		{
			for (size_t j = 0; j < n; j++)
			{
				//src - i - j
				if (_matrix[i][j] != MAX_W && dist[i] + _matrix[i][j] < dist[j])  //更新出更短
				{
					dist[j] = dist[i] + _matrix[i][j];
					pPath[j] = i;
					flag = false;
				}
			}
		}
		if (flag)
		{
			break;
		}
	}

	for (size_t i = 0; i < n; i++)
	{
		for (size_t j = 0; j < n; j++)
		{
			//还能更新说明存在负权回路问题
			if (_matrix[i][j] != MAX_W && dist[i] + _matrix[i][j] < dist[j])  //更新出更短
			{
				return false;
			}
		}
	}
	return true;
}

5.4 多源最短路径–Floyd-Warshall算法

  1. 多源最短,即求任意两点的最短路径
  2. 适用于带负权的图
  3. Floyd-Warshall算法的核心是动态规划

图解:

//多源最短路径:FloydWarshall
//vvDist和vvPPath是二维的,vvDist[x]和vvPPath[x]表示以x为起点到各点的最短路径情况
void FloydWarShall(vector<vector<W>>& vvDist, vector<vector<int>>& vvPPath)
{
	size_t n = _vertexs.size();
	vvDist.resize(n);
	vvPPath.resize(n);
	// 初始化权值和路径矩阵
	for (size_t i = 0; i < n; ++i)
	{
		vvDist[i].resize(n, MAX_W);
		vvPPath[i].resize(n, -1);
	}

	//把直接相连的边入进来
	for (size_t i = 0; i < n; i++)
	{
		for (size_t j = 0; j < n; j++)
		{
			if (_matrix[i][j] != MAX_W)
			{
				vvDist[i][j] = _matrix[i][j];
				vvPPath[i][j] = i;
			}
			//i == j,即自己到自己
			if (i == j)
			{
				vvDist[i][j] = W();
			}
		}
	}
	
	//中间经过了(0, k)这些顶点
	for (size_t k = 0; k < n; ++k)
	{
		for (size_t i = 0; i < n; i++)
		{
			for (size_t j = 0; j < n; j++)
			{
				if (vvDist[i][k] != MAX_W && vvDist[k][j] != MAX_W && vvDist[i][k] + vvDist[k][j] < vvDist[i][j])
				{
					vvDist[i][j] = vvDist[i][k] + vvDist[k][j];
					vvPPath[i][j] = vvPPath[k][j];
				}
			}
		}
	}
}

5.5 几个算法的比较

  1. 假设图是稠密图,我们使用矩阵存储。 对这些算法的时间复杂度分析:
    Dijkstra算法:O(N ^ 2)。
    Bellman-Ford算法:O(N ^ 3)。
    Floyd-Warshall算法:O(N ^ 3)。
  2. Dijkstra算法适用于不带负权的图,如果想对不带负权的图找多源最短路径,也可以循环N次Dijkstra算法,效率和Floyd-Warshall差不多。
  3. Bellman-Ford算法和Floyd-Warshall算法都可以解决带负权的问题。
  4. Bellman-Ford算法大多数情况是快于Floyd-Warshall算法的,只是要单源最短且带负权用Bellman-Ford即可。而且针对Bellman-Ford算法可以用SPFA队列优化。(SPFA优化本文不讲,SPFA优化后时间复杂度不变,最坏的情况和朴素Bellman-Ford算法一致)
  5. Floyd-Warshall算法用于解决多源最短路径是效果较好,而且可解决带负权问题

版权声明:本文为博主作者:派小星233原创文章,版权归属原作者,如果侵权,请联系我们删除!

原文链接:https://blog.csdn.net/2301_76269963/article/details/136602163

共计人评分,平均

到目前为止还没有投票!成为第一位评论此文章。

(0)
xiaoxingxing的头像xiaoxingxing管理团队
上一篇 2024年4月1日
下一篇 2024年4月1日

相关推荐