博客

查找（五）：查找方法的几点说明

2012-11-28 12:18:06

摘要：虽然散列表在关键字和存储位置之间建立了对应关系，理想情况是无须关键字的比较就可找到待查关键字。但是由于冲突的存在，散列表的查找过程仍是一个和关键字比较的过程，不过散列表的平均查找长度比顺序查找、二分查找等完全依赖于关键字比较的查找要小得多。注意： ①由同一个散列函数、不同的解决冲突方法构造的散列表，其平均查找长度是不相同的。 ②散列表的平均查找长度不是结点个数n的函数，而是装填因子α的函数。因此在设计散列表时可选择α以控制散列表的平均查找长度。 ③ α的取值 α越小，产生冲突的机会就小，但α过小，空间的浪费就过多。只要α选择合适，散列表上的平均查找长度就是一个常数，即散列表上查找的平均时间为O(1)。 ④ 散列法与其他查找方法的区别除散列法外，其他查找方法有共同特征为：均是建立在比较关键字的基础上。其中顺序查找是对无序集合的查找，每次关键字的比较结果为=或!=两种可能，其平均时间为O(n)；其余的查找均是对有序集合的查找，每次关键字的比较有=、和三种可能，且每次比较后均能缩小下次的查找范围，故查找速度更快，其平均时间为O(lgn)。而散列法是根据关键字直接求出地址的查找方法，其查找的期望时间为O(1)。阅读全文

分类: 夯实根基
标签: C#

查找（四）：哈希表上的查找

2012-11-20 22:17:51

摘要：在用线性查找和二分查找的过程中需要依据关键字进行若干次的比较判断，确定数据集合中是否存在关键字等于某个给定关键字的记录以及该记录在数据表中的位置，查找效率与比较的次数密切相关。在查找时需要不断进行比较的原因是建立数据表时，只考虑了各记录的关键字之间的相对大小，记录在表中的位置和其关键字无直接关系。而之前介绍的哈希表就记录了存储位置和其关键字之间的某种直接关系，那么使用哈希表进行查找时，就无须比较或只做很少的比较久能直接由关键字找到相应的记录。实际上哈希表也就是为解决查找问题提出的。具体哈希表的内容请参考之前的“散列表”相关文章。下面我将通过实例来说明哈希算法的实现。【例】数字序列{70，30，40，10，80，20，90，100，75，80，45}采用哈希表存放。哈希函数采用除13取余数，哈希冲突解决方法采用链表法。实现该实例的程序如下： class chaintype { private int key; private chaintype next; public int Key { get { return key; } set { key = value; } } public chaintype Next { get { return next; } set { next = value; } } } class SearchArithMetic { /* 除模取余法的哈希函数*/ public int Hash(int key, int Mod) { return key % Mod; } /*在哈希表中插入记录,用链表法解决冲突*/ public bool HashInsert(chaintype[] a, int Key, int Mod) { int i; i = Hash(Key, Mod); chaintype pre; chaintype cur; pre = a[i]; cur = a[i]; while (cur != null cur.Key != Key) { pre = cur; cur = cur.Next; } /* 未查找到时插入该记录在对应的链表尾*/ …… 阅读全文

分类: 夯实根基
标签: C#

查找（三）：分块查找

2012-11-15 17:48:15

摘要：分块查找(Blocking Search)又称索引顺序查找。它是一种性能介于顺序查找和二分查找之间的查找方法。一、二分查找表存储结构二分查找表由分块有序的线性表和索引表组成。（1）分块有序的线性表表R[1..n]均分为b块，前b-1块中结点个数为，第b块的结点数小于等于s；每一块中的关键字不一定有序，但前一块中的最大关键字必须小于后一块中的最小关键字，即表是分块有序的。（2）索引表抽取各块中的最大关键字及其起始位置构成一个索引表ID[l..b]，即： IDi中存放第i块的最大关键字及该块在表R中的起始位置。由于表R是分块有序的，所以索引表是一个递增有序表。【例】下图就是满足上述要求的存储结构，其中R只有18个结点，被分成3块，每块中有6个结点，第一块中最大关键字22小于第二块中最小关键字24，第二块中最大关键字48小于第三块中最小关键字49。　　　　二、分块查找的基本思想分块查找的基本思想是：（1）首先查找索引表索引表是有序表，可采用二分查找或顺序查找，以确定待查的结点在哪一块。（2）然后在已确定的块中进行顺序查找由于块内无序，只能用顺序查找。三、分块查找示例【例】对于上例的存储结构：（1）查找关键字等于给定值K=24的结点因为索引表小，不妨用顺序查找方法查找索引表。即首先将K依次和索引表中各关键字比较，直到找到第1个关键宇大小等于K的结点，由于K48，所以关键字为24的结点若存在的话，则必定在第二块中；然后，由ID[2].addr找到第二块的起始地址7，从该地址开始在R[7..12]中进行顺序查找，直到R[11].key=K为止。（2）查找关键字等于给定值K=30的结点先确定第二块，然后在该块中查找。因该块中查找不成功，故说明表中不存在关键字为30的结点。四、算法分析（1）平均查找长度ASL 分块查找是两次查找过程。整个查找过程的平均查找长度是两次查找的平均查找长度之和。 ①以二分查找来确定块，分块查找成功时的平均查找长度 ASLblk=ASLbn+ASLsq≈lg(b+1)-1+(s+1)/2≈lg(n/s+1)+s/2 ②以顺序查找确定块，分块查找成功时的平均查找长度 ASL'blk=(b+1)/2+(s+1)/2=(s2+2s+n)/(2s) 当 s= 时ASL'blk取极小值 +1 ，即当采用顺序查找确…… 阅读全文

分类: 夯实根基
标签: C#

查找（二）：二分查找

2012-11-09 16:58:56

摘要：一、二分查找(Binary Search) 　二分查找又称折半查找，它是一种效率较高的查找方法。二分查找要求：线性表是有序表，即表中结点按关键字有序，并且要用向量作为表的存储结构。不妨设有序表是递增有序的。二、二分查找的基本思想二分查找的基本思想是：（设R[low..high]是当前的查找区间）（1）首先确定该区间的中点位置：（2）然后将待查的K值与R[mid].key比较：若相等，则查找成功并返回此位置，否则须确定新的查找区间，继续二分查找，具体方法如下： ①若R[mid].keyK，则由表的有序性可知R[mid..n].keys均大于K，因此若表中存在关键字等于K的结点，则该结点必定是在位置mid左边的子表R[1..mid-1]中，故新的查找区间是左子表R[1..mid-1]。 ②类似地，若R[mid].keyK，则要查找的K必在mid的右子表R[mid+1..n]中，即新的查找区间是右子表R[mid+1..n]。下一次查找是针对新的查找区间进行的。因此，从初始的查找区间R[1..n]开始，每经过一次与当前查找区间的中点位置上的结点关键字的比较，就可确定查找是否成功，不成功则当前的查找区间就缩小一半。这一过程重复直至找到关键字为K的结点，或者直至当前的查找区间为空(即查找失败)时为止。三、二分查找算法 public int BinSearch(SeqListint R, int Key) { int low = 0, high = R.GetLength() - 1, mid;//置当前查找区间上、下界的初值 while (low = high) { //当前查找区间R[low..high]非空 mid = low + ((high - low) / 2) ; if (R.Data[mid] == Key) return mid; //查找成功返回 if (R.Data[mid] Key) high = mid - 1; //继续在R[low..mid-1]中查找 else low = mid + 1; //继续在R[mid+1..high]中查找 } return -1; //当lowhigh时表示查找区间为空，查找失败 } 四、二分查找判定树二分查找过程可用二叉树来描述：把当前查找区间…… 阅读全文

分类: 夯实根基
标签: C#

查找（一）：顺序查找

2012-11-05 23:30:32

摘要：在表的组织方式中，线性表是最简单的一种。顺序查找是一种最简单的查找方法。一、顺序查找的基本思想基本思想是：从表的一端开始，顺序扫描线性表，依次将扫描到的结点关键宇和给定值K相比较。若当前扫描到的结点关键字与K相等，则查找成功；若扫描结束后，仍未找到关键字等于K的结点，则查找失败。顺序查找方法既适用于线性表的顺序存储结构，也适用于线性表的链式存储结构（使用单链表作存储结构时，扫描必须从第一个结点开始）。二、基于顺序结构的顺序查找算法我们先来看顺序查找的算法程序 public int SeqSearch(SeqListint R, int Key) { //顺序表R中顺序查找关键字为Key //成功时返回找到的结点位置，失败时返回0 int i; R.Data[R.GetLength()] = Key; //设置哨兵 for (i = 0; R.Data[i] != Key; i++) ; //若i为n，表示查找失败，否则R[n]是要找的结点 if (i == R.Length) return -1; else return i; } 注意： ① 算法中监视哨R.Data[R.GetLength()]的作用为了在for循环中省去判定防止下标越界的条件i≥1，从而节省比较的时间。 ②成功时的顺序查找的平均查找长度：在等概率情况下，pi=1/n(1≤i≤n)，故成功的平均查找长度为(n+…+2+1)/n=(n+1)/2，即查找成功时的平均比较次数约为表长的一半。若K值不在表中，则须进行n+1次比较之后才能确定查找失败。 ③表中各结点的查找概率并不相等的ASL 【例】在由全校学生的病历档案组成的线性表中，体弱多病同学的病历的查找概率必然高于健康同学的病历，由于上式的ASLsq在pn≥pn-1≥…≥p2≥p1时达到最小值。若事先知道表中各结点的查找概率不相等和它们的分布情况，则应将表中结点按查找概率由小到大地存放，以便提高顺序查找的效率。为了提高查找效率，对算法SeqSearch做如下修改：每当查找成功，就将找到的结点和其后继(若存在)结点交换。这样，使得查找概率大的结点在查找过程中不断往后移，便于在以后的查找中减少比较次数。 ④顺序查找的优点算法简单，且对表的结构无任何要求，无论是用向量还是用链表来存放结点，也无论结…… 阅读全文

分类: 夯实根基
标签: C#

图（七）：拓扑排序

2012-10-28 15:06:10

摘要：一、概述对一个有向无环图(Directed Acyclic Graph简称DAG)G进行拓扑排序，是将G中所有顶点排成一个线性序列，使得图中任意一对顶点u和v，若u，v ∈E(G)，则u在线性序列中出现在v之前。通常，这样的线性序列称为满足拓扑次序(TopoiSicai Order)的序列，简称拓扑序列。注意： ①若将图中顶点按拓扑次序排成一行，则图中所有的有向边均是从左指向右的。 ②若图中存在有向环，则不可能使顶点满足拓扑次序。 ③一个DAG的拓扑序列通常表示某种方案切实可行。【例】一本书的作者将书本中的各章节学习作为顶点，各章节的先学后修关系作为边，构成一个有向图。按有向图的拓扑次序安排章节，才能保证读者在学习某章节时，其预备知识已在前面的章节里介绍过。 ④一个DAG可能有多个拓扑序列。【例】对图G9进行拓扑排序，至少可得到如下的两个(实际远不止两个)拓扑序列：C0，C1，C2，C4，C3，C5，C7，C8，C6和C0，C7，C9，C1，C4，C2，C3，C6，C5。　　 ⑤当有向图中存在有向环时，拓扑序列不存在【例】下面(a)图中的有向环重排后如(b)所示，有向边v3，vl和其它边反向。若有向图被用来表示某项工程实施方案或某项工作计划，则找不到该图的拓扑序列(即含有向环)，就意味着该方案或计划是不可行的。　　二、无前趋的顶点优先的拓扑排序方法该方法的每一步总是输出当前无前趋(即人度为零)的顶点，其抽象算法可描述为： NonPreFirstTopSort(G){//优先输出无前趋的顶点 while(G中有人度为0的顶点)do{ 从G中选择一个人度为0的顶点v且输出之；从G中删去v及其所有出边； } if(输出的顶点数目|V(G)|) //若此条件不成立，则表示所有顶点均已输出，排序成功。 Error(G中存在有向环，排序失败！)； } 注意：无前趋的顶点优先的拓扑排序算法在具体存储结构下，为便于考察每个顶点的人度，可保存各顶点当前的人度。为避免每次选入度为0的顶点时扫描整个存储空间，可设一个栈或队列暂存所有入度为零的顶点：在开始排序前，扫描对应的存储空间，将人度为零的顶点均入栈(队)。以后每次选人度为零的顶点时，只需做出栈(队)操作即可。三、无后继的顶点优先拓扑排序方法 1、思想方法 ** 　该方法的每一步均是输出当前无后继…… 阅读全文

分类: 夯实根基
标签: C#

图（六）：最小生成树

2012-10-21 19:43:16

摘要：一、概述　　对于连通的带权图(连通网)G，其生成树也是带权的。生成树T各边的权值总和称为该树的权，记作：这里: TE表示T的边集 w(u，v)表示边(u，v)的权。权最小的生成树称为G的最小生成树(Minimum SpannirngTree)。最小生成树可简记为MST。二、最小生成树的应用最小生成树有许多重要的应用。【例】网络G表示n各城市之间的通信线路网线路（其中顶点表示城市，边表示两个城市之间的通信线路，边上的权值表示线路的长度或造价。可通过求该网络的最小生成树达到求解通信线路或总代价最小的最佳方案。三、最小生成树性质（MST性质）（1）MST性质最小生成树性质：设G=(V，E)是一个连通网络，U是顶点集V的一个真子集。若(u，v)是G中所有的一个端点在U(u∈U)里、另一个端点不在U(即v∈V-U)里的边中，具有最小权值的一条边，则一定存在G的一棵最小生成树包括此边(u，v)。（2）MST性质的证明为方便说明，先作以下约定： ①将集合U中的顶点看作是红色顶点，②而V-U中的顶点看作是蓝色顶点，③连接红点和蓝点的边看作是紫色边，④权最小的紫边称为轻边(即权重最轻的边)。于是，MST性质中所述的边(u，v)就可简称为轻边。用反证法证明MST性质：假设G中任何一棵MST都不含轻边(u，v)。则若T是G的一棵MST，则它不含此轻边。由于T是包含了G中所有顶点的连通图，所以T中必有一条从红点u到蓝点v的路径P，且P上必有一条紫边(u'，v')连接红点集和蓝点集，否则u和v不连通。当把轻边(u，v)加入树T时，该轻边和P必构成了一个回路。删去紫边(u'，v')后回路亦消除，由此可得另一生成树T'。 T'和T的差别仅在于T'用轻边(u，v)取代了T中权重可能更大的紫边(u'，v')。因为w(u，v)≤w(u'，v')，所以w(T')=w(T)+w(u，v)-w(u'，v')≤w(T)。故T'亦是G的MST，它包含边(u，v)，这与假设矛盾。所以，MST性质成立。四、求MST的一般算法描述求MST的一般算法可描述为：针对图G，从空树T开始，往集合T中逐条选择并加入n-1条安全边(u，v)，最终生成一棵含n-1条边的MST。当一条边(u，v)加入T时，必须保证T∪{(u，v)}仍是MST的子集，我们将这样的边称为T的安全边。用伪代码可将算…… 阅读全文

分类: 夯实根基
标签: C#

图（五）：所有顶点间的最短路径

2012-10-18 14:00:43

摘要：问题描述对每一对顶点vi ≠ vj，求出vi与vj之间的最短路径和最短路径长度 Floyd算法 Floyd(Floyd-Warshall)算法又称为插点法，是一种利用动态规划的思想寻找给定的加权图中多源点之间最短路径的算法，该算法名称以创始人之一罗伯特·弗洛伊德命名。 Floyd-Warshall算法是动态规划的一个例子，即该算法中的前面的运算都会给予后面结果一些影响，下一步得出的结果可能会依赖于上一步得出的结果，运算的整个过程需要层层迭代，最终得出结果。核心思路松弛技术：对在i和j之间的所有其他点进行一次松弛（寻找中间点）状态转移方程： map[i][j]=min{map[i][k]+map[k][j],map[i][j]} 具体运算过程 ①建立两个辅助数组： a[ i ][ j ]，存储i到j之间的最小路径长度 path[ i ][ j ]，存储i到j所经历的中间顶点 ②辅助数组初始化：使用map[i][j]来进行初始化若顶点 i能到达顶点 j，使得a[i][j]=map[i][j]，path[i][j] = i 若无法到达，使得a[i][j] = MAX，path[i][j]=-1(作为标记) ③借助状态转移方程对a[][]中所有路径进行松弛若图有k个顶点，则需遍历k次，使得每个顶点都可用作中间点进行一次松弛判断核心代码： for(int k=0; ksMap.num; k++) for(int j=0; jsMap.num; j++) for(int i=0; isMap.num; i++) ④在更新完成之后，所得的两个矩阵即为结果伪代码实现阅读全文

分类: 夯实根基
标签: C#

图（四）：单源最短路径

2012-10-17 17:30:14

摘要：单源最短路径问题：已知有向带权图(简称有向网)G=(V，E)，找出从某个源点s∈V到V中其余各顶点的最短路径。一、Dijkstra算法的引入由Dijkstra提出的一种按路径长度递增序产生各顶点最短路径的算法，其算法的基本思想是：设置两个顶点集合T和S，集合S中存放己经找到最短路径的顶点，集合T中存放当前还未找到最短路径的顶点。初始状态时，集合S中只包含源点v0，然后不断从集合T中选取到源点v0路径长度最短的顶点w加入集合S，集合S中每加入一个新的顶点w，都要修改顶点v0到集合T中剩余顶点的最短路径长度值，集合T中各顶点新的最短路径长度值为原来最短路径长度值与顶点w的最短路径长度加上w到该顶点的路径长度值中的较小值。此过程不断重复，直到集合T的顶点全部加入集合S为止。【例】在有向网G8中，假定以顶点0为源点，则它则其余各顶点的最短路径按路径递增序排列如下表所示 **　　　　** 二、算法的具体描述设S为最短距离已确定的顶点集（看作红点集），V-S是最短距离尚未确定的顶点集（看作蓝点集）。 ①初始化初始化时，只有源点s的最短距离是已知的(SD(s)=0)，故红点集S=，蓝点集为空。 ②重复以下工作，按路径长度递增次序产生各顶点最短路径在当前蓝点集中选择一个最短距离最小的蓝点来扩充红点集，以保证算法按路径长度递增的次序产生各顶点的最短路径。当蓝点集中仅剩下最短距离为∞的蓝点，或者所有蓝点已扩充到红点集时，s到所有顶点的最短路径就求出来了。注意： ①若从源点到蓝点的路径不存在，则可假设该蓝点的最短路径是一条长度为无穷大的虚拟路径。 ②从源点s到终点v的最短路径简称为v的最短路径；s到v的最短路径长度简称为v的最短距离，并记为SD(v)。在蓝点集中选择一个最短距离最小的蓝点k来扩充红点集根据按长度递增序产生最短路径的思想，当前最短距离最小的蓝点k的最短路径是：源点，红点1，红点2，…，红点n，蓝点k 距离为：源点到红点n最短距离+红点n,蓝点k边长为求解方便，设置一个向量D[0．．n-1]，对于每个蓝点v∈ V-S，用D[v]记录从源点s到达v且除v外中间不经过任何蓝点(若有中间点，则必为红点)的最短路径长度（简称估计距离）。若k是蓝点集中估计距离最小的顶点，则k的估计距离就是最短距离，即若D[k]=min{D[i] i∈V-S}，则D[k]…… 阅读全文

分类: 夯实根基
标签: C#

图（三）：图的遍历

2012-10-16 13:33:39

摘要：一、深度优先搜索（1）深度优先遍历的递归定义假设给定图G的初态是所有顶点均未曾访问过。在G中任选一顶点v为初始出发点(源点)，则深度优先遍历可定义如下：首先访问出发点v，并将其标记为已访问过；然后依次从v出发搜索v的每个邻接点w。若w未曾访问过，则以w为新的出发点继续进行深度优先遍历，直至图中所有和源点v有路径相通的顶点(亦称为从源点可达的顶点)均已被访问为止。若此时图中仍有未访问的顶点，则另选一个尚未访问的顶点作为新的源点重复上述过程，直至图中所有顶点均已被访问为止。图的深度优先遍历类似于树的前序遍历。采用的搜索方法的特点是尽可能先对纵深方向进行搜索。这种搜索方法称为深度优先搜索(Depth-First Search)。相应地，用此方法遍历图就很自然地称之为图的深度优先遍历。（2）深度优先搜索过程设x是当前被访问顶点，在对x做过访问标记后，选择一条从x出发的未检测过的边(x，y)。若发现顶点y已访问过，则重新选择另一条从x出发的未检测过的边，否则沿边(x，y)到达未曾访问过的y，对y访问并将其标记为已访问过；然后从y开始搜索，直到搜索完从y出发的所有路径，即访问完所有从y出发可达的顶点之后，才回溯到顶点x，并且再选择一条从x出发的未检测过的边。上述过程直至从x出发的所有边都已检测过为止。此时，若x不是源点，则回溯到在x之前被访问过的顶点；否则图中所有和源点有路径相通的顶点(即从源点可达的所有顶点)都已被访问过，若图G是连通图，则遍历过程结束，否则继续选择一个尚未被访问的顶点作为新源点，进行新的搜索过程。（3）邻接表深度优先算法 //深度优先遍历算法 public NodeT[] DFSAL(NodeT v) { int i = GetIndex(v); int m = 0; NodeT[] nodes = new NodeT[GetNumOfVertex()]; visited[i] = true; Stack st = new Stack(); st.Push(i); while (st.Count 0) { int k = (int)st.Pop(); nodes[m++] = adjList[k].Data; adjListNodeT p = adjList[k].FirstAdj; while (p != …… 阅读全文

分类: 夯实根基
标签: C#

XIAOSUO 记录个人学习的足迹

查找（五）：查找方法的几点说明

查找（四）：哈希表上的查找

查找（三）：分块查找

查找（二）：二分查找

查找（一）：顺序查找

图（七）：拓扑排序

图（六）：最小生成树

图（五）：所有顶点间的最短路径

图（四）：单源最短路径

图（三）：图的遍历

About

随笔档案

随笔分类

随笔标签

推荐随笔

最新随笔

收藏链接