【算法】字典序超详细解析(让你有一种相见恨晚的感觉!)

目录


一、前言

    经常刷算法题的朋友,肯定会经常看到题目中提到 字典序 这样的字眼,或者需要我们通过字典序来解题,由于之前对字典序了解的不太清楚,导致做题的时候总会卡住,所以收集了一些资料来详解字典序。

二、什么是字典序 ?

 ✨字典序概念

    字典序(dictionary order),又称 字母序(alphabetical order),含义是表示英文单词在字典中的先后顺序,在计算机领域中扩展成两个任意字符串的大小关系。 

 举例:
       在字典中,单词是按照首字母在字母表中的顺序进行排列的,比如 alphabeta 之前。而第一个字母相同时,会去比较两个单词的第二个字母在字母表中的顺序,比如 accountadvanced 之前,以此类推。下列单词就是按照字典序进行排列的:

as

aster

astrolabe

astronomy

astrophysics

at

ataman

attack

baa

✨深度理解字典序

  • 在学习 字符串string 的时候,我们肯定接触过两个字符串之间的比较,比如”abc“ < “acb” < “acbd”, 其规则是先比较第一个字母,如果不相等,就直接得到结果,如果相等,就比较下一个字母。
  • 如果两个字符串的长度不相等,但是长的那个字符串包含了短的那个,那长的那个字符串更大(比如”acb” < “acbd”)
  • 在我们进行比较之前,有一个默认的排序规则,就是‘a’ < ‘b’ < ‘c’ < … < ‘z’

举例:

对数字 【1,2,3,4,5,6,7,8,9,10,11,12,13】 按照字典序排列:
结果为 :【1,10,11,12,13,2,3,4,5,6,7,8,9】 

总结: 
      对于两个不同的字符串,从左到右逐个比较它们的字符,

  1. 如果在某个位置上它们的字符不同,则将它们按照该位置上的字符的字母顺序进行排序,即较小的字符排在前面,较大的字符排在后面。
  2. 如果一直比较到其中一个字符串结束,则较短的字符串排在前面;
  3. 如果两个字符串完全相同,则它们的字典序相同。可以将它们看作是按照字母表的顺序进行排列的。

 ✨字典序排序的重要性和应用场景

  1. 数据库索引:在数据库中,使用字典序排序可以加快查询速度。例如,对存储了字符串数据的列进行字典序排序,可以使得数据库在执行字符串比较操作时更高效。
  2. 字符串比较:在字符串比较场景中,字典序排序能够方便地判断两个字符串的大小关系。例如,在编程中,可以使用字典序排序来实现字符串的字母顺序排序、查找最大/最小字符串等操作。
  3. 文件系统排序:文件系统通常使用字典序排序来显示文件和目录的顺序。这样可以使得用户在文件浏览器中更容易找到特定的文件或目录。

 三、常考面试题

      通过上面的讲解,相信大家应该对 字典序 有了一个基础的了解,想要深刻的理解它,还是需要通过题目来理解。

 ✨ 下一个排列

链接:31. 下一个排列 – 力扣(LeetCode) 

 题目分析:

  • 说实话刚看题目我看了半天不知道在说什么,看到评论里面提到字典序算法才知道题意。我们拿题目中的例子1,2,3 ------> 1,3,2来说明:
  1. 首先本题讨论的范围是数字,数字中有一个规则,就是’0‘ < ‘1’ < ‘2’ < … < ‘9’,这与上面的a~z是一样的
  2. 然后就是1,2,3这三个数字,我们能够形成6种不同的组合,即123 < 132 < 213 < 231 < 312 < 321。
  3. OK,如果你看懂前面两点,本题已经完成了。我们要做的就是找到当前数 123 在第二点的六种排列中间的下一个位置是什么,即 132,那么 132 就是答案
  4. 如果要找的数字位于排列组合的最后一个一位,即 321,那么按照题目的第二行,我们就返回最小值 123.

上面从直觉上理解了什么是字典序算法,下面说下怎么转化成程序算法。

何时无解 

首先考虑无解情况,即上面所说的321,这种情况带入字典序算法是无解的,而321这种情况,如果我们单独拆分成3,2,1三个数字,其实是一个降序的过程: 

  • 因此如果当前排列是降序的,则字典序算法无解
  • 换而言之,如果不存在后一个数比前一个数大(2<3,1<2),字典序算法无解
  • 比如下图中的54321抽象出来的五个点,不存在后一个点大于前一个点,因此无解。

 有解的情况

 下面我们拿51432这个例子,来一步步说明如何通过字典序算法得到 52134 这个答案的

 1. 从右往左找,找到第一个右边比左边大的数

  • 首先我们从最右边的2开始,因为2 < 3,因此跳过。然后3 < 4,再跳过。然后发现4 > 1,OK,第一步完成。
  • 然后我们在上图中用黄色点标记这两个数,即1 和 4

2. 找到断点右边所有数中最小的一个 (包括断点)

  • 如果我们直接交换两个黄点,得到 54132,虽然也比 51432 大,但是它不符合字典序算法中的规则,因为这两个数中间还夹杂着别的数 51432 < 52134 < 52143 < 52314 < …… < 54132,字典序算法中必须满足两个数之间不能夹杂其他数才行。
  • 而根据上面列举的,我们知道 52134 才是我i们想要的答案,它的特点就是我们需要把 1 换成2,而不是 4。
  • 而 2 实际上就是4,3,2中间的最小值,因此这一步我们要做的就是找到左边黄点(1)右边的所有数(4,3,2)中间最小的一个数(2),然后我们用 红点标记下来。
  • 之所以要交换1和2,而不是1和3或者1和4,是因为我们现在是要把千位的1换成一个更大中的最小的情况,因此要选2.

3.交换左边的黄点和红点 

  •  上面我们找到了红点(2),因此这一步我们需要讲红点跟左边的黄点(2)进行交换,得到52431

4. 对红点右边的数进行升序排序 

  • 此时,我们交换了千位的1和个位2,变成了52431.但是距离我们的最终答案52134还差了一步,52134 < 52143 < 52314 < 52341 < 52413 < 52431,👈由这个规则可以看到我们的千位和万位已经相同了,但是个十百位还未相同了,而因为我们要找的答案要尽可能小,因此需要进行升序排序,得到52134,大功告成!

 代码:

class Solution {
public:
    void nextPermutation(vector<int>& nums) 
    {
        // 用于判断是否无解  -- 开始默认无解
          bool flag = 0;
        for(int i = nums.size()-1;i>0;i--)
        {
            if(nums[i]>nums[i-1])
            {
                // 有解
                flag = 1;
                // 初始化最小值 为右边断点 
                int min = nums[i],idx = i;
                // 向后找最小值
                for(int j = i+1;j<nums.size();j++)
                {
                    if(nums[j]<min && nums[j] > nums[i-1])
                    {
                        // 更新最小值
                        min = nums[j];
                        // 存储小标,便于后续交换
                        idx = j;
                    }
                }

                // 将右边最小值 和 左边最小值交换  (左右区分,以断点为界线)
                nums[i - 1]^= nums[idx];
                nums[idx]^= nums[i - 1];      // 小技巧  位运算  不用第三个参数来交换两个数
                nums[i - 1]^= nums[idx];

                // 将左边的数据 包括断点进行升序排序
                sort(nums.begin()+i,nums.end());
                break;
            }
        }
        // 确定误解  将动态数组全部进行 升序排序
        if(flag == 0)
        {
            sort(nums.begin(),nums.end());
        }
    }
};

 ✨ 字典数排序

 链接:386. 字典序排数 – 力扣(LeetCode)

class Solution {
public:
    static bool cmp(int a,int b)
    {
        string s1 = to_string(a);
        string s2 = to_string(b);
        // 字典升序
        return s1<s2;
    }
    vector<int> lexicalOrder(int n) 
    {
         vector<int> res;
         while(n!=0)
         {
            res.push_back(n);
            n--;
         }
         sort(res.begin(),res.end(),cmp);
         return res;
    }
};

 ✨ 字典序最小回文串

 链接:2697. 字典序最小回文串 – 力扣(LeetCode)

 题目分析:

     对于两个中心对称的字母 x = s[i] 和 y = s[ n – 1 – i ] , 如果 x != y ,那么只需要修改一次,就可以让这两个字母相同:把 x 改成 y 或者 把 y 改成 x。

  • 如果 x > y , 那么把 x 修改成 y 更好 , 这样字典序更小
  • 如果 x < y , 那么把 y 修改成 x 更好 , 这样字典序更小

 代码:

class Solution {
public:
    string makeSmallestPalindrome(string s) 
    {
        // 双指针 分别指向 头部和尾部
        int begin = 0,end = s.size()-1;

        while(begin<end)
        {
            if(s[begin]!=s[end])
            {
                s[begin] = s[end] = min(s[begin],s[end]);
            }
            begin++;
            end--;
        }
        return s;
    }
};

 四、共勉

  以下就是我对 字典序 的理解,如果有不懂和发现问题的小伙伴,请在评论区说出来哦,同时我还会继续更新对 C++ 的更新,请持续关注我哦!!! 

版权声明:本文为博主作者:sunny-ll原创文章,版权归属原作者,如果侵权,请联系我们删除!

原文链接:https://blog.csdn.net/weixin_45031801/article/details/137335182

共计人评分,平均

到目前为止还没有投票!成为第一位评论此文章。

(0)
扎眼的阳光的头像扎眼的阳光普通用户
上一篇 2024年4月16日
下一篇 2024年4月16日

相关推荐