数组中的逆序对:从暴力到归并排序的优化之路(含多语言实现)
off999 2025-09-01 11:18 19 浏览 0 评论
在算法面试中,“数组中的逆序对”是考察分治思想与排序算法应用的经典题目。其核心挑战在于如何在大规模数据下(如size<=2*10^5)高效统计逆序对数量,避免暴力解法的时间瓶颈。本文将从问题本质出发,拆解两种核心解法,深入剖析归并排序在该问题中的优化逻辑,并提供可直接运行的多语言代码,结合实例验证效果,帮助读者掌握分治思想的实际应用。
一、问题定义:什么是逆序对?
1. 概念描述
根据《剑指Offer》题目定义:
在数组中的两个数字,如果前面一个数字大于后面的数字,则这两个数字组成一个逆序对。例如数组{7,5,6,4}中,逆序对为(7,5)、(7,6)、(7,4)、(5,4)、(6,4),共5对。
2. 题目要求
- 输入:一个无重复元素的整数数组;
- 输出:逆序对总数P对1000000007(即10^9+7)取模的结果;
- 数据范围:
- 基础用例(50%):数组长度<=10^4;
- 中等用例(75%):数组长度<=10^5;
- 进阶用例(100%):数组长度<=2*10^5。
3. 示例
- 输入:[1,2,3,4,5,6,7,0]
- 输出:7(逆序对为(1,0)、(2,0)、...、(7,0),共7对)。
二、解法一:暴力解法(直观但低效)
1. 思路逻辑
暴力解法的核心是“逐个比对”:
- 遍历数组中的每个元素data[i](i从0到n-2);
- 对于每个data[i],遍历其后面所有元素data[j](j从i+1到n-1);
- 若data[i] > data[j],则计数count +=1;
- 最终返回count % 1000000007。
2. 代码实现(Python)
# -*- coding:utf-8 -*-
class Solution:
def InversePairs(self, data):
if not data:
return 0
n = len(data)
count = 0
# 外层遍历每个元素
for i in range(n - 1):
# 内层遍历当前元素后面的所有元素
for j in range(i + 1, n):
if data[i] > data[j]:
count += 1
# 取模返回
return count % 1000000007
3. 复杂度分析
维度 分析结果 问题所在 时间复杂度 O(n^2) 对于n=2*10^5,n^2=4*10^10次操作,远超时间限制(通常算法允许10^8次操作/秒),必然超时; 空间复杂度 O(1) 仅用常量额外空间,无问题; 适用场景 小规模数组(n<=10^3) 无法满足题目进阶用例需求;
结论:暴力解法仅适用于理解问题,实际面试或工程中需优化。
三、解法二:归并排序+分治(高效最优解)
1. 核心思想:分治与归并的结合
逆序对的总数可拆分为三部分:
- 左半段内部的逆序对数量;
- 右半段内部的逆序对数量;
- 左半段元素与右半段元素组成的逆序对数量(跨区间逆序对)。
这恰好符合分治思想的“分解-求解-合并”逻辑,而归并排序的“合并有序子数组”过程,可天然统计跨区间逆序对——因为合并前左、右子数组已各自有序,无需重复统计子数组内部的逆序对。
2. 原理拆解(三步曲)
以数组{7,5,6,4}为例,演示完整过程:
步骤1:分解(Divide)
将数组递归拆分为长度为1的子数组(不可再分):
{7,5,6,4} → {7,5} 和 {6,4} → {7}、{5} 和 {6}、{4}。
步骤2:求解子问题(Conquer)
递归统计每个子数组内部的逆序对:
- 子数组{7}和{5}:合并前统计内部逆序对(7,5),计数1;
- 子数组{6}和{4}:合并前统计内部逆序对(6,4),计数1;
- 左半段总逆序对leftCount=1,右半段总逆序对rightCount=1。
步骤3:合并与统计跨区间逆序对(Merge)
合并两个有序子数组时,统计左半段元素大于右半段元素的情况(跨区间逆序对):
以合并{5,7}(左)和{4,6}(右)为例:
- 初始化指针:左子数组末尾i=1(值7)、右子数组末尾j=1(值6)、辅助数组指针index=3;
- 比较7>6:说明左子数组的7与右子数组剩余元素[4,6]都构成逆序对,计数count += j - mid(mid=1,j=1,即1-1+1=2?此处需结合代码逻辑修正:实际mid是左子数组的右边界,右子数组从mid+1开始,故右子数组当前长度为j - mid);
- 将7存入辅助数组,i--;
- 继续比较5>6?不,将6存入辅助数组,j--;
- 比较5>4:计数count += j - mid(j=0,0-1+1=1),将5存入辅助数组,i--;
- 剩余元素4存入辅助数组;
- 跨区间逆序对count=2+1=3。
最终总逆序对:leftCount + rightCount + count = 1+1+3=5,与示例一致。
3. 关键逻辑:如何高效统计跨区间逆序对?
核心在于利用子数组的有序性,避免逐个比对:
假设左子数组L(有序)和右子数组R(有序),从末尾向前遍历(或从前往后,逻辑等价):
- 若L[i] > R[j]:则L[i]与R[j]、R[j-1]、...、R[mid+1](右子数组剩余所有元素)均构成逆序对,数量为j - mid(mid是L的右边界);
- 若L[i] <= R[j]:无逆序对,直接将R[j]存入辅助数组;
- 最后将剩余元素(L或R中未处理的)存入辅助数组,保证辅助数组有序。
4. 代码实现(C++与Python)
4.1 C++实现(从后向前合并)
#include <vector>
using namespace std;
class Solution {
public:
int InversePairs(vector<int> data) {
// 边界处理:空数组返回0
if (data.size() == 0) {
return 0;
}
// 辅助数组:用于存储合并后的有序结果,避免原数组被覆盖
vector<int> copy;
for (int i = 0; i < data.size(); ++i) {
copy.push_back(data[i]);
}
// 调用核心递归函数,最终结果取模1e9+7
return InversePairsCore(data, copy, 0, data.size() - 1) % 1000000007;
}
private:
// 核心递归函数:将data[begin..end]合并排序后存入copy[begin..end],并返回该区间逆序对总数
long InversePairsCore(vector<int>& data, vector<int>& copy, int begin, int end) {
// 终止条件:单个元素无逆序对,直接复制到辅助数组
if (begin == end) {
copy[begin] = data[end];
return 0;
}
// 求中点(右移1位等价于除以2,效率更高)
int mid = (begin + end) >> 1;
// 递归处理左半段:注意参数交换(data为数据源,copy为目标数组)
long leftCount = InversePairsCore(copy, data, begin, mid);
// 递归处理右半段
long rightCount = InversePairsCore(copy, data, mid + 1, end);
// 统计跨区间逆序对
int i = mid; // 左子数组末尾指针
int j = end; // 右子数组末尾指针
int indexCopy = end; // 辅助数组末尾指针
long crossCount = 0; // 跨区间逆序对计数(用long防溢出)
// 从后向前合并两个有序子数组
while (i >= begin && j >= mid + 1) {
if (data[i] > data[j]) {
// 左元素大于右元素:统计逆序对(右子数组剩余长度 = j - mid)
copy[indexCopy--] = data[i--];
crossCount += j - mid;
// 可选:提前取模,防止crossCount过大(题目要求最终取模,此处可省略)
// crossCount %= 1000000007;
} else {
// 左元素小于等于右元素:无逆序对
copy[indexCopy--] = data[j--];
}
}
// 处理左子数组剩余元素
while (i >= begin) {
copy[indexCopy--] = data[i--];
}
// 处理右子数组剩余元素
while (j >= mid + 1) {
copy[indexCopy--] = data[j--];
}
// 返回总逆序对(左+右+跨区间)
return leftCount + rightCount + crossCount;
}
};
4.2 Python实现(从前往后合并)
Python版本采用“从前往后”合并逻辑,核心统计逻辑一致,需注意整数整除和参数交换:
# -*- coding:utf-8 -*-
class Solution:
def InversePairs(self, data):
# 边界处理:空数组返回0
if not data:
return 0
# 辅助数组:复制原数组,用于存储排序结果
temp = data.copy()
# 调用归并排序函数,最终结果取模1e9+7
return self.merge_sort(temp, data, 0, len(data)-1) % 1000000007
def merge_sort(self, temp, data, low, high):
# 终止条件:单个元素无逆序对,复制到目标数组
if low >= high:
temp[low] = data[low]
return 0
# 求中点(Python3需用//保证整数,避免浮点数索引)
mid = (low + high) // 2
# 递归处理左半段:参数交换(data为源,temp为目标)
left_count = self.merge_sort(data, temp, low, mid)
# 递归处理右半段
right_count = self.merge_sort(data, temp, mid+1, high)
# 统计跨区间逆序对
cross_count = 0
i = low # 左子数组起始指针
j = mid + 1 # 右子数组起始指针
index = low # 辅助数组起始指针
# 从前往后合并两个有序子数组
while i <= mid and j <= high:
if data[i] <= data[j]:
# 左元素小:无逆序对,存入辅助数组
temp[index] = data[i]
i += 1
else:
# 左元素大:统计逆序对(左子数组剩余元素数 = mid - i + 1)
temp[index] = data[j]
cross_count += mid - i + 1
j += 1
index += 1
# 处理左子数组剩余元素
while i <= mid:
temp[index] = data[i]
i += 1
index += 1
# 处理右子数组剩余元素
while j <= high:
temp[index] = data[j]
j += 1
index += 1
# 返回总逆序对
return left_count + right_count + cross_count
5. 复杂度分析
维度 分析结果 优势 时间复杂度 O(nlogn) 归并排序的时间复杂度,n=2*10^5时nlogn≈2*10^5*18=3.6*10^6次操作,远低于时间限制; 空间复杂度 O(n) 需辅助数组存储排序结果,空间开销可接受; 适用场景 大规模数组(n<=2*10^5) 完全满足题目所有用例需求;
四、两种解法对比与关键注意事项
1. 解法对比表
对比维度 暴力解法 归并排序分治解法 时间复杂度 O(n^2) O(nlogn) 空间复杂度 O(1) O(n) 适用数据规模 小规模(n<=10^3) 大规模(n<=2*10^5) 核心优势 逻辑直观、无额外空间 高效、可扩展 核心劣势 超时风险高 需辅助数组、递归逻辑较复杂
2. 关键注意事项
- 数据溢出问题:
逆序对总数可能极大(如n=2*10^5时,最大逆序对数量为2*10^5*(2*10^5-1)/2≈2*10^10),远超int类型范围(C++中int约2*10^9)。因此需用long(C++)或Python原生整数(无溢出限制)存储计数,最终取模1000000007。 - 辅助数组的参数交换:
归并排序中,data和copy的角色需交替:递归时将data作为数据源,copy作为目标数组存储排序结果;下次递归时,再以copy为数据源,data为目标数组。这是为了避免覆盖未处理的原数据,保证递归逻辑正确。 - 递归深度问题:
归并排序的递归深度为log2(n),n=2*10^5时递归深度仅18,远低于C++和Python的默认递归栈深度(通常为1000以上),无需担心栈溢出。
五、总结
“数组中的逆序对”问题的核心是将统计逆序对与排序算法结合,通过归并排序的分治思想,将原本O(n^2)的问题优化为O(nlogn)。这种“以排序换效率”的思路,不仅是解决逆序对问题的最优解,还可迁移到类似问题中(如“统计数组中每个元素后面比它小的元素个数”“区间逆序对查询”等)。
对于程序员而言,掌握该解法的关键在于:
- 理解逆序对的“三分法”拆分(左、右、跨区间);
- 掌握归并排序合并过程中统计跨区间逆序对的逻辑;
- 注意数据溢出、辅助数组使用等细节问题。
通过本文的原理拆解与代码实现,相信读者能深入理解分治思想的实际应用,在面对类似算法问题时,能快速想到“排序+统计”的优化方向。
相关推荐
- 电脑自由截屏的快捷键是什么
-
快捷键是ctrl+alt+a,我们可将聊天窗口缩小,放在旁边。然后找到想要截屏的位置,这时我们在截屏旁边,就更加的方便了。在键盘中按下PrintScreenSysRq(简写为PrtSc)键,此快捷...
- windows10精简版官网下载(win10官方精简版下载)
-
精简版的意思的它比原版的功能和软件少了,其实精简版的更适合大众,没有多余的其他必要功能,更快Win10版本主要为四个分别是专业版、家庭版、企业版、教育版,其实除了这四个之外,还有工作站版、LTSB/L...
- cad2008安装失败(Win11安装cad2008安装失败)
-
解决方法:1、右键点击“开始”按钮,选择“程序和功能”;2、然后点击“启用或关闭windows功能”;3、勾选“Microsoft.NETFramework3.5(包括.Net2.0)”后点击确定按钮...
- u盘在电脑上怎么找出来(u盘在电脑上怎么找到)
-
在电脑中找不到u盘,是因为系统没有自动识别出来,手动打开即可,具体的解决步骤如下:1、在桌面上点击我的电脑,右键,管理。2、打开管理界面,点击储存。3、进到储存页面。4、到这一步,也就可以看到了,有这...
- 联想一体机怎么进入bios(联想一体机怎么进入u盘启动)
-
所需工具:联想Lenovo品牌一体机、启动U盘。具体步骤如下:1、联想一体机从U盘启动设置步骤如下重启联想一体机,启动过程中按F1进入BIOS,部分机型则是开机按Enter键,进入之后再按F12选择进...
- 如何装ghost系统盘(ghost装机教程)
-
ghost是不能做系统c盘,它是一种对硬盘和分区制作成映像文件进行备份和恢复的工具软件,是不能进行操作系统安装。这个软件的使用目的是,当我们安装配置好操作系统以后,用ghost软件对c盘进行备份,或者...
- 加密u盘如何格式化(加密u盘如何格式化手机)
-
1,点击系统与安全进入电脑的控制面板界面,点击上方的系统与安全的选项,在系统界面找到最下方的管理工具功能组。2,选中u盘选择管理工具下面的创建并格式化硬盘分区,点击弹出磁盘管理的界面,在这个里面选中你...
- 万能显卡驱动离线版pc(万能显卡驱动离线版)
-
万用驱动是综合各电脑硬件的性能而制做的软件,对于大多数的电脑硬件驱动都好用,但对于少数品牌电脑驱动要求严格的,就不灵了。有的硬件用万能驱动后,使用效果不佳,就是因为没有完全驱动好。所以,知名品牌电脑硬...
- 笔记本windows8系统下载(笔记本电脑系统win8)
-
在电脑上面就可以下载,打开浏览器搜索windous8系统会出现一些下拉选择,选择第一条或者选择有官网字样的,就直接有下载按钮,然后点击下载就可以了win8可以支持现在可以见到的所有Photosho...
- win 11(win 11 25h2)
-
Windows11是由微软公司(Microsoft)开发的操作系统,应用于计算机和平板电脑等设备。于2021年6月24日发布,2021年10月5日发行。Windows11提供了许多创新...
- 手机视频恢复软件免费版下载
-
手机视频删了怎么恢复 一、安卓手机视频恢复 1.打开电脑,移动鼠标,进入互盾安卓恢复大师官网,下载并安装该软件。手机连接至电脑。手机视频删了怎么恢复 2.打开运行互盾安卓恢复大师,在软件界面看到...
- diy电脑装机教程(diy电脑组装步骤)
-
1,看价格。根据自己的预算价格,选择适合该价格的电脑。注意不要以过高的价格买到配置过低的电脑;2,看性能。根据自己需要的电脑性能,以合理的价格购买。注意不要以过高的价格买到配置过低的电脑。电脑的配置如...
欢迎 你 发表评论:
- 一周热门
-
-
抖音上好看的小姐姐,Python给你都下载了
-
全网最简单易懂!495页Python漫画教程,高清PDF版免费下载
-
Python 3.14 的 UUIDv6/v7/v8 上新,别再用 uuid4 () 啦!
-
python入门到脱坑 输入与输出—str()函数
-
宝塔面板如何添加免费waf防火墙?(宝塔面板开启https)
-
Python三目运算基础与进阶_python三目运算符判断三个变量
-
飞牛NAS部署TVGate Docker项目,实现内网一键转发、代理、jx
-
(新版)Python 分布式爬虫与 JS 逆向进阶实战吾爱分享
-
慕ke 前端工程师2024「完整」
-
失业程序员复习python笔记——条件与循环
-
- 最近发表
- 标签列表
-
- python计时 (73)
- python安装路径 (56)
- python类型转换 (93)
- python进度条 (67)
- python吧 (67)
- python的for循环 (65)
- python格式化字符串 (61)
- python静态方法 (57)
- python列表切片 (59)
- python面向对象编程 (60)
- python 代码加密 (65)
- python串口编程 (77)
- python封装 (57)
- python写入txt (66)
- python读取文件夹下所有文件 (59)
- python操作mysql数据库 (66)
- python获取列表的长度 (64)
- python接口 (63)
- python调用函数 (57)
- python多态 (60)
- python匿名函数 (59)
- python打印九九乘法表 (65)
- python赋值 (62)
- python异常 (69)
- python元祖 (57)
