数组中的逆序对:从暴力到归并排序的优化之路(含多语言实现)
off999 2025-09-01 11:18 14 浏览 0 评论
在算法面试中,“数组中的逆序对”是考察分治思想与排序算法应用的经典题目。其核心挑战在于如何在大规模数据下(如size<=2*10^5)高效统计逆序对数量,避免暴力解法的时间瓶颈。本文将从问题本质出发,拆解两种核心解法,深入剖析归并排序在该问题中的优化逻辑,并提供可直接运行的多语言代码,结合实例验证效果,帮助读者掌握分治思想的实际应用。
一、问题定义:什么是逆序对?
1. 概念描述
根据《剑指Offer》题目定义:
在数组中的两个数字,如果前面一个数字大于后面的数字,则这两个数字组成一个逆序对。例如数组{7,5,6,4}中,逆序对为(7,5)、(7,6)、(7,4)、(5,4)、(6,4),共5对。
2. 题目要求
- 输入:一个无重复元素的整数数组;
- 输出:逆序对总数P对1000000007(即10^9+7)取模的结果;
- 数据范围:
- 基础用例(50%):数组长度<=10^4;
- 中等用例(75%):数组长度<=10^5;
- 进阶用例(100%):数组长度<=2*10^5。
3. 示例
- 输入:[1,2,3,4,5,6,7,0]
- 输出:7(逆序对为(1,0)、(2,0)、...、(7,0),共7对)。
二、解法一:暴力解法(直观但低效)
1. 思路逻辑
暴力解法的核心是“逐个比对”:
- 遍历数组中的每个元素data[i](i从0到n-2);
- 对于每个data[i],遍历其后面所有元素data[j](j从i+1到n-1);
- 若data[i] > data[j],则计数count +=1;
- 最终返回count % 1000000007。
2. 代码实现(Python)
# -*- coding:utf-8 -*-
class Solution:
def InversePairs(self, data):
if not data:
return 0
n = len(data)
count = 0
# 外层遍历每个元素
for i in range(n - 1):
# 内层遍历当前元素后面的所有元素
for j in range(i + 1, n):
if data[i] > data[j]:
count += 1
# 取模返回
return count % 1000000007
3. 复杂度分析
维度 分析结果 问题所在 时间复杂度 O(n^2) 对于n=2*10^5,n^2=4*10^10次操作,远超时间限制(通常算法允许10^8次操作/秒),必然超时; 空间复杂度 O(1) 仅用常量额外空间,无问题; 适用场景 小规模数组(n<=10^3) 无法满足题目进阶用例需求;
结论:暴力解法仅适用于理解问题,实际面试或工程中需优化。
三、解法二:归并排序+分治(高效最优解)
1. 核心思想:分治与归并的结合
逆序对的总数可拆分为三部分:
- 左半段内部的逆序对数量;
- 右半段内部的逆序对数量;
- 左半段元素与右半段元素组成的逆序对数量(跨区间逆序对)。
这恰好符合分治思想的“分解-求解-合并”逻辑,而归并排序的“合并有序子数组”过程,可天然统计跨区间逆序对——因为合并前左、右子数组已各自有序,无需重复统计子数组内部的逆序对。
2. 原理拆解(三步曲)
以数组{7,5,6,4}为例,演示完整过程:
步骤1:分解(Divide)
将数组递归拆分为长度为1的子数组(不可再分):
{7,5,6,4} → {7,5} 和 {6,4} → {7}、{5} 和 {6}、{4}。
步骤2:求解子问题(Conquer)
递归统计每个子数组内部的逆序对:
- 子数组{7}和{5}:合并前统计内部逆序对(7,5),计数1;
- 子数组{6}和{4}:合并前统计内部逆序对(6,4),计数1;
- 左半段总逆序对leftCount=1,右半段总逆序对rightCount=1。
步骤3:合并与统计跨区间逆序对(Merge)
合并两个有序子数组时,统计左半段元素大于右半段元素的情况(跨区间逆序对):
以合并{5,7}(左)和{4,6}(右)为例:
- 初始化指针:左子数组末尾i=1(值7)、右子数组末尾j=1(值6)、辅助数组指针index=3;
- 比较7>6:说明左子数组的7与右子数组剩余元素[4,6]都构成逆序对,计数count += j - mid(mid=1,j=1,即1-1+1=2?此处需结合代码逻辑修正:实际mid是左子数组的右边界,右子数组从mid+1开始,故右子数组当前长度为j - mid);
- 将7存入辅助数组,i--;
- 继续比较5>6?不,将6存入辅助数组,j--;
- 比较5>4:计数count += j - mid(j=0,0-1+1=1),将5存入辅助数组,i--;
- 剩余元素4存入辅助数组;
- 跨区间逆序对count=2+1=3。
最终总逆序对:leftCount + rightCount + count = 1+1+3=5,与示例一致。
3. 关键逻辑:如何高效统计跨区间逆序对?
核心在于利用子数组的有序性,避免逐个比对:
假设左子数组L(有序)和右子数组R(有序),从末尾向前遍历(或从前往后,逻辑等价):
- 若L[i] > R[j]:则L[i]与R[j]、R[j-1]、...、R[mid+1](右子数组剩余所有元素)均构成逆序对,数量为j - mid(mid是L的右边界);
- 若L[i] <= R[j]:无逆序对,直接将R[j]存入辅助数组;
- 最后将剩余元素(L或R中未处理的)存入辅助数组,保证辅助数组有序。
4. 代码实现(C++与Python)
4.1 C++实现(从后向前合并)
#include <vector>
using namespace std;
class Solution {
public:
int InversePairs(vector<int> data) {
// 边界处理:空数组返回0
if (data.size() == 0) {
return 0;
}
// 辅助数组:用于存储合并后的有序结果,避免原数组被覆盖
vector<int> copy;
for (int i = 0; i < data.size(); ++i) {
copy.push_back(data[i]);
}
// 调用核心递归函数,最终结果取模1e9+7
return InversePairsCore(data, copy, 0, data.size() - 1) % 1000000007;
}
private:
// 核心递归函数:将data[begin..end]合并排序后存入copy[begin..end],并返回该区间逆序对总数
long InversePairsCore(vector<int>& data, vector<int>& copy, int begin, int end) {
// 终止条件:单个元素无逆序对,直接复制到辅助数组
if (begin == end) {
copy[begin] = data[end];
return 0;
}
// 求中点(右移1位等价于除以2,效率更高)
int mid = (begin + end) >> 1;
// 递归处理左半段:注意参数交换(data为数据源,copy为目标数组)
long leftCount = InversePairsCore(copy, data, begin, mid);
// 递归处理右半段
long rightCount = InversePairsCore(copy, data, mid + 1, end);
// 统计跨区间逆序对
int i = mid; // 左子数组末尾指针
int j = end; // 右子数组末尾指针
int indexCopy = end; // 辅助数组末尾指针
long crossCount = 0; // 跨区间逆序对计数(用long防溢出)
// 从后向前合并两个有序子数组
while (i >= begin && j >= mid + 1) {
if (data[i] > data[j]) {
// 左元素大于右元素:统计逆序对(右子数组剩余长度 = j - mid)
copy[indexCopy--] = data[i--];
crossCount += j - mid;
// 可选:提前取模,防止crossCount过大(题目要求最终取模,此处可省略)
// crossCount %= 1000000007;
} else {
// 左元素小于等于右元素:无逆序对
copy[indexCopy--] = data[j--];
}
}
// 处理左子数组剩余元素
while (i >= begin) {
copy[indexCopy--] = data[i--];
}
// 处理右子数组剩余元素
while (j >= mid + 1) {
copy[indexCopy--] = data[j--];
}
// 返回总逆序对(左+右+跨区间)
return leftCount + rightCount + crossCount;
}
};
4.2 Python实现(从前往后合并)
Python版本采用“从前往后”合并逻辑,核心统计逻辑一致,需注意整数整除和参数交换:
# -*- coding:utf-8 -*-
class Solution:
def InversePairs(self, data):
# 边界处理:空数组返回0
if not data:
return 0
# 辅助数组:复制原数组,用于存储排序结果
temp = data.copy()
# 调用归并排序函数,最终结果取模1e9+7
return self.merge_sort(temp, data, 0, len(data)-1) % 1000000007
def merge_sort(self, temp, data, low, high):
# 终止条件:单个元素无逆序对,复制到目标数组
if low >= high:
temp[low] = data[low]
return 0
# 求中点(Python3需用//保证整数,避免浮点数索引)
mid = (low + high) // 2
# 递归处理左半段:参数交换(data为源,temp为目标)
left_count = self.merge_sort(data, temp, low, mid)
# 递归处理右半段
right_count = self.merge_sort(data, temp, mid+1, high)
# 统计跨区间逆序对
cross_count = 0
i = low # 左子数组起始指针
j = mid + 1 # 右子数组起始指针
index = low # 辅助数组起始指针
# 从前往后合并两个有序子数组
while i <= mid and j <= high:
if data[i] <= data[j]:
# 左元素小:无逆序对,存入辅助数组
temp[index] = data[i]
i += 1
else:
# 左元素大:统计逆序对(左子数组剩余元素数 = mid - i + 1)
temp[index] = data[j]
cross_count += mid - i + 1
j += 1
index += 1
# 处理左子数组剩余元素
while i <= mid:
temp[index] = data[i]
i += 1
index += 1
# 处理右子数组剩余元素
while j <= high:
temp[index] = data[j]
j += 1
index += 1
# 返回总逆序对
return left_count + right_count + cross_count
5. 复杂度分析
维度 分析结果 优势 时间复杂度 O(nlogn) 归并排序的时间复杂度,n=2*10^5时nlogn≈2*10^5*18=3.6*10^6次操作,远低于时间限制; 空间复杂度 O(n) 需辅助数组存储排序结果,空间开销可接受; 适用场景 大规模数组(n<=2*10^5) 完全满足题目所有用例需求;
四、两种解法对比与关键注意事项
1. 解法对比表
对比维度 暴力解法 归并排序分治解法 时间复杂度 O(n^2) O(nlogn) 空间复杂度 O(1) O(n) 适用数据规模 小规模(n<=10^3) 大规模(n<=2*10^5) 核心优势 逻辑直观、无额外空间 高效、可扩展 核心劣势 超时风险高 需辅助数组、递归逻辑较复杂
2. 关键注意事项
- 数据溢出问题:
逆序对总数可能极大(如n=2*10^5时,最大逆序对数量为2*10^5*(2*10^5-1)/2≈2*10^10),远超int类型范围(C++中int约2*10^9)。因此需用long(C++)或Python原生整数(无溢出限制)存储计数,最终取模1000000007。 - 辅助数组的参数交换:
归并排序中,data和copy的角色需交替:递归时将data作为数据源,copy作为目标数组存储排序结果;下次递归时,再以copy为数据源,data为目标数组。这是为了避免覆盖未处理的原数据,保证递归逻辑正确。 - 递归深度问题:
归并排序的递归深度为log2(n),n=2*10^5时递归深度仅18,远低于C++和Python的默认递归栈深度(通常为1000以上),无需担心栈溢出。
五、总结
“数组中的逆序对”问题的核心是将统计逆序对与排序算法结合,通过归并排序的分治思想,将原本O(n^2)的问题优化为O(nlogn)。这种“以排序换效率”的思路,不仅是解决逆序对问题的最优解,还可迁移到类似问题中(如“统计数组中每个元素后面比它小的元素个数”“区间逆序对查询”等)。
对于程序员而言,掌握该解法的关键在于:
- 理解逆序对的“三分法”拆分(左、右、跨区间);
- 掌握归并排序合并过程中统计跨区间逆序对的逻辑;
- 注意数据溢出、辅助数组使用等细节问题。
通过本文的原理拆解与代码实现,相信读者能深入理解分治思想的实际应用,在面对类似算法问题时,能快速想到“排序+统计”的优化方向。
相关推荐
- Python设计模式 第 13 章 中介者模式(Mediator Pattern)
-
在行为型模式中,中介者模式是解决“多对象间网状耦合”问题的核心模式。它就像“机场调度中心”——多个航班(对象)无需直接沟通起飞、降落时间,只需通过调度中心(中介者)协调,避免航班间的冲突与混乱...
- 1.3.1 python交互式模式的特点和用法
-
什么是Python交互模式Python交互模式,也叫Python交互式编程,是一种在Python解释器中运行的模式,它允许用户在解释器窗口中输入单个Python语句,并立即查看结果,而不需要编写整个程...
- Python设计模式 第 8 章 装饰器模式(Decorator Pattern)
-
在结构型模式中,装饰器模式是实现“动态功能扩展”的核心模式。它就像“手机壳与手机的关系”——手机(原始对象)具备通话、上网等基础功能,手机壳(装饰器)可在不改变手机本身的前提下,为其新增保护、...
- python设计模式 综合应用与实战指南
-
经过前面16章的学习,我们已系统掌握创建型模式(单例、工厂、建造者、原型)、结构型模式(适配器、桥接、组合、装饰器、外观、享元、代理)、行为型模式(责任链、命令、迭代器、中介者、观察者、状态、策略...
- Python入门学习教程:第 16 章 图形用户界面(GUI)编程
-
16.1什么是GUI编程?图形用户界面(GraphicalUserInterface,简称GUI)是指通过窗口、按钮、菜单、文本框等可视化元素与用户交互的界面。与命令行界面(CLI)相比,...
- Python 中 必须掌握的 20 个核心:str()
-
str()是Python中用于将对象转换为字符串表示的核心函数,它在字符串处理、输出格式化和对象序列化中扮演着关键角色。本文将全面解析str()函数的用法和特性。1.str()函数的基本用法1.1...
- Python偏函数实战:用functools.partial减少50%重复代码的技巧
-
你是不是经常遇到这样的场景:写代码时同一个函数调用了几十次,每次都要重复传递相同的参数?比如处理文件时总要用encoding='utf-8',调用API时固定传Content-Type...
- 第2节.变量和数据类型【第29课-输出总结】
-
同学们,关于输出的知识点讲解完成之后,把重点性的知识点做一个总结回顾。·首先对于输出这一章节讲解的比如有格式化符号,格式化符号这里需要同学们额外去多留意的是不是百分号s格式化输出字符串。当然课上也说百...
- AI最火语言python之json操作_python json.loads()
-
JSON(JavaScriptObjectNotation,JavaScript对象表示法)是一种开放标准的文件格式和数据交换格式,它易于人阅读和编写。JSON是一种常用的数据格式,比如对接各种第...
- python中必须掌握的20个核心函数—split()详解
-
split()是Python字符串对象的方法,用于将字符串按照指定的分隔符拆分成列表。它是文本处理中最常用的函数之一。一、split()的基本用法1.1基本语法str.split(sep=None,...
- 实用方法分享:pdf文件分割方法 横向A3分割成纵向A4
-
今天在街上打印店给儿子打印试卷时,我在想:能不能,把它分割成A4在家中打印,这样就不需要跑到街上的打印店打印卷子了。原来,老师发的作业,是电子稿,pdf文件,A3格式的试卷。可是家中的打印机只能打印A...
- 20道常考Python面试题大总结_20道常考python面试题大总结免费
-
20道常考Python面试题大总结关于Python的面试经验一般来说,面试官会根据求职者在简历中填写的技术及相关细节来出面试题。一位拿了大厂技术岗SpecialOffer的网友分享了他总结的面试经...
- Kotlin Data Classes 快速上手_kotlin快速入门
-
引言在日常开发中,我们常常需要创建一些只用来保存数据的类。问题是,这样的类往往需要写一堆模板化的方法:equals()、hashCode()、toString()……每次都重复,既枯燥又容易出错。//...
- python自动化RobotFramework中Collections字典关键字使用(五)
-
前言介绍安装好robotframework库后,跟之前文章介绍的BuiltIn库一样BuiltIn库使用介绍,在“python安装目录\Lib\site-packages\robot\librarie...
- Python中numpy数据分析库知识点总结
-
Python中numpy数据分析库知识点总结二、对已读取数据的处理②指定一个值,并对该值双边进行修改③指定两个值,并对第一个值的左侧和第二个值的右侧进行修改2.4数组的拼接和行列交换①竖直拼接(np...
你 发表评论:
欢迎- 一周热门
- 最近发表
-
- Python设计模式 第 13 章 中介者模式(Mediator Pattern)
- 1.3.1 python交互式模式的特点和用法
- Python设计模式 第 8 章 装饰器模式(Decorator Pattern)
- python设计模式 综合应用与实战指南
- Python入门学习教程:第 16 章 图形用户界面(GUI)编程
- Python 中 必须掌握的 20 个核心:str()
- Python偏函数实战:用functools.partial减少50%重复代码的技巧
- 第2节.变量和数据类型【第29课-输出总结】
- AI最火语言python之json操作_python json.loads()
- python中必须掌握的20个核心函数—split()详解
- 标签列表
-
- python计时 (73)
- python安装路径 (56)
- python类型转换 (93)
- python进度条 (67)
- python吧 (67)
- python的for循环 (65)
- python格式化字符串 (61)
- python静态方法 (57)
- python列表切片 (59)
- python面向对象编程 (60)
- python 代码加密 (65)
- python串口编程 (77)
- python封装 (57)
- python写入txt (66)
- python读取文件夹下所有文件 (59)
- python操作mysql数据库 (66)
- python获取列表的长度 (64)
- python接口 (63)
- python调用函数 (57)
- python多态 (60)
- python匿名函数 (59)
- python打印九九乘法表 (65)
- python赋值 (62)
- python异常 (69)
- python元祖 (57)