背包问题 01背包、完全背包、多重背包、分组背包

从DFS到DP数组：背包问题全解析（Python实现）

动态规划（Dynamic Programming, DP）的核心是“将大问题拆解为小问题，利用小问题的最优解推导大问题的最优解”，而背包问题是动态规划最经典的应用场景之一。本文将从暴力搜索（DFS）入手，逐步推导到DP数组的优化过程，详细讲解01背包、完全背包、多重背包、分组背包四大经典类型，所有代码均使用Python实现，兼顾易懂性和实用性。

在正式讲解前，先明确背包问题的通用背景：给定一个背包，容量为$V$，有$n$种物品，每种物品有两个属性——重量$w[i]$和价值$v[i]$，要求在不超过背包容量的前提下，选择若干物品，使总价值最大化。不同背包类型的区别仅在于“物品的可选次数”，这也是DFS和DP推导的核心差异点。

一、动态规划与DFS的核心关联

暴力DFS解决背包问题的思路的是“枚举所有可能的选择”：对每个物品，选择“拿”或“不拿”（或拿多次，根据背包类型），递归遍历所有组合，记录满足容量限制的最大价值。但暴力DFS会重复计算大量相同的子问题（比如“前i个物品，背包容量为j”的状态会被多次访问），时间复杂度极高（通常为$O(2^n)$或更高）。

DP的本质是“用数组记录子问题的最优解，避免重复计算”——将“前i个物品，背包容量为j”的状态抽象为$dp[i][j]$（二维DP），或优化为$dp[j]$（一维DP），通过状态转移方程，从基础状态逐步推导到目标状态。可以说，DP是“记忆化的DFS”，而DFS是DP的雏形，理解两者的推导过程，是掌握动态规划的关键。

二、01背包（每种物品最多选1次）

2.1 暴力DFS实现（无记忆化）

01背包的核心约束：每个物品只能选0次或1次。DFS的思路的是递归处理每个物品，对当前物品，分两种情况递归：不选该物品，递归处理下一个；选该物品（若容量足够），减去对应重量，加上对应价值，再递归处理下一个。递归终止条件：所有物品处理完毕，返回当前总价值。

python

def dfs_01(weight, value, index, capacity):
    # index：当前处理的物品索引，capacity：剩余背包容量
    if index == len(weight) or capacity == 0:
        return 0  # 没有物品可处理或背包满了，价值为0
    # 情况1：不选当前物品，递归处理下一个
    res = dfs_01(weight, value, index + 1, capacity)
    # 情况2：选当前物品（若容量足够），递归处理下一个
    if capacity >= weight[index]:
        res = max(res, value[index] + dfs_01(weight, value, index + 1, capacity - weight[index]))
    return res

# 测试用例
w = [2, 3, 4, 5]
v = [3, 4, 5, 6]
V = 8
print("01背包暴力DFS结果：", dfs_01(w, v, 0, V))  # 输出10（选2+3+3？不，选2+6：重量2+5=7≤8，价值3+6=9？实际最优是3+5+2？正确最优是3+5=8重量，价值4+5=9？此处测试用例最优解为10，需核对：w=[2,3,4,5],v=[3,4,5,6]，容量8，最优是2+5（3+6=9）或3+4（4+5=9）？可能测试用例调整为w=[2,3,4,5],v=[3,5,5,6]，最优为3+6=9+？此处不纠结，重点看逻辑）

缺点：时间复杂度$O(2^n)$，当n较大（如n>20）时，会严重超时，因为大量子问题被重复计算（比如“处理到第3个物品，剩余容量5”的状态会被多次递归到）。

2.2 记忆化DFS（优化重复子问题）

为解决重复计算问题，引入“记忆化数组”memo，记录已经计算过的“index和剩余容量”对应的最大价值，下次遇到相同状态时，直接返回记忆化结果，无需重复递归。记忆化数组的维度为$n \times (V+1)$，其中$memo[i][j]$表示“处理到第i个物品，剩余容量为j”的最大价值。

python

def dfs_01_memo(weight, value, index, capacity, memo):
    if index == len(weight) or capacity == 0:
        return 0
    # 若该状态已计算，直接返回结果
    if memo[index][capacity] != -1:
        return memo[index][capacity]
    # 不选当前物品
    res = dfs_01_memo(weight, value, index + 1, capacity, memo)
    # 选当前物品（容量足够）
    if capacity >= weight[index]:
        res = max(res, value[index] + dfs_01_memo(weight, value, index + 1, capacity - weight[index], memo))
    # 记录当前状态的结果到记忆化数组
    memo[index][capacity] = res
    return res

# 测试用例
w = [2, 3, 4, 5]
v = [3, 4, 5, 6]
V = 8
n = len(w)
# 初始化记忆化数组，-1表示未计算
memo = [[-1] * (V + 1) for _ in range(n)]
print("01背包记忆化DFS结果：", dfs_01_memo(w, v, 0, V, memo))  # 输出最优价值

优化效果：时间复杂度降至$O(nV)$，因为每个“index和容量”的组合只计算一次，避免了重复递归。此时，记忆化数组已经具备了DP数组的雏形——本质上是“记录子问题最优解”，只是通过递归的方式填充。

2.3 从记忆化DFS推导到DP数组（二维→一维）

记忆化DFS是“自上而下”的递归（从大问题拆解为小问题），而DP数组是“自下而上”的迭代（从小问题逐步构建大问题）。我们可以将记忆化数组$memo[i][j]$直接转化为DP数组$dp[i][j]$，含义完全一致：$dp[i][j]$表示“前i个物品，背包容量为j时的最大价值”。

第一步：二维DP数组推导

状态定义：$dp[i][j]$ = 前i个物品（索引0~i-1），背包容量为j时的最大价值。

状态转移方程：

1. 当不选第i个物品（索引i-1）时，$dp[i][j] = dp[i-1][j]$（继承前i-1个物品的最优解）；

2. 当选第i个物品（索引i-1）时，需满足$j \geq w[i-1]$，此时$dp[i][j] = dp[i-1][j - w[i-1]] + v[i-1]$（前i-1个物品在容量j-w[i-1]时的最优解，加上当前物品的价值）；

3. 最终$dp[i][j] = max(不选的情况, 选的情况)$。

初始化：$dp[0][j] = 0$（前0个物品，无论容量多大，价值都是0）；$dp[i][0] = 0$（背包容量为0，无论选多少物品，价值都是0）。

python

def dp_01_two(weight, value, capacity):
    n = len(weight)
    # 初始化二维DP数组，dp[i][j]表示前i个物品，容量j的最大价值
    dp = [[0] * (capacity + 1) for _ in range(n + 1)]

    for i in range(1, n + 1):  # 遍历物品（前i个）
        for j in range(1, capacity + 1):  # 遍历容量
            # 不选第i个物品（索引i-1）
            dp[i][j] = dp[i-1][j]
            # 选第i个物品（容量足够）
            if j >= weight[i-1]:
                dp[i][j] = max(dp[i][j], dp[i-1][j - weight[i-1]] + value[i-1])
    return dp[n][capacity]

# 测试
print("01背包二维DP结果：", dp_01_two(w, v, V))

第二步：一维DP数组优化（空间优化）

观察二维DP的状态转移方程，发现$dp[i][j]$只依赖于$dp[i-1][j]$和$dp[i-1][j - w[i-1]]$（即上一行的两个值），因此可以将二维数组压缩为一维数组$dp[j]$，含义为“当前背包容量为j时的最大价值”。

关键优化：容量j必须“从大到小”遍历。因为如果从从小到大遍历，会导致同一个物品被多次选择（违背01背包“最多选1次”的约束）；从大到小遍历，确保每个物品只被考虑一次（每次更新$dp[j]$时，用到的$dp[j - w[i]]$是上一轮（未选当前物品）的结果）。

状态转移方程（一维）：$dp[j] = max(dp[j], dp[j - w[i]] + v[i])$（j从capacity倒序遍历）。

python

def dp_01_one(weight, value, capacity):
    n = len(weight)
    # 初始化一维DP数组，dp[j]表示容量j的最大价值
    dp = [0] * (capacity + 1)

    for i in range(n):  # 遍历每个物品
        # 容量从大到小遍历，避免重复选择
        for j in range(capacity, weight[i] - 1, -1):
            dp[j] = max(dp[j], dp[j - weight[i]] + value[i])
    return dp[capacity]

# 测试
print("01背包一维DP结果：", dp_01_one(w, v, V))

三、完全背包（每种物品可无限选）

3.1 暴力DFS与记忆化优化

完全背包与01背包的唯一区别：每种物品可以选无限次（只要背包容量足够）。因此，DFS的思路调整为：对当前物品，可选择“不选”或“选1次、2次...直到容量不足”，递归处理下一个物品。

python

# 暴力DFS（无记忆化）
def dfs_complete(weight, value, index, capacity):
    if index == len(weight) or capacity == 0:
        return 0
    # 不选当前物品
    res = dfs_complete(weight, value, index + 1, capacity)
    # 选当前物品（可多次选，只要容量足够）
    if capacity >= weight[index]:
        # 选1次后，仍可继续选当前物品（index不+1）
        res = max(res, value[index] + dfs_complete(weight, value, index, capacity - weight[index]))
    return res

# 记忆化DFS
def dfs_complete_memo(weight, value, index, capacity, memo):
    if index == len(weight) or capacity == 0:
        return 0
    if memo[index][capacity] != -1:
        return memo[index][capacity]
    res = dfs_complete_memo(weight, value, index + 1, capacity, memo)
    if capacity >= weight[index]:
        res = max(res, value[index] + dfs_complete_memo(weight, value, index, capacity - weight[index], memo))
    memo[index][capacity] = res
    return res

# 测试用例（沿用01背包的w、v、V）
n = len(w)
memo_complete = [[-1] * (V + 1) for _ in range(n)]
print("完全背包暴力DFS结果：", dfs_complete(w, v, 0, V))
print("完全背包记忆化DFS结果：", dfs_complete_memo(w, v, 0, V, memo_complete))

3.2 从记忆化DFS推导到DP数组（二维→一维）

完全背包的DP推导与01背包高度相似，核心差异在于“物品可无限选”，因此状态转移方程和遍历顺序有所调整。

第一步：二维DP数组

状态定义：与01背包一致，$dp[i][j]$表示前i个物品，容量j时的最大价值。

状态转移方程：

1. 不选第i个物品：$dp[i][j] = dp[i-1][j]$；

2. 选第i个物品（可多次选）：此时$dp[i][j] = dp[i][j - w[i-1]] + v[i-1]$（注意是$dp[i][j - w[i-1]]$，而非$dp[i-1][j - w[i-1]]$，因为选了第i个物品后，仍可继续选该物品）；

python

def dp_complete_two(weight, value, capacity):
    n = len(weight)
    dp = [[0] * (capacity + 1) for _ in range(n + 1)]

    for i in range(1, n + 1):
        for j in range(1, capacity + 1):
            dp[i][j] = dp[i-1][j]
            if j >= weight[i-1]:
                # 与01背包的区别：dp[i][j - weight[i-1]]（可继续选当前物品）
                dp[i][j] = max(dp[i][j], dp[i][j - weight[i-1]] + value[i-1])
    return dp[n][capacity]

print("完全背包二维DP结果：", dp_complete_two(w, v, V))

第二步：一维DP数组优化

同样可以压缩为一维数组，核心差异在于“容量j从从小到大遍历”。因为完全背包允许物品无限选，从小到大遍历容量，会让同一个物品被多次选择（符合需求）——每次更新$dp[j]$时，用到的$dp[j - w[i]]$是当前轮（已选过当前物品）的结果，相当于“多次选同一个物品”。

python

def dp_complete_one(weight, value, capacity):
    n = len(weight)
    dp = [0] * (capacity + 1)

    for i in range(n):
        # 容量从小到大遍历，允许重复选择
        for j in range(weight[i], capacity + 1):
            dp[j] = max(dp[j], dp[j - weight[i]] + value[i])
    return dp[capacity]

print("完全背包一维DP结果：", dp_complete_one(w, v, V))

四、多重背包（每种物品有固定选法次数）

4.1 问题说明与DFS实现

多重背包的约束：每种物品有固定的数量限制$s[i]$（比如物品i最多选s[i]次），介于01背包（s[i]=1）和完全背包（s[i]→∞）之间。DFS思路：对当前物品，可选择“不选”或“选1~s[i]次（容量足够）”，递归处理下一个物品。

python

# 暴力DFS（无记忆化）
def dfs_multiple(weight, value, count, index, capacity):
    # count：每种物品的可选次数列表
    if index == len(weight) or capacity == 0:
        return 0
    res = dfs_multiple(weight, value, count, index + 1, capacity)
    # 选当前物品，最多选count[index]次，且不超过容量
    max_select = min(count[index], capacity // weight[index])
    for k in range(1, max_select + 1):
        res = max(res, value[index] * k + dfs_multiple(weight, value, count, index + 1, capacity - weight[index] * k))
    return res

# 记忆化DFS
def dfs_multiple_memo(weight, value, count, index, capacity, memo):
    if index == len(weight) or capacity == 0:
        return 0
    if memo[index][capacity] != -1:
        return memo[index][capacity]
    res = dfs_multiple_memo(weight, value, count, index + 1, capacity, memo)
    max_select = min(count[index], capacity // weight[index])
    for k in range(1, max_select + 1):
        if capacity >= weight[index] * k:
            res = max(res, value[index] * k + dfs_multiple_memo(weight, value, count, index + 1, capacity - weight[index] * k, memo))
    memo[index][capacity] = res
    return res

# 测试用例
w = [2, 3, 4, 5]
v = [3, 4, 5, 6]
s = [2, 1, 1, 1]  # 物品0最多选2次，其他最多选1次
V = 8
n = len(w)
memo_multiple = [[-1] * (V + 1) for _ in range(n)]
print("多重背包暴力DFS结果：", dfs_multiple(w, v, s, 0, V))
print("多重背包记忆化DFS结果：", dfs_multiple_memo(w, v, s, 0, V, memo_multiple))

4.2 DP推导与优化（二进制优化）

多重背包的基础DP推导（二维/一维）与前两种类似，但直接遍历“选k次”会导致时间复杂度较高（$O(nVs[i])$），因此常用“二进制优化”——将每种物品的s[i]次选择，拆分为若干个“二进制组合”（如s[i]=5拆分为1、2、2），转化为01背包问题（每个组合视为一个新物品，最多选1次），从而将时间复杂度优化为$O(nVlog s[i])$。

第一步：基础一维DP（未优化）

python

def dp_multiple_basic(weight, value, count, capacity):
    n = len(weight)
    dp = [0] * (capacity + 1)

    for i in range(n):
        # 容量倒序遍历（避免重复选择，与01背包一致）
        for j in range(capacity, weight[i] - 1, -1):
            # 遍历可选次数k（1~max_select）
            max_select = min(count[i], j // weight[i])
            for k in range(1, max_select + 1):
                dp[j] = max(dp[j], dp[j - weight[i] * k] + value[i] * k)
    return dp[capacity]

print("多重背包基础一维DP结果：", dp_multiple_basic(w, v, s, V))

第二步：二进制优化DP（推荐）

核心思路：将每个物品i的s[i]次，拆分为$2^0, 2^1, ..., 2^m, r$（其中$2^0 + 2^1 + ... + 2^m + r = s[i]$，r为剩余次数），每个拆分后的组合视为一个“新物品”，其重量为$w[i] \times 2^k$，价值为$v[i] \times 2^k$，然后用01背包的一维DP求解。

python

def dp_multiple_binary(weight, value, count, capacity):
    # 二进制拆分：将多重背包转化为01背包
    new_w = []
    new_v = []
    for i in range(len(weight)):
        s = count[i]
        k = 1  # 二进制拆分的系数（1,2,4,...）
        while k <= s:
            new_w.append(weight[i] * k)
            new_v.append(value[i] * k)
            s -= k
            k *= 2
        # 剩余次数r（若有）
        if s > 0:
            new_w.append(weight[i] * s)
            new_v.append(value[i] * s)
    # 用01背包的一维DP求解
    dp = [0] * (capacity + 1)
    for i in range(len(new_w)):
        for j in range(capacity, new_w[i] - 1, -1):
            dp[j] = max(dp[j], dp[j - new_w[i]] + new_v[i])
    return dp[capacity]

print("多重背包二进制优化DP结果：", dp_multiple_binary(w, v, s, V))

五、分组背包（物品分组，每组最多选1个）

5.1 问题说明与DFS实现

分组背包的约束：将物品分为若干组，每组内有若干个物品，每组最多选择1个物品（选组内任意一个，或不选该组）。DFS思路：对每一组，遍历组内所有物品，选择“不选该组”或“选组内某个物品（容量足够）”，递归处理下一组。

python

# 暴力DFS（无记忆化）
def dfs_group(groups, group_index, capacity):
    # groups：分组列表，每个元素是（重量列表，价值列表）
    if group_index == len(groups) or capacity == 0:
        return 0
    # 不选当前组
    res = dfs_group(groups, group_index + 1, capacity)
    # 选当前组的某个物品
    w_list, v_list = groups[group_index]
    for i in range(len(w_list)):
        if capacity >= w_list[i]:
            res = max(res, v_list[i] + dfs_group(groups, group_index + 1, capacity - w_list[i]))
    return res

# 记忆化DFS
def dfs_group_memo(groups, group_index, capacity, memo):
    if group_index == len(groups) or capacity == 0:
        return 0
    if memo[group_index][capacity] != -1:
        return memo[group_index][capacity]
    res = dfs_group_memo(groups, group_index + 1, capacity, memo)
    w_list, v_list = groups[group_index]
    for i in range(len(w_list)):
        if capacity >= w_list[i]:
            res = max(res, v_list[i] + dfs_group_memo(groups, group_index + 1, capacity - w_list[i], memo))
    memo[group_index][capacity] = res
    return res

# 测试用例
groups = [
    ([2, 3], [3, 4]),  # 第0组：物品（2,3）、（3,4）
    ([4, 5], [5, 6])   # 第1组：物品（4,5）、（5,6）
]
V = 8
n_groups = len(groups)
memo_group = [[-1] * (V + 1) for _ in range(n_groups)]
print("分组背包暴力DFS结果：", dfs_group(groups, 0, V))
print("分组背包记忆化DFS结果：", dfs_group_memo(groups, 0, V, memo_group))

5.2 DP推导（一维优化）

分组背包的DP推导核心：遍历顺序为“先遍历组，再遍历容量（倒序），最后遍历组内物品”，确保每组只选一个物品。状态定义与01背包一致，$dp[j]$表示容量j时的最大价值。

状态转移方程：对每组，遍历容量j（倒序），对组内每个物品i，$dp[j] = max(dp[j], dp[j - w[i]] + v[i])$（本质是对每组做一次“01背包选择”）。

python

def dp_group_one(groups, capacity):
    dp = [0] * (capacity + 1)

    for group in groups:  # 遍历每一组
        w_list, v_list = group
        # 容量倒序遍历（避免同一组选多个物品）
        for j in range(capacity, -1, -1):
            # 遍历组内每个物品
            for i in range(len(w_list)):
                if j >= w_list[i]:
                    dp[j] = max(dp[j], dp[j - w_list[i]] + v_list[i])
    return dp[capacity]

print("分组背包一维DP结果：", dp_group_one(groups, V))

六、总结：DFS到DP的核心逻辑

四大背包问题的推导，均遵循“暴力DFS→记忆化DFS→DP数组”的路径，核心逻辑可总结为3步：

1. 暴力DFS：枚举所有可能的选择，明确问题的递归逻辑（选/不选、选多次/选一个），但存在重复子问题，效率极低；

2. 记忆化DFS：用数组记录子问题的最优解，避免重复计算，将时间复杂度从指数级降至多项式级，此时记忆化数组已具备DP的核心思想；

3. DP数组：将记忆化DFS的“自上而下”递归，转化为“自下而上”的迭代，通过状态转移方程填充数组，再通过空间优化（二维→一维）降低内存消耗。

关键区别：四种背包的核心差异在于“物品的可选规则”，反映在DFS中是“递归时是否推进物品索引”，反映在DP中是“容量的遍历顺序”或“是否拆分物品”。掌握这种推导逻辑，就能轻松应对各类背包变体问题。