动态规划

建议观看 MIT 算法导论-动态规划中的课程。

适用于动态规划的问题,需要满足最优子结构无后效性,动态规划的求解过程,在于找到状态转移方程,进行自底向上的求解。

例题

爬楼梯问题 LeetCode 70

经典的动态规划问题之一,容易找到其状态转移方程为 dp[i] = dp[i-1] + dp[i-2],从基础的 1 和 2 个台阶两个状态开始,自底向上求解:

  1. int climbStairs(int n) {
  2. if (n == 1) {
  3. return 1;
  4. }
  5. int* dp = new int[n+1]();
  6. dp[1] = 1;
  7. dp[2] = 2;
  8. for (int i = 3; i <= n; i++) {
  9. dp[i] = dp[i-1] + dp[i-2];
  10. }
  11. return dp[n];
  12. }

从上面的代码中看到,dp[i] 只依赖 dp[i-1]dp[i-2],因此可以将代码简化:

  1. int climbStairs(int n) {
  2. int f0 = 1, f1 = 1, i, f2;
  3. for (i=2; i<=n; i++) {
  4. f2 = f0 + f1;
  5. f0 = f1;
  6. f1 = f2;
  7. }
  8. return f1;
  9. }

容易看出其实结果就是 fibonacci 数列的第 n 项。

连续子数组的最大和 LeetCode 53

dp[n] 表示元素 n 作为末尾的连续序列的最大和,容易想到状态转移方程为dp[n] = max(dp[n-1] + num[n], num[n]),从第 1 个元素开始,自顶向上求解:

  1. int maxSubArray(vector<int>& nums) {
  2. int* dp = new int[nums.size()]();
  3. dp[0] = nums[0];
  4. int result = dp[0];
  5. for (int i = 1; i < nums.size(); i++) {
  6. dp[i] = max(dp[i-1] + nums[i], nums[i]);
  7. result = max(result, dp[i]);
  8. }
  9. return result;
  10. }

类似前一个问题,这个问题当中,求解 dp[i] 只依赖 dp[i-1],因此可以使用变量来存储,简化代码:

  1. int maxSubArray(int A[], int n) {
  2. int result = INT_MIN;
  3. int f = 0;
  4. for (int i=0; i < n; i++) {
  5. f = max(f + A[i], A[i]);
  6. result = max(result, f);
  7. }
  8. return result;
  9. }

House Robber LeetCode 198

对于一个房子,有抢和不抢两种选择,容易得到状态转移方程 dp[i+1] = max(dp[i-1] + nums[i], dp[i]),示例代码如下:

  1. int rob(vector<int>& nums) {
  2. int n = nums.size();
  3. if (n == 0) {
  4. return 0;
  5. }
  6. vector<int> dp = vector<int>(n + 1);
  7. dp[0] = 0;
  8. dp[1] = nums[0];
  9. for (int i = 1; i < nums.size(); i++) {
  10. int v = nums[i];
  11. dp[i+1] = max(dp[i-1] + v, dp[i]);
  12. }
  13. return dp[n];
  14. }

同样的,可以使用两个变量简化代码:

  1. int rob(vector<int>& nums) {
  2. int n = nums.size();
  3. if (n == 0) {
  4. return 0;
  5. }
  6. int prev1 = 0;
  7. int prev2 = 0;
  8. for (int i = 0; i < nums.size(); i++) {
  9. int v = nums[i];
  10. int temp = prev1;
  11. prev1 = max(prev2 + v, prev1);
  12. prev2 = temp;
  13. }
  14. return prev1;
  15. }

最长回文子串 LeetCode 5

dp[i][j] 表示子串 i 到 j 是否是回文,使用动态规划求解:

  1. string longestPalindrome(string s) {
  2. int m = s.size();
  3. if (m == 0) {
  4. return "";
  5. }
  6. vector<vector<int>> dp(m, vector<int>(m, 0));
  7. int start = 0;
  8. int length = 1;
  9. for (int i = 0; i < m; i++) {
  10. // 单个字符属于回文,例如 abcd
  11. dp[i][i] = 1;
  12. // 连续两个字符相同属于回文,例如 abb
  13. if (i < m - 1) {
  14. if (s[i] == s[i + 1]) {
  15. dp[i][i + 1] = 1;
  16. start = i;
  17. length = 2;
  18. }
  19. }
  20. }
  21. for (int len = 2; len <= m; len++) {
  22. for (int i = 0; i < m - len; i++) {
  23. int j = i + len;
  24. // 扩展长度
  25. if (dp[i + 1][j - 1] == 1 && s[i] == s[j]) {
  26. dp[i][j] = 1;
  27. if (j - i + 1 > length) {
  28. start = i;
  29. length = j - i + 1;
  30. }
  31. }
  32. }
  33. }
  34. return s.substr(start, length);
  35. }

最小编辑距离 LeetCode 72

dp[i][j] 表示从 word[0..i) 转换到 word[0..j) 的最小操作,使用动态规划求解:

  1. int minDistance(string word1, string word2) {
  2. int m = word1.size();
  3. int n = word2.size();
  4. vector<vector<int>> dp(m + 1, vector<int>(n + 1, 0));
  5. // 全部删除,操作数量为 i
  6. for (int i = 0; i <= m; i++) {
  7. dp[i][0] = i;
  8. }
  9. for (int j = 0; j <= n; j++) {
  10. dp[0][j] = j;
  11. }
  12. for (int i = 1; i <= m; i++) {
  13. for (int j = 1; j <= n; j++) {
  14. // 末尾字符相同,不需要编辑
  15. if (word1[i - 1] == word2[j - 1]) {
  16. dp[i][j] = dp[i - 1][j - 1];
  17. } else {
  18. // 末尾字符不同,三种编辑情况,取最小值
  19. dp[i][j] = min(dp[i - 1][j - 1], min(dp[i][j - 1], dp[i - 1][j])) + 1;
  20. }
  21. }
  22. }
  23. return dp[m][n];
  24. }