Word Break

Given a string s and a dictionary of words dict, determine if s can be segmented into a space-separated sequence of one or more dictionary words.

For example, given
s = “leetcode”,
dict = [“leet”, “code”].

Return true because “leetcode” can be segmented as “leet code”.

这题的意思是给出一本词典以及一个字符串,能否切分这个字符串使得每个字串都在字典里面存在。

假设dp(i)表示长度为i的字串能否别切分,dp方程如下:

dp(i) = dp(j) && s[j, i) in dict, 0 <= j < i

代码如下

  1. class Solution {
  2. public:
  3. bool wordBreak(string s, unordered_set<string> &dict) {
  4. int len = (int)s.size();
  5. vector<bool> dp(len + 1, false);
  6. dp[0] = true;
  7. for(int i = 1; i <= len; i++) {
  8. for(int j = i - 1; j >= 0; j--) {
  9. if(dp[j] && dict.find(s.substr(j, i - j)) != dict.end()) {
  10. dp[i] = true;
  11. break;
  12. }
  13. }
  14. }
  15. return dp[len];
  16. }
  17. };

World Break II

Given a string s and a dictionary of words dict, add spaces in s to construct a sentence where each word is a valid dictionary word.

Return all such possible sentences.

For example, given
s = “catsanddog”,
dict = [“cat”, “cats”, “and”, “sand”, “dog”].

A solution is [“cats and dog”, “cat sand dog”].

这道题不同于上一题,需要我们得到所有能切分的解。这道题难度很大,我们需要采用dp + dfs的方式求解,首先根据dp得到该字符串能否被切分,同时在dp的过程中记录属于字典的子串信息,供后续dfs使用。

首先我们使用dp[i][j]表示起始索引为i,长度为j的子串能否被切分,它有三种状态:

  1. dp[i][j] = true && dp[i][j] in dict,这种情况是这个子串直接在字典中
  2. dp[i][j] = true && dp[i][j] not in dict,这种情况是这个子串不在字典中,但是它能切分成更小的子串,而这些子串在字典中
  3. dp[i][j] = false,子串不能被切分

根据题意,我们需要求出所有切分的解,所以在进行dp的时候需要处理1和2这两种情况,因为对于2来说,dp[i][j]是要继续被切分的,也就是说我们只需要关注第1种情况的子串。

当dp完成之后,我们就需要使用dfs来得到整个的解。在dp[i][j] = 1的情况下面,我们只需要dfs递归处理后面i + j开始的子串就可以了。

代码如下:

  1. class Solution {
  2. public:
  3. vector<vector<char> >dp;
  4. vector<string> vals;
  5. string val;
  6. vector<string> wordBreak(string s, unordered_set<string> &dict) {
  7. int len = (int)s.size();
  8. dp.resize(len);
  9. for(int i = 0; i < len; i++) {
  10. dp[i].resize(len + 1, 0);
  11. }
  12. for(int i = 1; i <= len; i++) {
  13. for(int j = 0; j < len -i + 1; j++) {
  14. //直接存在于字典中,是第1种情况
  15. if(dict.find(s.substr(j, i)) != dict.end()) {
  16. dp[j][i] = 1;
  17. continue;
  18. }
  19. //如果不存在,则看子串是不是能被切分,这是第2中情况
  20. for(int k = 1; k < i && k < len -j; k++) {
  21. if(dp[j][k] && dp[j + k][i - k]) {
  22. dp[j][i] = 2;
  23. break;
  24. }
  25. }
  26. }
  27. }
  28. //不能切分,不用dfs了
  29. if(dp[0][len] == 0) {
  30. return vals;
  31. }
  32. dfs(s, 0);
  33. return vals;
  34. }
  35. void dfs(const string& s, int start) {
  36. int len = (int)s.size();
  37. if(start == len) {
  38. vals.push_back(val);
  39. return;
  40. }
  41. for(int i = 1; i <= len - start;i++) {
  42. if(dp[start][i] == 1) {
  43. int oldLen = (int)val.size();
  44. if(oldLen != 0) {
  45. val.append(" ");
  46. }
  47. val.append(s.substr(start, i));
  48. //我们从start + i开始继续dfs
  49. dfs(s, start + i);
  50. val.erase(oldLen, string::npos);
  51. }
  52. }
  53. }
  54. };