Code Ganker: Minimum Window Substring -- LeetCode

2014年3月2日星期日

Minimum Window Substring -- LeetCode

原题链接: http://oj.leetcode.com/problems/minimum-window-substring/
这道题是字符串处理的题目,和Substring with Concatenation of All Words思路非常类似,同样是建立一个字典,然后维护一个窗口。区别是在这道题目中,因为可以跳过没在字典里面的字符(也就是这个串不需要包含且仅仅包含字典里面的字符,有一些不在字典的仍然可以满足要求),所以遇到没在字典里面的字符可以继续移动窗口右端,而移动窗口左端的条件是当找到满足条件的串之后,一直移动窗口左端直到有字典里的字符不再在窗口里。在实现中就是维护一个HashMap,一开始key包含字典中所有字符,value就是该字符的数量,然后遇到字典中字符时就将对应字符的数量减一。算法的时间复杂度是O(n),其中n是字符串的长度,因为每个字符再维护窗口的过程中不会被访问多于两次。空间复杂度则是O(字典的大小),也就是代码中T的长度。代码如下:
public String minWindow(String S, String T) {
    if(S==null || S.length()==0)
        return "";
    HashMap<Character, Integer> map = new HashMap<Character, Integer>();
    for(int i=0; i<T.length();i++)
    {
        if(map.containsKey(T.charAt(i)))
        {
            map.put(T.charAt(i),map.get(T.charAt(i))+1);
        }
        else
        {
            map.put(T.charAt(i),1);
        }
    }
    int left = 0;
    int count = 0;
    int minLen = S.length()+1;
    int minStart = 0;
    for(int right=0; right<S.length();right++)
    {
        if(map.containsKey(S.charAt(right)))
        {
            map.put(S.charAt(right),map.get(S.charAt(right))-1);
            if(map.get(S.charAt(right))>=0)
            {
                count++;
            }
            while(count == T.length())
            {
                if(right-left+1<minLen)
                {
                    minLen = right-left+1;
                    minStart = left;                    
                }
                if(map.containsKey(S.charAt(left)))
                {
                    map.put(S.charAt(left), map.get(S.charAt(left))+1);
                    if(map.get(S.charAt(left))>0)
                    {
                        count--;
                    }
                }
                left++;
            }
        }
    }
    if(minLen>S.length())
    {
        return "";
    }
    return S.substring(minStart,minStart+minLen);
}
这个方法在Substring with Concatenation of All WordsLongest Substring Without Repeating Characters中都介绍过,属于一种类型的题目,只要掌握了思路便可以举一反三,都可以将这类问题降低到线性复杂度。

5 条评论:

  1. 感觉这个代码实现得好巧妙,debug半天也琢磨不出个规律,可以具体讲讲吗?

    回复删除
    回复
    1. 可以先看看这个帖子http://codeganker.blogspot.com/2014/02/longest-substring-without-repeating.html,好多题目都是这个思路~ 理解就好了哈~ 如果还是有问题再继续交流哈~

      删除
    2. 我知道这个算法是正确的,但怎么可以证明是正确的?

      删除
    3. 主要就是他没有漏掉任何可能最短的窗口,找到包含所有字符的窗口之后,将左窗口往前移动直到缺字母,这样做的原因是跳过的串一定不会包含所有元素,因为移动右窗口停下时是刚好包含所有元素的。当左窗口发现缺少元素时,又可以移动右窗口来找到包含所有字符的窗口。如此每次都找到包含所有字符的窗口,而跳过一些没必要看的子串。 不知道这样解释能理解吗哈~

      删除
    4. 谢谢,很有帮助~

      删除