字典树(Trie)

277 阅读3分钟

字典树

字典树,一般称为trie树,trie树常用于搜索提示。如当输入一个网址,可以自动搜索出可能的选择。当没有完全匹配的搜索结果,可以返回前缀最相似的可能。

详细介绍参见维基百科:Trie树

基本概念

一个保存了8个键的trie结构,"A", "to", "tea", "ted", "ten", "i", "in", and "inn".

image-20190428191028045

优点:最大限度的减少无谓的比较,查询效率比哈希高

核心思想:空间换时间,利用字符串的公共前缀来降低查询时间的开销已达到提高查询的目的。

缺点:空间消耗比较大

基本性质:

  • 根节点不包含字符,除根节点外每个节点都只包含一个字符
  • 从根节点到某一节点,路径上经过的字符连接起来,为该节点对应的字符串
  • 每个节点的所有子节点包含的字符都不相同

实现

在LeetCode上的第208题

1 首先定义一个节点类,因为数据结构为树,因此需要节点。

    static class TrieNode {

        /**
         * 当前节点要存储的字符
         */
        char val;

        /**
         * 标记节点,用来标记当前的节点是否为要存储节点的最后一个字符
         */
        boolean isEnd;

        /**
         *  存储树的下一个节点,因为这次只考虑到小写,因此
         *  只开辟了26个数组空间
         *
         *  //如果trie树的节点远大于26个的话,可以使用Map来作为next
         *  TreeMap<Character,TrieNode> = new TreeMap()
         */
        TrieNode[] next = new TrieNode[26];

        public TrieNode() {
        }

        public TrieNode(char val) {
            this.val = val;
        }
    }

2 定义Trie的结构。

public class Trie {

    /**
     * Trie树的根节点
     */
    TrieNode root;

    /**
     * 初始化Trie数据结构
     */
    public Trie() {
        root = new TrieNode();
        root.val = ' ';
    }

    /**
     * 插入一个单词到Trie树中
     *
     */
    public void insert(String word) {
        TrieNode currentNode = root;
        for (int i = 0; i < word.length(); i++) {
            char c = word.charAt(i);
            // 将当前的字符作为节点插入到Trie树中
            // 但是插入之前首先做一次检查
            if (currentNode.next[c - 'a'] == null) {
                currentNode.next[c - 'a'] = new TrieNode(c);
            }
            currentNode = currentNode.next[c - 'a'];
        }
        // 现在标识已经走到单词末尾了
        currentNode.isEnd = true;
    }

    /**
     * 判断某个单词是否在Trie树之中
     */
    public boolean search(String word) {
        TrieNode currentNode = root;
        for (int i = 0; i < word.length(); i++) {
            char c = word.charAt(i);
            // 在单词还未走完的时候发现已经不匹配了
            if (currentNode.next[c - 'a'] == null){
                return false;
            }
            currentNode = currentNode.next[c - 'a'];
        }
        // 在每个单词的末尾都有设置为true
        // 如果当前是false,那么代表未存储这个单词
        return currentNode.isEnd;
    }

    /**
     * 判断当前的单词是否为Trie树种某个单词的前缀,注意这里的逻辑与查询是相同的,唯一不同的是
     * 匹配完前缀之后返回true
     */
    public boolean startsWith(String prefix) {
        TrieNode currentNode = root;
        for (int i = 0; i < prefix.length(); i++) {
            char c = prefix.charAt(i);
            if (currentNode.next[c - 'a'] == null){
                return false;
            }
            currentNode = currentNode.next[c - 'a'];
        }
        return true;
    }
}

3 写测试代码,查看效果

   public static void main(String[] args) {
        Trie trie = new Trie();
        trie.insert("flink");
        trie.insert("netty");
        trie.insert("mysql");
        trie.insert("redis");

        // false
        System.out.println(trie.search("mongodb"));
        // true
        System.out.println(trie.search("redis"));
        //false
        System.out.println(trie.search("my"));
        // true
        System.out.println(trie.search("mysql"));
        // true
        System.out.println(trie.startsWith("my"));
    }

4 运行程序,结果符合预期

image-20190429081246407

最后

这里只是简单给与了Trie树的简单介绍与实现,关于Trie树还有很多的话题。

扩展:

  • 压缩Trie树,优化了一定的空间,但是增加维护成本

  • 后缀树

  • 三分字典树