Trie前缀树-程序员宅基地

技术标签: Leetcode刷题笔记  Trie  

Trie前缀树

简介

Trie (发音为 "try") 又经常叫前缀树,字典树等等,是一种树数据结构,用于检索字符串数据集中的键。

在计算机科学中,trie是一种有序树,用于保存关联数组,其中的键通常是字符串。与二叉查找树不同,键不是直接保存在节点中,而是由节点在树中的位置决定。一个节点的所有子孙都有相同的前缀,也就是这个节点对应的字符串,而根节点对应空字符串。一般情况下,不是所有的节点都有对应的值,只有叶子节点和部分内部节点所对应的键才有相关的值。

trie中的键通常是字符串,但也可以是其它的结构。trie的算法可以很容易地修改为处理其它结构的有序序列,比如一串数字或者形状的排列。比如,bitwise trie中的键是一串位元,可以用于表示整数或者内存地址

这一高效的数据结构有多种应用:

 

(1) 自动补全

无效的图片地址

(2)拼写检查

(3)IP 路由 (最长前缀匹配)

无效的图片地址

(4)T9 (九宫格) 打字预测

无效的图片地址

(5)单词游戏

image.png

还有其他的数据结构,如平衡树和哈希表,使我们能够在字符串数据集中搜索单词。为什么我们还需要 Trie 树呢?尽管哈希表可以在 O(1)O(1) 时间内寻找键值,却无法高效的完成以下操作:

  • 找到具有同一前缀的全部键值。
  • 按词典序枚举字符串的数据集。

Trie 树优于哈希表的另一个理由是,随着哈希表大小增加,会出现大量的冲突,时间复杂度可能增加到 O(n),其中 n 是插入的键的数量。与哈希表相比,Trie 树在存储多个具有相同前缀的键时可以使用较少的空间。此时 Trie 树只需要O(m) 的时间复杂度,其中 m 为键长。而在平衡树中查找键值需要O(mlogn) 时间复杂度。

Trie 树的结点结构

Trie 树是一个有根的树,其结点具有以下字段:

  • 最多 RR个指向子结点的链接,其中每个链接对应字母表数据集中的一个字母。
  • 本文中假定 RR为 26,小写拉丁字母的数量。
  • 布尔字段,以指定节点是对应键的结尾还是只是键前缀。

无效的图片地址

 

前缀树结点的代码实现:

class TrieNode {

    // R links to node children
    private TrieNode[] links;

    private final int R = 26;

    private boolean isEnd;

    public TrieNode() {
        links = new TrieNode[R];
    }

    public boolean containsKey(char ch) {
        return links[ch -'a'] != null;
    }
    public TrieNode get(char ch) {
        return links[ch -'a'];
    }
    public void put(char ch, TrieNode node) {
        links[ch -'a'] = node;
    }
    public void setEnd() {
        isEnd = true;
    }
    public boolean isEnd() {
        return isEnd;
    }
}

Trie 树的增改查

向 Trie 树中插入键

我们通过搜索 Trie 树来插入一个键。我们从根开始搜索它对应于第一个键字符的链接。有两种情况:

  • 链接存在。沿着链接移动到树的下一个子层。算法继续搜索下一个键字符。
  • 链接不存在。创建一个新的节点,并将它与父节点的链接相连,该链接与当前的键字符相匹配。

重复以上步骤,直到到达键的最后一个字符,然后将当前节点标记为结束节点,算法完成。

代码实现:

class Trie {
    private TrieNode root;

    public Trie() {
        root = new TrieNode();
    }

    // Inserts a word into the trie.
    public void insert(String word) {
        TrieNode node = root;
        for (int i = 0; i < word.length(); i++) {
            char currentChar = word.charAt(i);
            if (!node.containsKey(currentChar)) {
                node.put(currentChar, new TrieNode());
            }
            node = node.get(currentChar);
        }
        node.setEnd();
    }
}

复杂度分析:

时间复杂度:O(m),其中 m 为键长。在算法的每次迭代中,我们要么检查要么创建一个节点,直到到达键尾。只需要 m次操作。

空间复杂度:O(m)。最坏的情况下,新插入的键和 Trie 树中已有的键没有公共前缀。此时需要添加 m 个结点,使用 O(m) 空间。

在 Trie 树中查找键

每个键在 trie 中表示为从根到内部节点或叶的路径。我们用第一个键字符从根开始。检查当前节点中与键字符对应的链接。有两种情况:

  • 存在链接。我们移动到该链接后面路径中的下一个节点,并继续搜索下一个键字符。
  • 不存在链接。若已无键字符,且当前结点标记为 isEnd,则返回 true。否则有两种可能,均返回 false :a.还有键字符剩余,但无法跟随 Trie 树的键路径,找不到键;b.没有键字符剩余,但当前结点没有标记为 isEnd。也就是说,待查找键只是Trie树中另一个键的前缀。

image.png

代码实现:

class Trie {
    ...

    // search a prefix or whole key in trie and
    // returns the node where search ends
    private TrieNode searchPrefix(String word) {
        TrieNode node = root;
        for (int i = 0; i < word.length(); i++) {
           char curLetter = word.charAt(i);
           if (node.containsKey(curLetter)) {
               node = node.get(curLetter);
           } else {
               return null;
           }
        }
        return node;
    }

    // Returns if the word is in the trie.
    public boolean search(String word) {
       TrieNode node = searchPrefix(word);
       return node != null && node.isEnd();
    }
}

查找 Trie 树中的键前缀

该方法与在 Trie 树中搜索键时使用的方法非常相似。我们从根遍历 Trie 树,直到键前缀中没有字符,或者无法用当前的键字符继续 Trie 中的路径。与上面提到的“搜索键”算法唯一的区别是,到达键前缀的末尾时,总是返回 true。我们不需要考虑当前 Trie 节点是否用 “isend” 标记,因为我们搜索的是键的前缀,而不是整个键。

image.png

代码实现:

class Trie {
    ...

    // Returns if there is any word in the trie
    // that starts with the given prefix.
    public boolean startsWith(String prefix) {
        TrieNode node = searchPrefix(prefix);
        return node != null;
    }
}

复杂度分析:

  • 时间复杂度 : O(m)。
  • 空间复杂度 : O(1)。

作者:LeetCode

链接:https://leetcode-cn.com/problems/implement-trie-prefix-tree/solution/shi-xian-trie-qian-zhui-shu-by-leetcode/

来源:力扣(LeetCode)

 

 

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/qq_35590459/article/details/102643984

智能推荐

ESP定律脱壳-程序员宅基地

文章浏览阅读97次。  ESP定律是比较常用的脱壳方式,作为新手用的也比较多简单写一下我的看法。  esp定律的使用过程大致为:    1.开始就点F8,注意观察OD右上角的寄存器中ESP有没突现(变成红色),并且只有sp和ip为红色。        2.Command窗口中输入dd 0012FFA4 后回车,跟随esp寄存器后的地址。    3.选中下断的地址,断点--->硬件访---&..._sp定律可以脱壳

AOP的使用(详细讲解)_aop使用-程序员宅基地

文章浏览阅读1.5w次,点赞36次,收藏283次。一、AOP基本概念二、AOP底层原理三、AOP的JDK动态代理四、AOP术语五、AOP操作(准备)六、AOP操作(AspectJ注解)【重点】七、AOP操作(AspectJ配置文件)_aop使用

高通camera-sensor分辨率简单梳理_qualcomm camx sensor-程序员宅基地

文章浏览阅读1.7k次,点赞2次,收藏27次。记录学习高通关于sensor分辨率的相关笔记。_qualcomm camx sensor

QGIS批量向XYZ Tiles加载地图_xyz qgis-程序员宅基地

文章浏览阅读3k次,点赞10次,收藏12次。XYZ Tiles显示结果普通导入地图(一次一个)操作:右键单击【XTZ Tiles】,然后选择【new connection】,出现下图所示弹窗【Nmae】地图名称【URL】地图链接地址批量导入多个地图批量导入代码获取链接:qgis3-python-xyz/xyz-based.py# Sourcessources = []sources.append(["connections-xyz","Google Maps","","","","https://mt1.google.com/v_xyz qgis

Python list列表(详解)-程序员宅基地

文章浏览阅读7.5k次,点赞5次,收藏12次。在实际开发中,经常需要将一组(不只一个)数据存储起来,以便后边的代码使用。说到这里,一些读者可能听说过数组(Array),它就可以把多个数据挨个存储到一起,通过数组下标可以访问数组中的每个元素。需要明确的是,Python 中没有数组,但是加入了更加强大的列表。如果把数组看做是一个集装箱,那么 Python 的列表就是一个工厂的仓库。从形式上看,列表会将所有元素都放在一对中括号[ ]里面,相邻元素之间用逗号,分隔,如下所示:格式中,element1 ~ elementn 表示列表中的元素,个数没有限制,只要是_python list

Python实现二维码登录-程序员宅基地

文章浏览阅读489次。这里我们选择使用qrcode库,它是一个简单易用的库,可以方便地生成二维码。通过以上代码,我们实现了使用Python生成二维码和解析二维码的功能,从而实现了二维码登录的功能。以上代码中,我们首先使用qrcode库的imread函数读取二维码图片,然后调用decode函数解析二维码内容。接下来,我们生成一个随机的登录令牌。用户扫描二维码后,我们可以获取到登录令牌,然后可以根据具体需求进行后续的登录验证和操作。运行上述代码后,将会生成一个名为qrcode.png的二维码图片,并打印出生成的登录令牌和解析结果。

随便推点

CentOS7离线安装supervisor-程序员宅基地

文章浏览阅读485次,点赞4次,收藏6次。【解决办法】:没有setuptools的模块,说明python缺少这个模块,那我们只要安装这个模块即可解决此问题。【可能报错】:ImportError: No module named setuptools。2.安装supervisor。3.验证安装是否成功。_离线安装supervisor

[rails] 我的订餐系统 -- 小试ruby on rails _订盒饭代码-程序员宅基地

文章浏览阅读890次。前言 近期在java社区中一种新的脚本语言ruby,及用ruby开发的一个wab框架 rails也热闹了起来.引起了不少的java开发人员的关注.  本人平时还是很少接触脚本语言方面东东,看到相关的评论例如: "习惯约定优于配置" -- 那样就用象java那样麻烦且繁杂地配置N多XML "一站式面向用户的简单易用的框架" _订盒饭代码

matlab超限像素平滑法_2D-DIC | 二维数字图像相关法原理介绍 — 以开源算法Ncorr为例...-程序员宅基地

文章浏览阅读2.5k次,点赞2次,收藏9次。原文链接 2D-DIC | 二维数字图像相关法原理介绍 — 以开源算法Ncorr为例​mp.weixin.qq.com欢迎各位朋友关注数字图像相关法DIC小站,本小站公众号旨在推广数字图像相关法的研究和应用。【引言】 数字图像相关法(DIC)是一种利用在物体表面喷涂随机散斑,通过在物体变形前后的散斑图像中精确匹配对应点,测量变形位移等数据的非接触式光学测量方法。相比其它传统的接..._a 117 line 2d digital image correlation code written in matlab

3-位图的使用场景_redis 存储字节流-程序员宅基地

文章浏览阅读625次。1、二进制安全redis只存储字节流,与外界交互,存取都是字节流,只要双方客户端有统一的编解码,数据就不会被破坏。redis拿的是字节流,编码是一个字符一个字节redis-cli --raw 连接redis服务,并触发编码器的格式化。如果不格式化,redis只会识别ASCII码的,超出ASCII码,则显示为16进制2、位图的使用场景2.1、场景一:统计一段时间内用户的登录天数如果用数据库实现创建表,用户每笔登录都产生一行记录,然后登录登录时间,还有其他数据也需要记录。MySQL数据_redis 存储字节流

postman发送xml请求_postman xml请求-程序员宅基地

文章浏览阅读9.9k次。<?xml version="1.0" encoding="utf-8"?><soap:Envelope xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:xsd="http://www.w3.org/2001/XMLSchema" xmlns:soap="http://schemas.xmlsoap.org/soap/envelope/"> <soap:Header> <MyS.._postman xml请求

字体图标 fa fa html5,Font Awesome 4.2.0的所有图标参考-程序员宅基地

文章浏览阅读4k次。 fa-adjust [] fa-adn [] fa-align-center [] fa-align-justify [] fa-align-left [] fa-align-right [] fa-ambulance [] fa-anchor [] fa-android [] fa-angellist [] fa-angle-double-down [..._fa fa图标

推荐文章

热门文章

相关标签