List 去重的 6 种方法,这个方法最完美_list 去重复-程序员宅基地

技术标签: java  list  数据结构  

在日常的业务开发中,偶尔会遇到需要将 List 集合中的重复数据去除掉的场景。这个时候可能有同学会问:为什么不直接使用 Set 或者 LinkedHashSet 呢?这样不就没有重复数据的问题了嘛?

不得不说,能提这个问题的同学很机智,一眼就看到了问题的本质。

但是,在实际的业务开发中遇到的情况会更复杂。比如,List 集合可能是历史遗留问题,也有可能是调用接口返回的类型限制,只能使用 List 接收,又或者是代码写了一半,在做多个集合合并的时候才发现了这个问题,总之造成问题的原因有很多种,这里就不一一列举了。

当发现这个问题之后,如果可以通过改造原有代码,把原来的 List 类型替换成 Set 类型,那就可以直接修改集合的类型即可。但如果压根就修改不了,或者是修改的成本太大,那接下来这 6 种去重的方法,将帮你解决问题。

前置知识

正式开始之前,先来搞懂两组概念:无序集合和有序集合 & 无序和有序。因为接下来的方法实现中,会反复提及这两组概念,所以有必要在正式开始之前,先把它们搞清楚。

无序集合

无序集合是指,数据读取的顺序和数据插入的顺序是不一致的。例如,插入集合的顺序是:1、5、3、7,而集合的读取顺序竟然是:1、3、5、7。

有序集合

有序集合的概念和无序集合的概念正好相反,它是指集合的读取顺序和插入顺序是一致的。例如,插入数据的顺序是:1、5、3、7,那么读取的顺序也是:1、5、3、7。

有序和无序

通过上面的无序集合和有序集合,我们可以得出有序和无序的概念。

有序指的是数据的排列顺序和读取顺序符合我们的预期就叫做有序。而无序指的是数据的排列顺序和读取顺序不符合我们的预期就叫做无序。

PS:如果对于有序和无序的概念不是很清楚也没关系,通过下面的事例,我们可以进一步的理解它们的含义。

方法1:contains判断去重(有序)

要进行数据去重,我们首先想到的是新建一个集合,然后循环原来的集合,每次循环判断原集合中的循环项,如果当前循环的数据,没有在新集合中存在就插入,已经存在了就舍弃,这样当循环执行完,我们就得到了一个没有重复元素的集合了,实现代码如下:

public class ListDistinctExample {
    public static void main(String[] args) {
        List<Integer> list = new ArrayList<Integer>() {
   {
            add(1);
            add(3);
            add(5);
            add(2);
            add(1);
            add(3);
            add(7);
            add(2);
        }};
        System.out.println("原集合:" + list);
        method(list);
    }

    /**
     * 自定义去重
     * @param list
     */
    public static void method(List<Integer> list) {
        // 新集合
        List<Integer> newList = new ArrayList<>(list.size());
        list.forEach(i -> {
            if (!newList.contains(i)) { // 如果新集合中不存在则插入
                newList.add(i);
            }
        });
        System.out.println("去重集合:" + newList);
    }
}

以上程序执行的结果,如下所示:

List 去重的 6 种方法,这个方法最完美

此方法的优点的:理解起来比较简单,并且最终得到的集合也是有序的,这里的有序指的是新集合的排列顺序和原集合的顺序是一致的;但缺点是实现代码有点多,不够简洁优雅。

方法2:迭代器去重(无序)

自定义 List 去重,除了上面的新建集合之外,我们也可以使用迭代器循环判断每一项数据,如果当前循环的数据,在集合中存在两份或两份以上,就将当前的元素删除掉,这样循环完之后,也可以得到一个没有重复数据的集合,实现代码如下:

public class ListDistinctExample {
    public static void main(String[] args) {
        List<Integer> list = new ArrayList<Integer>() {
   {
            add(1);
            add(3);
            add(5);
            add(2);
            add(1);
            add(3);
            add(7);
            add(2);
        }};
        System.out.println("原集合:" + list);
        method_1(list);
    }

    /**
     * 使用迭代器去重
     * @param list
     */
    public static void method_1(List<Integer> list) {
        Iterator<Integer> iterator = list.iterator();
        while (iterator.hasNext()) {
            // 获取循环的值
            Integer item = iterator.next();
            // 如果存在两个相同的值
            if (list.indexOf(item) != list.lastIndexOf(item)) {
                // 移除最后那个相同的值
                iterator.remove();
            }
        }
        System.out.println("去重集合:" + list);
    }
}

以上程序执行的结果,如下所示:

List 去重的 6 种方法,这个方法最完美

此方法的实现比上一种方法的实现代码要少一些,并且不需要新建集合,但此方法得到的新集合是无序的,也就是新集合的排列顺序和原集合不一致,因此也不是最优的解决方案。

方法3:HashSet去重(无序)

我们知道 HashSet 天生具备“去重”的特性,那我们只需要将 List 集合转换成 HashSet 集合就可以了,实现代码如下:

public class ListDistinctExample {
    public static void main(String[] args) {
        List<Integer> list = new ArrayList<Integer>() {
   {
            add(1);
            add(3);
            add(5);
            add(2);
            add(1);
            add(3);
            add(7);
            add(2);
        }};
        System.out.println("原集合:" + list);
        method_2(list);
    }

    /**
     * 使用 HashSet 去重
     * @param list
     */
    public static void method_2(List<Integer> list) {
        HashSet<Integer> set = new HashSet<>(list);
        System.out.println("去重集合:" + set);
    }
}

以上程序执行的结果,如下所示:

List 去重的 6 种方法,这个方法最完美

此方法的实现代码较为简洁,但缺点是 HashSet 会自动排序,这样新集合的数据排序就和原集合不一致了,如果对集合的顺序有要求,那么此方法也不能满足当前需求。

方法4:LinkedHashSet去重(有序)

既然 HashSet 会自动排序不能满足需求,那就使用 LinkedHashSet,它既能去重又能保证集合的顺序,实现代码如下:

public class ListDistinctExample {
    public static void main(String[] args) {
        List<Integer> list = new ArrayList<Integer>() {
   {
            add(1);
            add(3);
            add(5);
            add(2);
            add(1);
            add(3);
            add(7);
            add(2);
        }};
        System.out.println("原集合:" + list);
        method_3(list);
    }

    /**
     * 使用 LinkedHashSet 去重
     * @param list
     */
    public static void method_3(List<Integer> list) {
        LinkedHashSet<Integer> set = new LinkedHashSet<>(list);
        System.out.println("去重集合:" + set);
    }
}

以上程序执行的结果,如下所示:

List 去重的 6 种方法,这个方法最完美

从上述代码和执行结果可以看出,LinkedHashSet 是到目前为止,实现比较简单,且最终生成的新集合与原集合顺序保持一致的实现方法,是我们可以考虑使用的一种去重方法。

方法5:TreeSet去重(无序)

除了以上的 Set 集合之外,我们还可以使用 TreeSet 集合来实现去重功能,实现代码如下:

public class ListDistinctExample {
    public static void main(String[] args) {
        List<Integer> list = new ArrayList<Integer>() {
   {
            add(1);
            add(3);
            add(5);
            add(2);
            add(1);
            add(3);
            add(7);
            add(2);
        }};
        System.out.println("原集合:" + list);
        method_4(list);
    }

    /**
     * 使用 TreeSet 去重(无序)
     * @param list
     */
    public static void method_4(List<Integer> list) {
        TreeSet<Integer> set = new TreeSet<>(list);
        System.out.println("去重集合:" + set);
    }
}

以上程序执行的结果,如下所示:

List 去重的 6 种方法,这个方法最完美

比较遗憾的是,TreeSet 虽然实现起来也比较简单,但它有着和 HashSet 一样的问题,会自动排序,因此也不能满足我们的需求。

方法6:Stream去重(有序)

JDK 8 为我们带来了一个非常实用的方法 Stream,使用它可以实现很多功能,比如下面的去重功能:

public class ListDistinctExample {
    public static void main(String[] args) {
        List<Integer> list = new ArrayList<Integer>() {
   {
            add(1);
            add(3);
            add(5);
            add(2);
            add(1);
            add(3);
            add(7);
            add(2);
        }};
        System.out.println("原集合:" + list);
        method_5(list);
    }

    /**
     * 使用 Stream 去重
     * @param list
     */
    public static void method_5(List<Integer> list) {
        list = list.stream().distinct().collect(Collectors.toList());
        System.out.println("去重集合:" + list);
    }
}

以上程序执行的结果,如下所示:

List 去重的 6 种方法,这个方法最完美

Stream 实现去重功能和其他方法不同的是,它不用新创建集合,使用自身接收一个去重的结果就可以了,并且实现代码也很简洁,并且去重后的集合顺序也和原集合的顺序保持一致,是我们最优先考虑的去重方法。

总结

本文我们介绍了 6 种集合去重的方法,其中实现最简洁,且去重之后的顺序能和原集合保持一致的实现方法,只有两种:LinkedHashSet 去重和 Stream 去重,而后一种去重方法无需借助新集合,是我们优先考虑的去重方法。

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/m0_64374605/article/details/121757036

智能推荐

openssh aix_获取最新版本的OpenSSH for AIX-程序员宅基地

文章浏览阅读1.5k次。什么是开放安全壳? Open Secure Shell(OpenSSH)是网络连接工具SSH协议套件的开源版本。 这些工具提供经过身份验证和加密的外壳程序功能。 Shell是命令语言解释器,可从命令行字符串,stdin或文件中读取输入。 为什么要使用OpenSSH? 在不安全的公共网络(如Internet)上运行时,可以使用SSH命令套件而不是不安全的命令telnet,f​​tp和r命令。..._aix最新版ssh

不会真有人觉得聊天机器人难吧-程序员宅基地

文章浏览阅读483次,点赞3次,收藏3次。本系列会基于自己实现的类Pytorch工具实现一个Seq2Seq 带Attention机制的聊天机器人,在本系列文章中,大家会了解到实现聊天机器人的所有知识,以及如何实现一个类似PyTorch一样的深度学习框架。欢迎关注哦。

Java学习路线_自动机理论、语言和计算导论 site:csdn.net-程序员宅基地

文章浏览阅读923次。前提条件: 需要有高中毕业的水准 (或者同等学历的也行,比如中专,我本人就是读中专然后再读自考大专的)。学习方式: 完全可以自学,最好自己有电脑。偏重方向: 偏重软件,而不是计算机硬件。英语要求: 掌握3000个左右的常用单词,能读就差不多了, 如果不想看英文可以找中文翻译版的,我个人偏向看中文,对于非常好的书我通常中英文都买来看。以下列出的书是按照循序渐进的方式介绍的, _自动机理论、语言和计算导论 site:csdn.net

一个不错的GIT入门教程_刚培训完,git-程序员宅基地

文章浏览阅读1k次。今天公司培训了GIT,然后下班回家搜了一下,从新复习一下GIT加深印象。这篇文章对于刚刚做项目的新手们有很大帮助。让你知道什么时候commit,什么时候用 -pull 什么时候push 和一些注意事项! 1. 概述 对于软件版本管理工具,酷讯决定摒弃CVS而转向Git了。 为什么要选择Git? 你真正学会使用Git时, 你就会觉得这个问题的回答是非常自然的。然_刚培训完,git

WAF绕过-信息收集之反爬虫延时代理池 46_阿里waf 反爬-程序员宅基地

文章浏览阅读518次。老师用的阿里云的服务器,装了宝塔和安全狗,演示案例。_阿里waf 反爬

PlantCom:基于内参的宿主相关丰度定量分析揭示植物根系微生物组的微生物总量变化-程序员宅基地

文章浏览阅读2.5k次。文章目录基于内参的宿主相关丰度定量分析揭示植物根系微生物组的微生物总量变化摘要背景介绍图1.植物根部微生物组定量丰度分析的优势和实验步骤结果spike-in内参质粒和HA-QAP方法的原理内参质粒(spike-in)适用于定量分析微生物组谱图2. 在细菌模拟实验中HA-QAP比传统的基于相对丰度的分析更准确在人工混菌实验中检测微生物总量以评估方法的设计和合理性HA-QAP在模拟实验中检测根微生物组...

随便推点

Flutter列表和表格的综合运用_flutter多行合并表格布局-程序员宅基地

文章浏览阅读807次,点赞2次,收藏2次。最近Flutter项目中遇到一个比较有意思的页面,页面稍显复杂,考验的是列表和表格的综合运用,感觉有必要总结一下。自己粗糙绘制了一下原型,大致要求如下:页面可上下滑动点击Tab标题时,Tab栏下方区域页面进行切换,且Tab栏滑动到顶部也就是紧挨着标题栏下方时,悬浮在顶部,用户再次向上滑动时,Tab下方页面进行上滑,而Tab栏固定不变Tab栏下方页面为表格数据,有多少..._flutter多行合并表格布局

github -ubuntu 首次git clone 代码错误Please make sure you have the correct access rights and the repositor-程序员宅基地

文章浏览阅读1.2k次。首次从github git clone 代码到ubuntu本机中, 若出现以下错误:joaquin@vmachine:/home$ sudo git clone [email protected]:jasgooddy/distributed-saving-.git[sudo] password for joaquin: Cloning into 'distributed-sa

【IntelliJ IDEA工具】spring boot使用JPA自动生成实体类(数据库表逆向工程自动生成带注释的实体类)_springdatajpa逆向生成实体类-程序员宅基地

文章浏览阅读1.2k次。1、maven依赖: <!-- JPA,用于自动生成表结构 --> <dependency> <groupId>org.springframework.boot</groupId> <artifactId>spring-boot-starter-data-jpa</artifactId> </dependency> &_springdatajpa逆向生成实体类

TMDS_tmds解码程序-程序员宅基地

文章浏览阅读1.4k次。module vdc_encode( rst, clk, de, d, c0, c1, q_out); input rst; input clk; input de, c0, c1; input[7:0] d; output reg[9:0] q_out; reg[9:0] q_m;..._tmds解码程序

Windows上彻底卸载软件及清理残留数据的详细步骤_windows可以彻底卸载软件的-程序员宅基地

文章浏览阅读2.7w次,点赞14次,收藏87次。在Windows操作系统上安装和卸载软件是常见的操作。然而,仅仅通过常规的卸载过程并不能完全清除软件的所有残留数据。为了彻底卸载软件并清理相关的残留数据,我们需要采取额外的步骤。本文将详细介绍在Windows上彻底卸载软件以及清理残留数据的步骤。_windows可以彻底卸载软件的

微信小程序实现授权登录及退出_java 小程序退出登录-程序员宅基地

文章浏览阅读4.1k次,点赞2次,收藏34次。1.登录获取用户昵称,头像2.创建云函数右击新建文件夹cloud在根目录project.config.json中添加:右击文件夹cloud选择当前环境右击文件夹cloud新建Node.js云函数,命名login在新建文件夹login的index.js文件中:右击login文件夹选择上传并部署:云端安装依赖(不上传node_modules),显示上传成功提示。3.使用云函数获取openid根目录app.js中获取openid:4.为防止一个用户在数据库中出现多条登录记录,需要将o_java 小程序退出登录

推荐文章

热门文章

相关标签