Java集合-----Set
集合:就像一种容器,可以把多个对象放进该容器中。
Java集合分为:Set、List、Map三种体系。
  Set:无序的,不可重复的;
  List:有序的,可重复的;
  Map:代表有映射关系的集合,Map保存的每一项数据都是key-value对。
注意:Java 5后添加了Queue体系,代表一种队列集合实现。

集合和数组对比:
1.数组一旦初始化,长度不可变;
2.数组无法保存具有映射关系的数据,例如成绩表:语文---79;
3.数组的元素可以是基本类型的值,也可以是对象,而集合只能是保存对象;

Java集合由两个接口派生而出:Collection和Map,这两个是Java集合框架的根接口。
他们包含的子接口和实现类如下图:

1.Collection 接口是List、Set、Queue接口的父接口,定义了如下操作集合元素的方法:
  1.1 boolean add(Object o) 
          向集合里添加一个元素,如果集合对象被添加操作改变则返回true;
  1.2 boolean addAll(Collection c) 
          将指定 collection 中的所有元素都添加到此 collection 中,如果集合对象被添加返回true; 
  1.3 void clear() 
          移除此 collection 中的所有元素,将集合长度变为0; 
  1.4 boolean contains(Object o) 
          如果此 collection 包含指定的元素,则返回 true。 
  1.5 boolean containsAll(Collection<?> c) 
          如果此 collection 包含指定 collection 中的所有元素,则返回 true。 
  1.6 boolean equals(Object o) 
          比较此 collection 与指定对象是否相等。 
  1.7 int hashCode() 
          返回此 collection 的哈希码值。 
  1.8 boolean isEmpty() 
          如果此 collection 不包含元素,则返回 true。 
  1.9 Iterator<E> iterator() 
          返回一个Iterator对象,用于遍历集合里的元素; 
  1.10 boolean remove(Object o) 
          从此 collection 中移除指定元素的单个实例,如果存在的话返回true; 
  1.11 boolean removeAll(Collection c) 
          移除此 collection 中那些也包含在指定 collection 中的所有元素,如果存在的话返回true;  
  1.12 boolean retainAll(Collection c) 
          仅保留此 collection 中那些也包含在指定 collection 的元素,如果存在的话返回true;  
  1.13 int size() 
          返回此 collection 中的元素个数;
  1.14 Object[] toArray() 
          该方法把集合转换成一个数组,所有的集合元素变成对应的数组元素; 
eg:
import java.util.ArrayList;
import java.util.Collection;
import java.util.HashSet;

public class CollectionTest {
	public static void main(String[] args) {
		Collection c = new ArrayList();
		// 添加元素
		c.add("孙悟空");
		c.add(6);
		// 输出集合元素个数
		System.out.println("c的集合个数为:" + c.size());
		// 移除指定元素
		c.remove(6);
		System.out.println("c的集合个数为:" + c.size());
		// 判断集合是否包含某个元素
		System.out.println("判断集合是否包含某个元素:" + c.contains("孙悟空"));
		c.add("Java EE");
		System.out.println("c的集合元素:" + c);
		Collection books = new HashSet();
		books.add("孙悟空");
		books.add("Java讲义");
		// c集合是否完全包含books集合
		System.out.println("c集合是否完全包含books集合" + c.containsAll(books));
		// 用c集合减去books集合里的元素
		c.removeAll(books);
		System.out.println("c的集合元素:" + c);
		// 删除c集合里的所有元素
		c.clear();
		System.out.println("c的集合元素:" + c);
		// books 集合里面只剩下c集合里也包含的元素
		books.removeAll(c);
		System.out.println("books的集合元素:" + books);
	}
}
运行结果:
		 c的集合个数为:2
		 c的集合个数为:1
		 判断集合是否包含某个元素:true
		 c的集合元素:[孙悟空, Java EE]
		 c集合是否完全包含books集合false
		 c的集合元素:[Java EE]
		 c的集合元素:[]
		 books的集合元素:[Java讲义, 孙悟空]

2.使用Iterator接口遍历集合元素
    Iterator 主要用于遍历Collection集合中的元素,Iterator对象也被称为迭代器。
	Iterator 仅用于遍历集合,必须依附于Collection对象。
	使用 Iterator 对集合元素进行迭代时,并不是把集合元素本身传给迭代变量,而是把集合元素的值
	传给了迭代变量,所以修改迭代变量的值对集合元素本身没有任何影响。
提供的方法:
    1.boolean hasNext()如果仍有元素可以迭代,则返回 true。 
	2.Object next()返回迭代的下一个元素。 
	3.void remove()删除集合里上一次next方法返回的元素。
eg:
import java.util.Collection;
import java.util.HashSet;
import java.util.Iterator;

public class IteratorTest {
	public static void main(String[] args) {
		Collection books = new HashSet();
		books.add("A书");
		books.add("B书");
		books.add("C书");
		// 获取books集合对应的迭代器
		Iterator it = books.iterator();
		while (it.hasNext()) {
			// it.next()返回的是一个对象类型,需要强制转换
			String book = (String) it.next();
			System.out.println(book);
			if (book.equals("B书")) {
				// 从集合中删除上一次next方法返回的元素
				it.remove();
			}
			// book变量赋值,不会改变集合元素本身
			book = "C书";
		}
		System.out.println(books);
	}
}

3.使用foreach循环遍历集合元素
  比起Iterator更加简洁,同样集合不能被改变。
eg:
import java.util.Collection;
import java.util.HashSet;
import java.util.Iterator;

public class ForeachTest {
	public static void main(String[] args) {
		Collection books = new HashSet();
		books.add("A书");
		books.add("B书");
		books.add("C书");
		for(Object obj:books){
			String book=(String)obj;
			System.out.println(book);
			if(book.equals("B书")){
				books.remove(book);
			}
		}
		System.out.println(books);
	}
}

4.Set 集合
无序的,不可重复,与Collection基本一样,无提供而外的方法。
  4.1 HashSet 类:按hash算法存储集合中的元素,具有很好的存取和存取性能,具有以下特点:
      1).不能保证元素的排列顺序,顺序可能和添加顺序不同,也可能发生改变。
	  2).HashSet不是同步的,多个线程同时对HashSet操作,必须通过代码保证其同步。
	  3).集合元素可以是null;
HashSet 集合判断两个元素是否相等是同时通过equals()方法和两个对象的hashCode()方法返回值是否相等,
又因为set集合的规则是不能存在相同的元素,所以在重写该对象对应类的equals()方法,则也应该重写hashCode()方法。
eg:
import java.util.HashSet;

// 类A的equals()方法的返回true,但没有重写其hashCode()方法
class A {
	public boolean equals(Object obj) {
		return true;
	}
}

// 类B的hanshCode()方法总是返回1,但是没有重写equals()方法
class B {
	public int hashCode() {
		return 1;
	}
}

// 类C的hashCode()方法返回2,且重写了equals()方法
class C {
	public int hashCode() {
		return 2;
	}

	public boolean equals(Object obj) {
		return true;
	}
}

public class HashSetTest {
	public static void main(String[] args) {
		HashSet books = new HashSet();
		// 分别想books集合中添加两个A对象,两个B对象,两个C对象
		books.add(new A());
		books.add(new A());
		books.add(new B());
		books.add(new B());
		books.add(new C());
		books.add(new C());
		System.out.println(books);
	}
}
hashCode()方法重写的基本规则
  1).程序运行过程中,同一个对象多次调用hashCode()方法应该返回相同的值;
  2).当两个对象通过equals()方法比较返回true时,两个对象的hashCode()方法应返回相等值;
  3).对象中用作equals()方法比较的标准field,都应该用计算hashCode值。
4.2 LinkedHashSet 类
	LinkedHashSet集合也是更加hashCode值来决定元素的存储位置,但他可以保存元素插入的顺序,
也因为要维护元素的插入顺序,因此性能略低于HashSet的性能,但是迭代访问所有元素时有很好的性能。
LinkedHashSet 同样不能出现相同的元素,因为它依然是HashSet.
eg:
import java.util.LinkedHashSet;

public class LinkedHashSetTest {
	public static void main(String[] args) {
		LinkedHashSet books = new LinkedHashSet();
		books.add("A书");
		books.add("B书");
		System.out.println(books);
		books.remove("A书");
		books.add("C书");
		System.out.println(books);
	}
}
运行结果:
[A书, B书]
[B书, C书]
  
4.3 TreeSet 类
	TreeSet可以确保集合元素处于排序状态(元素有序),它除了提供HashSet有的方法外还提供了以下方法:
	1).Comparator comparator():如果采用的是定制排序,返回所使用的Comparator;
	              如果采用自然排序,返回null。
	2).Object first() 返回集合中的第一个元素
	3).Object last() 返回集合中的最后一个元素
	4).Object lower(Object e)返回集合中位于指定元素之前的元素(既小于指定元素的最大元素,参考元素不需要是TreeSet集合里的元素)
	5).Object higher(Object e)返回集合中位于指定元素之后的元素(既大于指定元素的最大元素,参考元素不需要是TreeSet集合里的元素)
	6).SortedSet subSet(E fromElement, E toElement) )返回此Set的子集合,范围从fromElement(包含)到toElement(不包含)
	7).SortedSet headSet(Object toElement)返回小于toElement小的set子集
	8).SortedSet tailSet(Object fromElement)返回大于或者等于fromElement的Set子集
eg:
import java.util.TreeSet;

public class TreeSetTest {
	public static void main(String[] args) {
		TreeSet nums = new TreeSet();
		nums.add(5);
		nums.add(2);
		nums.add(-1);
		nums.add(3);
		nums.add(6);
		System.out.println(nums);
		// 输出集合中第一个元素
		System.out.println(nums.first());
		// 输入元素中最后一个
		System.out.println(nums.last());
		// 返回小于4的,不包含4的元素集合
		System.out.println(nums.headSet(4));
		// 返回大于等于3的元素集合
		System.out.println(nums.tailSet(3));
		// 返回大于等于1小于4的子集合
		System.out.println(nums.subSet(1, 4));
	}
}
运行结果:
		[-1, 2, 3, 5, 6]
		-1
		6
		[-1, 2, 3]
		[3, 5, 6]

4.4 EnumSet 类
    EnumSet是一个枚举类设计的集合类,EnumSet中的每个元素都必须是指定枚举类型的枚举值。
EnumSet的集合元素也是有序的,以枚举值在枚举类的定义顺序来决定集合元素的顺序。
	EnumSet不允许加入null元素,否则会报错。EnumSet内部以单位向量存储,占用内存小,运行高效,尤其批量操作。
	EnumSet提供了如下常用static方法创建对象:
	1).allOf(Class<E> elementType) 
	      创建一个指定枚举类里所有包含枚举值的EnumSet集合 
	2).complementOf(EnumSet<E> s) 
          创建一个其元素类型与指定枚举 set 相同的枚举 set,最初包含指定 set 中所不包含的此类型的所有元素。 
	3).copyOf(Collection<E> c) 
          使用一个普通集合来创建EnumSet集合 
	4).copyOf(EnumSet<E> s) 
          创建一个与指定EnumSet具有相同元素类型、相同集合元素的EnumSet集合
	5).noneOf(Class<E> elementType) 
          创建一个具有指定元素类型的空枚举 set。 
	6).of(E e1, E e2, E e3, E e4, E e5......) 
          创建一个最初包含指定元素的枚举 set。 
	7).range(E from, E to) 
          创建一个包含从frome枚举值到to枚举值方位内的所有枚举值的EunmSet集合 
eg:
import java.util.EnumSet;

enum Season {
	A, B, C, D;
}

public class EnumSetTest {
	public static void main(String[] args) {
		// 创建一个EnumSet集合,集合元素就是Season枚举类的全部枚举值
		EnumSet es1 = EnumSet.allOf(Season.class);
		System.out.println(es1);
		// 创建一个控计划,只想Season枚举类
		EnumSet es2 = EnumSet.noneOf(Season.class);
		System.out.println(es2);
		// 添加两个元素
		es2.add(Season.D);
		es2.add(Season.A);
		System.out.println(es2);
		// 以指定枚举值创建EnumSet集合
		EnumSet es3 = EnumSet.of(Season.A, Season.B);
		System.out.println(es3);
		// 创建从B到D的EnumSet
		EnumSet es4 = EnumSet.range(Season.B, Season.D);
		System.out.println(es4);
		// 创建与es4没有的Season原色的EnumSet
		EnumSet es5 = EnumSet.complementOf(es4);
		System.out.println(es5);
	}
}
运行结果:
		[A, B, C, D]
		[]
		[A, D]
		[A, B]
		[B, C, D]
		[A]

5 各Set实现类性能分析
	HashSet 和 TreeSet ,HashSet的整体性能总比TreeSet好,特别是添加和查询操作,只有当一个保持排序的Set时
才使用TreeSet。
	LinkedHashSet 和 HashSet ,HashSet的插入和删除略快,但是LinkedHashSet的遍历会比HashSet更快。
	EnumSet 是所有set中性能最好的,但它只鞥呢保存同一个枚举类的值作为集合。
	set的三个实现类HashSet、TreeSet、EnumSet都是线程不安全的。多个线程访问或操作Set,必须手动保证该Set的同步性.

Logo

权威|前沿|技术|干货|国内首个API全生命周期开发者社区

更多推荐