0%

集合

有时候需要存储一组数据,之前使用数组,但是数组具有固定的容量,而在写程序时并不知道需要多少对象,在java.util包下提供了一套完整的集合类,包含List、Set、Queue、Map。java集合类都可以自动地调整自己的大小。

在创建集合时,经常使用泛型,可以在编译期防止将错误的类型放入到集合中。

集合概念

集合分为两个基本接口

  • 集合(Collection):一个独立元素的序列,List以插入顺序保存元素,Set不能包含重复元素,Queue按照排队规则来确定对象产生的顺序(一般是插入顺序)

  • 映射(Map):一组成对的”键值对”对象,允许使用键来查找值。map允许我们使用一个对象来查找另一个对象

    Arrays.asList()的输出是一个List,但是底层实现是数组,没法调整大小。

    1
    2
    List<String> list = Arrays.asList("123","234");
    list.add("345");//java.lang.UnsupportedOperationException

List

存储有序,可以重复的元素,相当于动态数组
集合中元素所在类要重写equals方法

  • ArrayList
  • LinkedList
  • Vector

两种类型的list

  • ArrayList:擅长随机访问元素,但在List中间插入和删除元素时速度较慢

  • LinkedList:擅长在List中间进行插入和删除操作,提供了优化的顺序访问,对于随机访问相对较慢

List特性

  • 允许插入重复元素
  • 允许插入多个null元素
  • List提供了ListIterator迭代器,可以提供双向访问

ArrayList和Vector的异同点

相同点

  • 两者都是基于索引的,内部使用数组

  • 两者维护插入顺序,可以根据插入顺序来获取元素

  • ArrayList和Vector的迭代器实现都是fail-fast的

  • ArrayList和Vector两者都允许null值,也可以使用索引值对元素进行随机访问

不同点

  • Vector是同步的,ArrayList不是,但是已过时,推荐使用CopyOnWriteArrayList
  • ArrayList比Vector快

LinkedList链表

LinkedList添加了一些方法,使其可以被用作栈,队列和双向队列,方法差异

  • getFirst()和element()是相同的,都是返回列表的头部,而并不删除它,如果list为空,则抛出NoSuchElementException异常。peek()方法在列表为空时返回null

  • removeFirst()和remove()方法相同,删除并返回列表头部元素,在列表为空时返回NoSuchElementException异常,poll()在列表为空时返回null

  • addFirst()在列表头部插入一个元素

  • offer()和add()和addLast()相同,在列表尾部添加一个元素

  • removeLast()删除并返回列表的最后一个元素

ArrayList和LinkedList的区别

  • ArrayList是由数组支持的基于索引的数据结构,支持对元素的随机访问,复杂度为O(1);LinkedList是基于链表的,存储一系列的节点数据,每个节点都与前一个节点和下一个节点相连。虽然存在使用索引获取元素的方法,但是内部实现是从起始点开始遍历的,时间复杂度是O(n)
  • 与ArrayList相比,在LinkedList中插入、添加和删除一个元素会更快
  • LinkedList比ArrayList消耗更多内存,因为需要存储前后节点的引用

迭代器Iterators

Iterator

Iterator接口提供了遍历任何Collection的接口,取代了java集合框架中的Enumeration,迭代器允许调用者在迭代过程中移除数据

​ iterator只能单向移动

  • 使用iterator()方法使集合返回一个Iterator。Iterator将准备好返回序列中的第一个元素。

  • 使用next()方法获得序列中的下一个元素。

  • 使用hasNext()方法检查序列中是否含有元素。

  • 使用remove()方法将迭代器最近返回的那个元素删除。

Enumeration和iterator的区别

  • Enumeration的速度是Iterator的两倍,使用内存也少,但是iterator更加安全,使得一个集合在遍历时,会阻止其他线程去修改集合,Iterator允许移除元素
  • Iterator支持fail-fast机制,而Enumeration不支持,Iterator遍历时,当其他线程修改集合内容时,迭代器会立马感知到,引起快速失败,抛出ConcurrentModificationException异常
  • Enumeration本身不支持同步,只是在Vector和hashtable实现Enumeration时,添加了同步

ListIterator

  • ListIterator是Iterator的子类型,只能由各种List类生成,
  • Iterator只能向前移动,ListIterator可以双向移动,可以生成迭代器在列表中指向位置的后一个和前一个元素的索引。

栈stack

栈是后进先出(LIFO),最后压入(push)栈的元素,第一个被弹出(pop)栈。

java1.0中有一个stack类,但是设计的不好,Java6添加了ArrayDeque,其中包含了直接实现栈功能的方法

  • push()添加元素到栈底
  • peek()和pop()返回对象,peek()返回栈顶元素,但不从栈顶删除,而pop()删除并返回栈顶元素

Set

Set不保存重复的元素。查找是Set最重要的操作,选择HashSet实现,针对快速查找进行了优化。

存储无序,不可重复
添加Set集合中的元素所在类要重写equals和hashCode方法

无序性:指的是元素在底层存储的位置是无序的

  • HashSet没有顺序,使用散列函数,HashSet维护顺序与TreeSet或LinkedHashSet不同,因为它们实现具有不同的元素存储方式

  • LinkedHashSet 也使用了散列,使用了链表来维护元素的插入顺序,结果将按元素的插入顺序显示。元素必须定义hashCode()和equals()方法,遍历元素时,会按照添加的进去的顺序

  • TreeSet将元素存储在红黑树数据结构,可以从Set中获取有序序列,其中元素必须实现Comparable接口

    要求添加进TreeSet的必须是同一个类的
    两种排序方式

    1)自然排序:添加的类要实现Comparable接口,重写compareTo方法
    2)定制排序: 使用TreeSet(Comparator<? super E> comparator) 构造器    重写compare(T o1, T o2);方法
    

Map

键值
key不可重复,一个key-value组成一个entry

map的分类

HashMap专为快速访问而设计,TreeMap保持键始终处于排序状态,没有HashMap快。LinkedHashMap按插入顺序保存其元素,但使用散列提供快速访问的能力。

  • HashMap 基于哈希表的实现。为插入和定位键值对提供了常数时间性能。可以通过构造方法调整性能,这些构造方法允许设置哈希表的容量和负载因子。可以添加key为null,value为null
  • LinkedHashMap 与HashMap类似,但是当遍历时,可以按照插入顺序或最近最少使用(LRU)顺序获取键值对。只比HashMap略慢,一个例外是在迭代时,由于其使用链表维护内部顺序,所以会更快些,按照添加进Map的顺序遍历
  • TreeMap 基于红黑树实现,当查看键或键值对时,按排序顺序(由Comparable或Comparator确定)。TreeMap的侧重点在于按排序顺序获得结果。TreeMap是唯一使用subMap()方法的Map,返回红黑树的一部分,按照key所在类的指定属性进行排序,要求key是同一个类的对象(同TreeSet)
  • WeakHashMap 一个具有弱键的Map,为了解决某些类型的问题,它允许释放Map所引用的对象。如果Map外没有对特定键的引用,则可以对该键进行垃圾回收
  • ConcurrentHashMap 不使用同步锁定的线程安全Map
  • IdentityHashMap 使用==来比较键,仅用于解决特殊问题
  • HashTable 线程安全的Map,不可添加key为null,value为null的 子类Properties 处理属性文件

HashMap工作情况

HashMap在Map.Entry静态内部类实现存储键值对,HashMap使用哈希算法,在put和get方法中,使用hashCode和equals方法,使用put方法时,使用key的hashcode和哈希算法来找出存储键值对的索引,Entry存储在LinkedList中,如果存在entry,使用equals检查传递的key是否存在,如果存在,会覆盖掉value,如果不存在,会创建一个新的entry然后保存。get的时候也是先通过hashcode找到数组中的索引,然后使用equals找到正确的Entry,在进行取值

HashMap默认初始容量是16,负载因子是0.75,阈值是容量乘以负载因子,当map的大小比阈值大时,HashMap会进行扩容并对map的内容进行重新哈希。

HashMap和HashTable的区别

  • HashMap允许key和value为null,HashTable不允许
  • HashTable是同步的,HashMap不是
  • HashMap可以转为LinkedHashMap,使得遍历有序,HashTable的顺序无法预知
  • HashMap提供对key的set进行遍历,所以是fail-fast的,HashTable提供对key的Enumeration进行遍历,不支持fail-fast
  • HashTable应该被CocurrentHashMap替代

队列

队列操作

队列是一个先进先出(FIFO)集合,LinkedList实现了Queue接口,并且提供了一些方法支持队列行为

  • offer()在队列尾部插入一个元素

  • peek()和element()返回队列头而不删除它,如果队列为空,element()抛出NoSuchElementException,而peek()返回null

  • poll()和remove()都删除并返回队头元素,如果队列为空,poll()返回null,remove()抛出NoSuchElementException

PriorityQueue优先级队列

优先级队列声明下一个弹出的元素是最需要的元素。

BlockingQueue队列

是concurrent包下的类,在进行检索或移除一个元素的时候,会等待队列变成非空;当添加一个元素的时候,会等待队列中的可用空间。主要用于实现生产者-消费者模式

Collections工具类

unmodifiableCollection方法

Collections.unmodifiableCollection(list);Collections.unmodifiableList(list);使用该方法会创建一个只读集合,所有改变集合的操作都会抛出UnsupportedOperationException

1
2
3
public static <T> Collection<T> unmodifiableCollection(Collection<? extends T> c) {
return new UnmodifiableCollection<>(c);
}

synchronizedCollection方法

Collections.synchronizedCollection(list)方法可以创建一个线程安全的集合

1
2
3
public static <T> Collection<T> synchronizedCollection(Collection<T> c) {
return new SynchronizedCollection<>(c);
}

问题

1、遍历时移除List中的元素

使用forEach和Iterator

在使用forEach遍历时,实际上是使用的Iterator,使用的核心方法是hasNext()和next(),但是使用的是list.remove,来看个例子

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
//源码
public class TestList {
public static void main(String[] args) {
List<String> list = new ArrayList<>();
list.add("J");
list.add("A");
list.add("V");
list.add("A");
for (String s: list) {
list.remove(s);
}
}
}

//编译之后
public class TestList {
public TestList() {
}

public static void main(String[] args) {
List<String> list = new ArrayList();
list.add("J");
list.add("A");
list.add("V");
list.add("A");
Iterator var2 = list.iterator();
while(var2.hasNext()) {
String s = (String)var2.next();
list.remove(s);
}
}
}

之前说过,Iterator在遍历时,不允许其他线程对该集合进行操作,看一下ArrayList的iterator是怎么实现的

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
public E next() {
checkForComodification();
int i = cursor;
if (i >= size)
throw new NoSuchElementException();
Object[] elementData = ArrayList.this.elementData;
if (i >= elementData.length)
throw new ConcurrentModificationException();
cursor = i + 1;
return (E) elementData[lastRet = i];
}

final void checkForComodification() {
if (modCount != expectedModCount)
throw new ConcurrentModificationException();
}

在每次获取下一个元素时,都会比较modCount 和 expectedModCount

然后在调用的list的remove方法会导致modCount增加(modCount表示被修改次数)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
public E remove(int index) {
rangeCheck(index);

modCount++;
E oldValue = elementData(index);

int numMoved = size - index - 1;
if (numMoved > 0)
System.arraycopy(elementData, index+1, elementData, index,
numMoved);
elementData[--size] = null; // clear to let GC do its work

return oldValue;
}

此时iterator的next方法中两个变量就不一致了,就会抛出ConcurrentModificationException异常

再看一下如果使用iterator的remove方法

1
2
3
4
5
6
7
8
9
10
11
12
13
14
public void remove() {
if (lastRet < 0)
throw new IllegalStateException();
checkForComodification();

try {
ArrayList.this.remove(lastRet);
cursor = lastRet;
lastRet = -1;
expectedModCount = modCount;
} catch (IndexOutOfBoundsException ex) {
throw new ConcurrentModificationException();
}
}

iterator在remove之后会将modCount的值赋给expectedModCount,就不会出现两个变量不等的情况了

不使用forEach遍历

使用普通for循环,有两种方式,第一种是使用正序遍历,但是进行remove操作之后要把遍历的索引进行修正减一,否则在移除下一个的时候就会出错,第二种就是使用倒序遍历

1
2
3
4
5
6
7
8
9
10
11
12
// 正序遍历
for (int i = 0; i < list.size(); i++) {
String s = list.remove(i);
i = i - 1;
System.out.println(s);
}

//倒序遍历
for (int i = list.size() - 1; i >= 0; i--) {
String s = list.remove(i);
System.out.println(s);
}

2、fail-fast和fail-safe

java.util包中集合类被设计为fail-fast的,而java.util.concurrent中集合为fail-safe的。fail-fast迭代器抛出ConcurrentModificationException,而fail-safe迭代器从不抛出ConcurrentModificationException,Iterator的安全失败是基于对底层集合做拷贝,不受源集合上修改的影响

fail-fast

fail-fast迭代器抛出ConcurrentModificationException,通过modCount来进行实现,在进行迭代时,每次对于元素的修改都会修改该值,一旦该值被修改了,就会抛出异常

1
2
3
4
5
6
7
8
9
// 当Itr被实例化的时候,记录一下迭代器被实例化时ArrayList的修改次数(在用ArrayList进行add/remove操作时modCount每次都加一)
int expectedModCount = modCount;

// 检查是否被修改了
final void checkForComodification() {
// 当修改次数与Itr被实例化时的修改次数不一致时,说明在进行迭代操作的时候其他线程进行了ArrrayList的add/remove操作,此时抛出ConcurrentModificationException,即为fast-fail快速失败机制
if (modCount != expectedModCount)
throw new ConcurrentModificationException();
}

3、Arrays.asList

这个方法返回的是一个ArrayList,不过这个ArrayList是Arrays类的内部类,在调用add方法的时候会直接报错

UnsupportedOperationException这是运行时异常

1
2
3
public void add(int index, E element) {
throw new UnsupportedOperationException();
}

欢迎关注我的其它发布渠道