首页 > > 程序设计 > Java技术 >

HashMap理解

2020-05-24 16:11:56来源：博客园阅读 ()

HashMap理解

hashCode() 和equals() 方法的重要性体现在什么地方？

Java中的HashMap使用hashCode()和equals()方法设置值，根据键获取值的时候也会用到这两个方法。

怎样设置的值？

hashCode()获得 hash值。而hash值用来确定hashmap中内部 Node数组的下标。
之后通过比较hash值与该下标处的key的hash值是不是相等，并使用equals方法比较两个对象是否相同
- 如果hash和equals 都相等的话，说明两个键是等价的
- 如果只有hash值相等的话，此时是 hash冲突了，需要用链地址法解决
- （这里可以引出，如果只修改了equals方法的话而没有修改hash方法，是不行的。两个对象可能equals相等，但是由于没有重写hash方法，有可能导致hash不同。放入元素的key是hash1，取元素的key是hash2，虽然两个key的equals重写之后是相等的，但是key的hash没有重写，所以会取不出来）

来看源码：

1 （前导）hash方法调用key的hashCode()方法（如果key的hashCode()方法没有重写的话，就是用的Object的hashCode()方法）

    static final int hash(Object key) {
        int h;
        return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
    }

2 当往HashMap中存入一个值的时候，调用的其实是下面这个方法。预先计算了hash(key)

    public V put(K key, V value) {
        return putVal(hash(key), key, value, false, true);
    }

3 比较 hash（通过hashCode()方法得到）是否相同和比较 equals()是否相等。依据情况存入值

   final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
        // 如果数组为空的话，进行初始化
        if ((tab = table) == null || (n = tab.length) == 0)
            n = (tab = resize()).length;
        // 通过 （hash值和数组长度-1） 得到key的下标，
        if ((p = tab[i = (n - 1) & hash]) == null)
            // 如果该下标处的值为空存入元素
            tab[i] = newNode(hash, key, value, null);
        else {
            Node<K,V> e; K k;
            // 通过比较hash值和判断equals是否相等，如果相等覆盖该值
            if (p.hash == hash &&
                ((k = p.key) == key || (key != null && key.equals(k))))
                e = p;
            else if (p instanceof TreeNode)
                ...
            else {
                // HashMap采用的是链定址法
                for (int binCount = 0; ; ++binCount) {
                    // 一般情况下，如果链表的下一个是空的话，就插入到下一个中
                    if ((e = p.next) == null) {
                        p.next = newNode(hash, key, value, null);
                        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                            treeifyBin(tab, hash);
                        break;
                    }
                    // 如果链表中间存在相同的键，就覆盖该值，并跳出循环
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        break;
                    p = e;
                }
            }

Java中的HashMap的工作原理是什么？

HashMap采用的是 数组+链定址法 ，HashMap的内部中有一个叫做Node的内部类。HashMap其实就是维护了这个Node内部类数组 Node<K,V>[]。通过hashCode()方法得到hash址，然后通过和 数组长度-1 做位运算与存入数组的下标值。

如果该下标值处的位置没有值，就填入该位置
如果有值了，就比较 hash值是否相同和 equals()是否相等，相等就可以覆盖该值
否则将递归到该处的链表的最末尾（中间有相等的也可以覆盖）

什么是hashmap?

hashmap是一个散列表，存储的内容是 键值对（key-value）映射，

HashMap 继承于AbstractMap，实现了Map、Cloneable、java.io.Serializable接口。

hashmap 是线程不安全的，所以它的内部有一个 modCount 变量，表示修改次数。其它线程可能会修改hashmap的结构（删除、增加），而此线程在迭代此时就会抛出 ConcurrentModifiedException。

初始容量大小是16，加载因子是0.75。也就是说在map到达12的时候，会扩容到两倍

    /**
     * Constructs an empty <tt>HashMap</tt> with the default initial capacity
     * (16) and the default load factor (0.75).
     */
    public HashMap() {
        this.loadFactor = DEFAULT_LOAD_FACTOR; // all other fields defaulted
    }

使用的是通过类似于数组下标的方式查找、删除、更新元素等操作，非常高效。但是，当hash的冲突比较多的时候，那么一个数组下标处有多个元素。此时java中的hashmap使用的是链定址法。就是数组+链表。发生hash冲突的时候，就在该下标处的链表末尾添加（如果中间有相等的键，就会覆盖）

如何构造一致性哈希算法。

？？？

Object作为HashMap的key的话，对Object有什么要求吗？

要求Object中hashcode不能变。

简单的说就是 Object的equals方法和hashCode方法需要满足一致性要求。而Object的equals方法是比较两个对象的地址，而 hashCode则是 C/C++的原生方法（也是获取内存地址值）。

两者刚好对应，hashcode改变了就可能和equals对应不上。

解释：

HashMap中是同时通过 hahsCode() 方法和 equals() 方法确定 key位置的

而 Object的 equals方法比较的是两个变量的内存地址是否相同

    public boolean equals(Object obj) {
        return (this == obj);
    }

Object 的 hashCode是原生方法

    public native int hashCode();

hashCode方法的一致约定要求
（1）、在java应用的一次执行过程中，对于同一个对象的hashCode方法的多次调用，他们应该返回同样的值（前提是该对象的信息没有发生变化）；
（2）、对于两个对象来说，如果使用equals方法比较返回true，那么这两个对象的hashCode值一定是相同的；
（3）对于两个对象来说，如果使用equals方法返回false，那么这两个对象的hashCode值不要求一定不同（可以相同，可以不同），但是如果不同则可以提高应用的性能。
（4）、对于Object类来说，不同Object对象的hashCode值是不同的（Object类的hashcode值表示的是对象的地址）。

hashset 存的数是有序的吗？

hashset 是无序的

为什么HashMap的长度一定是 2 的次幂

通过源码，我们可以发现每次扩容的时候，如果没有超过最大容量的话。每次 newCap都会 << 1 (增加两倍)

        if (oldCap > 0) {
            if (oldCap >= MAXIMUM_CAPACITY) {
                threshold = Integer.MAX_VALUE;
                return oldTab;
            }
            else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
                     oldCap >= DEFAULT_INITIAL_CAPACITY)
                newThr = oldThr << 1; // double threshold
        }

HashMap是通过 hash值和数组长度 - 1 的 &运算 得到数组下标的，这样可以很好的将数据分散开。而每次扩容的时候。

而　(n - 1) & hash 这个操作如果在n为2的N次幂的情况下是等同于 hash % n 取余数的值。

        if ((tab = table) == null || (n = tab.length) == 0)
            n = (tab = resize()).length;
         // 计算数组下标 i = 数组长度 & 哈希值
        if ((p = tab[i = (n - 1) & hash]) == null)
            tab[i] = newNode(hash, key, value, null);

重写equals方法的时候，为什么需要重写hashCode方法

因为，如果不重写hashCode方法。那么在获取对象的hash值的时候，会默认使用Object类的hashCode()方法。

而 HashMap()中需要通过 hashCode() 和 equals 方法设置键值对或者根据键获取值。

只重写了其中的一个的话，无法保证 hashCode方法的一致约定要求

在java应用的一次执行过程中，对于同一个对象的hashCode方法的多次调用，他们应该返回同样的值（前提是该对象的信息没有发生变化）；
对于两个对象来说，如果使用equals方法比较返回true，那么这两个对象的hashCode值一定是相同的；
对于两个对象来说，如果使用equals方法返回false，那么这两个对象的hashCode值不要求一定不同（可以相同，可以不同），但是如果不同则可以提高应用的性能。
对于Object类来说，不同Object对象的hashCode值是不同的（Object类的hashcode值表示的是对象的地址）。

参考资料： HashMap实现原理及源码分析