注:源码系列文章主要是对某付费专栏的总结记录。如有侵权,请联系删除。
Map 在面试中,占据了很大一部分的面试题,其中以 HashMap 为主,这些面试题目有的可以说清楚,有的很难说清楚,如果是面对面面试的话,建议画一画。
答:HashMap 底层是 数组 + 链表 + 红黑树
的数据结构,数组的作用主要是方便快速查找,时间复杂度是 O(1),默认大小是 16,数组的下标索引是通过 Key 的 hash 计算出来的(index = (tab.length - 1) & hash
),数组元素叫做 Node,当多个 key 的 hashcode 一致,但 key 值不同时,就叫做(hash 碰撞冲突),单个 Node 就会转化成链表,链表的查询复杂度是 O(n),当链表的长度大于等于 8 并且数组大小(tab.length)超过 64 时,链表就会转化成红黑树,红黑树的查询复杂度是 O(log(n)),简单来说,最坏的查询次数相当于红黑树的最大深度。
答:
相同点:
ConcurrentModificationException
错误。不同点:
static final int hash(Object key) {
int h;
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
// index = (tab.length - 1) & hash
以上代码是 HashMap 的 hash 算法。
这其实是个数学问题,源码中就是通过以上代码来计算 hash 的,首先计算出 key 的 hashcode,因为 key 是 Object,所以会根据 key 的不同类型进行 hashcode 的计算,接着计算 h ^ (h >>> 16)
,这么做的好处是使大多数场景下,算出来的 hash 值比较分散。
一般来说,hash 值算出来之后,要计算当前 key 在数组中的索引下标位置,可以采用取模的方式,就是:索引下标位置 = hash 值 % 数组大小
,这样做的好处,就是可以保证计算出来的索引下标值可以均匀的分布在数组的各个索引位置上,但取模操作对于处理器的计算是比较慢的,数学上有个公式,当 b 是 2 的幂次方时
, a & b = a & (b - 1)
,所以此处索引位置的计算公式我们可以更改为:(n - 1) & hash
。
此问题可以延伸出三个小问题:
答:如果 key 是数字,直接用 key % 数组大小是没有问题的,但我们的 key 还有可能是字符串,是复杂对象,这时候用 字符串或复杂对象 % 数组大小是不行的,所以需要先计算出 key 的 hash 值。
答:hash 算法是 h ^ (h >>> 16)
,为了使计算出的 hash 值更分散,所以选择先将 h 无符号右移 16 位,然后再与 h 异或,就能达到 h 的高 16 位和低 16 位都能参与计算,减少了碰撞的可能性。
答:key.hashCode() 算出来的 hash 值还不是数组的索引下标,为了随机的计算出索引的下标位置,我们还会用 hash 值和数组大小进行取模,这样子计算出来的索引下标比较均匀分布。
取模操处理器计算比较慢,处理器对 & 操作就比较擅长,换成了 & 操作,是有数学证明的支撑,提高了处理器处理的速度。
答:因为只有大小是 2 的幂次方时,才能使 hash 值 % n(tab.length) == (n - 1) & hash 公式成立。
答:
网上列举的一些其它方法,尽量不要说,因为这些方法资料很少,实战用过的人更少,如果你没有深入研究的话,面试官让你深入描述一下很难说清楚,反而留下了不好的印象,说说 HashMap 现有的措施就足够了。
答:
扩容的时机:
resize() 中的 newCap = oldCap << 1
。(ArrayList 扩容为 1.5 倍(newCapacity = oldCapacity + (oldCapacity >> 1)
))扩容的门阀值是 threshold
,每次扩容时 threshold
都会被重新计算,门阀值等于 数组大小 * 影响因子(0.75)
。
新数组初始化之后,需要将老数组的值拷贝到新数组上,链表和红黑树都有自己的拷贝方法。
答:hash 冲突指定是 key 值的 hashcode 计算相同,但 key 值不同的情况。
如果桶中的元素原本只有一个或已经是链表了,新增元素直接追加到链表尾部;
如果桶中元素已经是链表,并且链表个数大于等于 8 时,此时有两种情况:
这里不仅仅判断了链表元素个数大于等于 8,还判断了数组大小,数组容量小于 64 没有立即转化的原因,猜测主要是因为红黑树占用的空间比链表大很多,转化也比较耗时,所以数组容量小的情况下冲突严重,我们可以先尝试扩容,看看能否通过扩容来解决冲突的问题。
答:当链表元素个数太多时,遍历可能比较耗时,转化成红黑树,可以使遍历的时间复杂度降低。但转化成红黑树,有空间和转化耗时的成本,我们通过 泊松分布公式
计算,正常情况下,链表个数出现 8 的几率不到千万分之一,所以说正常情况下,链表都不会转化成红黑树,这样设计的目的是为了防止非正常情况下,比如 hash 算法出问题时,导致链表元素个数轻易大于等于 8 时,仍然能够快速遍历。
延伸问题:红黑树什么时候转化成链表?
答:当节点的个数小于等于 6 时,红黑树会自动转化为链表,主要还是考虑红黑树的空间成本问题,当节点个数小于等于 6 时,遍历链表也很快,所以红黑树会重新变成链表。
答:如果数组有了 key,但不想覆盖 value,可以选择 putIfAbsent
方法,这个方法有给内置变量 onlyIfAbsent,内置是 true,就不会覆盖,我们平时使用的 put 方法,内置 onlyIfAbsent 为 false,是允许覆盖的。
取值时,如果为空,想返回默认值,可以使用 getOrDefault
方法,方法第一参数为 key,第二参数为你想返回的默认值,如 map.get(“10”, “3”),当 map 中没有 key 为 10 的值时,会返回默认值 3,而不是为空。
HashMap<String,String > map = Maps.newHashMap();
map.put("1","1");
map.put("2","2");
map.forEach((s, s2) -> map.remove("1"));
答:不行,会报 ConcurrentModificationException,如下:
@Override
public void forEach(BiConsumer<? super K, ? super V> action) {
Node<K,V>[] tab;
if (action == null)
throw new NullPointerException();
if (size > 0 && (tab = table) != null) {
int mc = modCount;
for (int i = 0; i < tab.length; ++i) {
for (Node<K,V> e = tab[i]; e != null; e = e.next)
action.accept(e.key, e.value);
}
if (modCount != mc)
throw new ConcurrentModificationException();
}
}
发现 HashMap 重写了 Map 的 forEach 方法,会判断 modCount。建议使用迭代器的方式进行珊瑚,原理同 ArrayList 迭代器类似。
答:可以详细描述下源码的实现路径,说不清楚的话,可以画一画。
答:DTO 就是一个数据载体,可以看做拥有很多属性的 Java 类,我们可以对这些属性进行 get、set 操作。
看是什么类型的 Map。如果是 HashMap 的话,一定要覆写 equals 和 hashCode 方法,因为在 get、put 的时候,需要通过 equals 方法进行相等的判断;如果是 TreeMap 的话,DTO 需要实现 Comparable 接口,因为 TreeMap 会使用 Comparable 接口进行判断 key 的大小;如果是 LinkedHashMap 的话,和 HashMap 一样。
答:LRU,英文全称:Least recently used,中文叫做最近最少访问,在 LinkedHashMap 中,也叫做最少访问删除策略,我们可以通过 removeEldestEntry
方法设定一定的删除策略,使最少被访问的元素,在适当的时机被删除,原理是在 put 方法执行的最后,LinkedHashMap 会去检查这种策略,如果满足策略,就删除头节点。LinkedHashMap 覆写了 HashMap 的 afterNodeInsertion
方法。
保证头节点就是最少访问元素的原理是:LinkedHashMap 在 get 的时候,就会把当前访问的节点,移动到链表的尾部,慢慢的,就会使头部的节点成为最少被访问的元素。
答:因为 TreeMap 的底层就是通过排序来比较两个 key 的大小的,所以推荐 key 实现 Comparable 接口,是为了让 key 的排序往你希望的排序顺序上发展,而 String 本身已经实现了 Comparable 接口,所以使用 String 时,我们不需要额外的工作,不仅仅是 String,其它包装类型也都实现了 Comparable 接口,如 Long、Double、Float 等等。
Map 的面试题主要是 HashMap 为主,会问很多源码方面的问题,TreeMap 和 LinkedHashMap 主要以功能和场景为主,作为加分项。
Map 的面试题很多,但只要弄懂原理,题目再多变化,回答起来都会比较简单。
------------------------------------- END -------------------------------------
文章浏览阅读1.3w次。转载自 http://www.miui.com/thread-2003672-1-1.html 当手机在刷错包或者误修改删除系统文件后会出现无法开机或者是移动定制(联通合约机)版想刷标准版,这时就会用到线刷,首先就是安装线刷驱动。 在XP和win7上线刷是比较方便的,用那个驱动自动安装版,直接就可以安装好,完成线刷。不过现在也有好多机友换成了win8/8.1系统,再使用这个_mt65驱动
文章浏览阅读1k次。SonarQube是一个代码质量管理平台,可以扫描监测代码并给出质量评价及修改建议,通过插件机制支持25+中开发语言,可以很容易与gradle\maven\jenkins等工具进行集成,是非常流行的代码质量管控平台。通CheckStyle、findbugs等工具定位不同,SonarQube定位于平台,有完善的管理机制及强大的管理页面,并通过插件支持checkstyle及findbugs等既有的流..._sonar的客户端区别
文章浏览阅读3.4k次,点赞2次,收藏27次。神经图灵机是LSTM、GRU的改进版本,本质上依然包含一个外部记忆结构、可对记忆进行读写操作,主要针对读写操作进行了改进,或者说提出了一种新的读写操作思路。神经图灵机之所以叫这个名字是因为它通过深度学习模型模拟了图灵机,但是我觉得如果先去介绍图灵机的概念,就会搞得很混乱,所以这里主要从神经图灵机改进了LSTM的哪些方面入手进行讲解,同时,由于模型的结构比较复杂,为了让思路更清晰,这次也会分开几..._神经图灵机方法改进
文章浏览阅读2.8k次。一、模型迭代方法机器学习模型在实际应用的场景,通常要根据新增的数据下进行模型的迭代,常见的模型迭代方法有以下几种:1、全量数据重新训练一个模型,直接合并历史训练数据与新增的数据,模型直接离线学习全量数据,学习得到一个全新的模型。优缺点:这也是实际最为常见的模型迭代方式,通常模型效果也是最好的,但这样模型迭代比较耗时,资源耗费比较多,实时性较差,特别是在大数据场景更为困难;2、模型融合的方法,将旧模..._模型迭代
文章浏览阅读2.3k次。1、前言上传图片一般采用异步上传的方式,但是异步上传带来不好的地方,就如果图片有改变或者删除,图片服务器端就会造成浪费。所以有时候就会和参数同步提交。笔者喜欢base64图片一起上传,但是图片过多时就会出现数据丢失等异常。因为tomcat的post请求默认是2M的长度限制。2、解决办法有两种:① 修改tomcat的servel.xml的配置文件,设置 maxPostSize=..._base64可以装换zip吗
文章浏览阅读1k次,点赞17次,收藏22次。Opencv自然场景文本识别系统(源码&教程)_opencv自然场景实时识别文字
文章浏览阅读1.3k次。拷贝虚拟机文件时间比较长,因为虚拟机 flat 文件很大,所以要等。脚本完成后,以复制虚拟机文件夹。将以下脚本内容写入文件。_exsi6.7快速克隆centos
文章浏览阅读2k次。本文主要实现基于二度好友的推荐。数学公式参考于:http://blog.csdn.net/qq_14950717/article/details/52197565测试数据为自己随手画的关系图把图片整理成文本信息如下:a b c d e f yb c a f gc a b dd c a e h q re f h d af e a b gg h f bh e g i di j m n ..._本关任务:使用 spark core 知识完成 " 好友推荐 " 的程序。
文章浏览阅读367次。南京大学高级程序设计期末复习总结,c++面向对象编程_南京大学高级程序设计
文章浏览阅读3.1k次,点赞2次,收藏12次。实现朴素贝叶斯分类器,并且根据李航《统计机器学习》第四章提供的数据训练与测试,结果与书中一致分别实现了朴素贝叶斯以及带有laplace平滑的朴素贝叶斯%书中例题实现朴素贝叶斯%特征1的取值集合A1=[1;2;3];%特征2的取值集合A2=[4;5;6];%S M LAValues={A1;A2};%Y的取值集合YValue=[-1;1];%数据集和T=[ 1,4,-1;..._朴素贝叶斯 matlab训练和测试输出
文章浏览阅读1.6k次。Markdown 文本换行_markdowntext 换行
文章浏览阅读6.7w次,点赞2次,收藏37次。win10 2016长期服务版激活错误解决方法:打开“注册表编辑器”;(Windows + R然后输入Regedit)修改SkipRearm的值为1:(在HKEY_LOCAL_MACHINE–》SOFTWARE–》Microsoft–》Windows NT–》CurrentVersion–》SoftwareProtectionPlatform里面,将SkipRearm的值修改为1)重..._错误: 0xc0000022 在运行 microsoft windows 非核心版本的计算机上,运行“slui.ex