商务服务
Java面试题系列——JavaSE面试题(MySQL二)
2024-11-19 03:05

整体策略:通过多线程分批次对大量数据进行插入操作实现高效插入。

Java面试题系列——JavaSE面试题(MySQL二)

1.比如数据量为10w,将10w条数据分为10个1w条,然后通过创建多(10)个线程,对这10个1w数据进行插入操作。

2.通过遍历数据去进行插入操作实际上就是一条一条的插入,每执行一次insert就要向数据库传一条sql,数据库编译sql,然后执行,这里用的是Statement。这样做插入效率明显很低,所以我们需要采用批量插入大方式去进行,这里需要用到PreparedStatement。两者的区别在文章末。  

 

3.由上例可以看出每10000条数据进行一次事务的提交,也就是说事务的粗粒度太大,数据库每次面临一万条数据的插入,压力也会很大,所以我们可以再将上述案例进行优化,每一百条数据进行一次事务的提交。

4.最后如果想要查看数据库中已经插入的数据条数,通过执行sql语句效率也会比较低,可以通过在内存中设置一个n,来记录插入数据条数,当然,在多线程的情况下,需要对n进行加锁操作。Statement和PreparedStatement的区别

statement是每次执行都会向数据库发送sql,然后数据库进行预编译然后执行。

PreparedStatement是通过AddBatch()将多次执行操作都放在一起,然后再向数据库发送sql,然后数据库编译执行。

联合索引:就是创建一个索引,索引中包含多个列。

普通索引:即单个索引,一个索引包含一个列。

区别

联合索引中列的顺序非常重要,从左原则。a,ab,ba,abc。一般来说,列表搜索需要多个列查询,此时就可以使用联合索引,都是and的关系。 单个索引:一个一个起作用,也就是说有三个单个索引,哪个条件查询在前哪个起作用,其他不起作用。

将远程数据库里面的数据导出为 sql 到本地,导入本地数据库后进行操作,但这一过程也很缓慢,一个百万级数据库在 navicat 里面可能要导个半个小时。

基本思路是复制原表 A 结构新建一个表 B,对表 B 添加 UNIQUE 约束,然后将表 A 中的数据逐条插入表 B,约束会自动实现去重。

1.复制表结构

 

2.为表格添加约束条件

 

3.为新表中添加数据(约束条件自动去重)

 
 

 
 

1.左外连接

 

2.右外连接

 
 
 
 
 

其实这个就是二分查找的一种思想,也叫折半查找,每一次,我们都把候选数据缩小了一半。如果数据已经排过序的话,这种方式效率比较高。

所以第一个,我们可以考虑用有序数组作为索引的数据结构。有序数组的等值查询和比较查询效率非常高,但是更新数据的时候会出现一个问题,可能要挪动大量的数据(改变index,所以只适合存储静态的数据。

为了支持频繁的修改,比如插入数据,我们需要采用链表。链表的话,如果是单链表,它的查找效率还是不够高。所以,有没有可以使用二分查找的链表呢?为了解决这个问题,BST(Binary SearchTree)也就是我们所说的二叉查找树诞生了。

二叉查找树的特点是什么?左子树所有的节点都小于父节点,右子树所有的节点都大于父节点。投影到平面以后,就是一个有序的线性表。

二叉查找树既能够实现快速查找,又能够实现快速插入。但是二叉查找树有一个问题:就是它的查找耗时是和这棵树的深度相关的,在最坏的情况下时间复杂度会退化成O(n)。比如,我们插入的数据刚好是有序的,比如 [2、6、11、13、17、22] 这个时候我们的二叉查找树变成了什么样了呢

它会变成链表(我们把这种树叫做“斜树”,这种情况下不能达到加快检索速度的目的,和顺序查找效率是没有区别的。为了解决这一问题,人们发明了平衡二叉树,叫做Balanced binary search trees,或者AVL树(AVL 是发明这个数据结构的人的名字)。

人们在二叉搜索树的基础上增加了约束,具有以下性质:它是一棵空树或它的左右两个子树的高度差的绝对值不超过1,并且左右两个子树都是一棵平衡二叉树。

B树的英文是Balance Tree,也就是多路平衡查找树。简写为B-Tree。它的高度远小于平衡二叉树的高度。

Java面试题系列——JavaSE面试题(MySQL二)

B树作为多路平衡查找树,它的每一个节点最多可以包括M个子节点,M称为B树的阶。每个磁盘块中包括了关键字和子节点的指针。如果一个磁盘块中包括了x个关键字,那么指针数就是x+1。对于一个100阶的B树来说,如果有3层的话最多可以存储约100万的索引数据。对于大量的索引数据来说,采用B树的结构是非常适合的,因为树的高度要远小于二叉树的高度。

你能看出来在B树的搜索过程中,我们比较的次数并不少,但如果把数据读取出来然后在内存中进行比较,这个时间就是可以忽略不计的。而读取磁盘块本身需要进行I/o操作,消耗的时间比在内存中进行比较所需要的时间要多,是数据查找用时的重要因素。B树相比于平衡二叉树来说磁盘Ⅰ/0О操作要少,在数据查询中比平衡二叉树效率要高。所以只要树的高度足够低,IO次数足够少,就可以提高查询性能。  

 B Tree 的效率已经很高了,为什么 MySQL 还要对 B Tree 进行改良,最终使用了B+Tree呢?总体上来说,这个B树的改良版本解决的问题比B Tree更全面。我们来看一下InnoDB里面的B+树的存储结构

Java面试题系列——JavaSE面试题(MySQL二)

MySQL中的B+Tree有几个特点

  1. 它的关键字的数量是跟路数相等的

  2. B+Tree 的根节点和枝节点中都不会存储数据,只有叶子节点才存储数据。搜索到关键字不会直接返回,会到最后一层的叶子节点。

  3. B+Tree的每个叶子节点增加了一个指向相邻叶子节点的指针,它的最后一个数据会指向下一个叶子节点的第一个数据,形成了一个有序链表的结构。

  4. 它是根据左闭右开的区间 [ )来检索数据

持续更新中,敬请期待

参考文章

【Mysql】大批量(百万级)数据插入数据库应该怎么做(提高效率)?_小树ぅ的博客-CSDN博客_mysql高效导入大批量数据

 MySQL 的一次百万级数据快速去重经验分享_业余草的博客-CSDN博客

MySQL索引对NULL值的处理-蒲公英云

mysql索引的数据结构及原理_程涯的博客-CSDN博客_mysql索引的数据结构

mysql的索引是什么数据结构_mysql索引的数据结构是什么_婷.zhu的博客-CSDN博客

mysql索引的数据结构_small_engineer的博客-CSDN博客_mysql索引数据结构

    以上就是本篇文章【Java面试题系列——JavaSE面试题(MySQL二)】的全部内容了,欢迎阅览 ! 文章地址:http://fabua.ksxb.net/news/782.html 
     文章      相关文章      动态      同类文章      热门文章      栏目首页      网站地图      返回首页 海之东岸资讯移动站 http://fabua.ksxb.net/mobile/ , 查看更多   
最新文章
赛场直击|把握眼前时刻 迎面冲锋
“这是一场季后赛级别的比赛,我们的队员们保持了足够的专注,虽然上半场球队的外线火力没有完全打开,但下半时面对强敌,我们展
官宣!落户怀化辰溪
辰溪县是湖南省首个“篮球之乡”,孝坪镇是重要承载地,具有举办全省、全国篮球赛事的天然阶梯篮球场、工人俱乐部等场馆设施。孝
张明 | 如何大力提振消费?
注:本文发表于《财经》杂志,转载请务必注明出处。文中配图摄于云南大理沙溪古镇。在2024年,受各种因素影响,消费对中国经济增
谢浩男到南京了!准备请吃南京菜,谢爸痛苦喝奶茶,嘴里却说好甜
3月23日上午,谢浩男安全抵达南京,这次谢爸带着全家人送他回学校,似乎又有好戏看了。一早,全家人就收拾好了行李,大包小包的
一图看懂比亚迪仰望U7:贵不到10万 选它还是小米SU7 Ultra
快科技3月28日消息,昨晚品牌推出全新轿车仰望U7,共推出四款车型(均提供EV和插混)。仰望U7定位于“百万级行政旗舰”,对标、
20+14,火箭丧失两大优势!申京难堪大任,乌度卡赛后表态成关键
北京时间3月24日火箭主场对阵掘金,全场比赛结束火箭以111-116输给了掘金。火箭在近期状态火热,反观掘金这边已经是缺席多场比赛
最低仅需16.98万起的路虎发现运动版,能买吗?
前阵子,网络上爆出了车型一口价16.98万元的降价海报。虽说该海报上明确写出了这是只有大客户才可享受到的价格,但有一说一,只
每周艺汇丨首演必看!今春必看的舞台指南
当现实与舞台重叠,三场不同维度的生命叙事即将开演——烽烟中的战歌 《寻找李二狗》带你重温家国情怀,时空迷雾中的《尘封十三
采访了索尼高层,才理解为什么只有索尼敢称“把影院带回家”
老马在AWE上泡了整整一个礼拜,也目睹了一个个展台如何拔地而起。要说2025年AWE上令人印象最深刻的展台,无数人把票投给了索尼,
平安银行信用卡2024年在稳健中前行:精细化存客经营,风险调优谋长远
本文来源:时代周报 作者:穆白A股上市银行首份年报出炉。近日,平安银行率先发布2024年年报,该行信用卡业务的成绩单也随之揭开