image frame

简述Oauth2的工作原理

简述互联网的工作原理

深入 OGNL 与 Mybatis 源代码分析一次 Mybatis 升级引发的线上事故

     项目中对 Mybatis 做了一次升级。前后版本如下,3.2.5 -> 3.4.4:

mybatis前后版本升级

     结果第二天巡检发现如下报错,过了两个小时业务高峰期,前台业务人员不断反馈某最核心的业务无法进行:

报错信息

     我们当时定位到错误的地方,根据经验修改之后验证通过,重新上线之后得以解决。可能涉及敏感数据,所以不展示实际的报错与弥补方案。

     以下是我在本地的问题复现。在本地的一个标准的 SSM 工程中分别引入以下两个版本的 Mybatis 依赖:

分别引入两个版本的依赖

     编写如下数据库脚本:

数据库脚本

     dao 层调用方法如下:

dao层方法调用

     当 Mybatis 依赖为 3.2.5 的较低版本时,不会报错;当 Mybatis 依赖版本为 3.4.4 的较高版本时,则会报出上面的错误:

1
invalid comparision:  java.util.HashMap and java.lang.String

     在本地问题得到复现。问题的关键在于数据库脚本中的 if 条件编译语句的这一个子句 _parameter!=’’ 将_parameter 与 ‘’ 做比较,_parameter 是 Mybatis 的一个内置对象,你不需要知道它的作用,只需要知道他是 Map 类型的就行了,显然 ‘’ 是 String 类型的。到这里我们其实已经猜出来了,正是因为这种不规范的比较导致数据库脚本执行失败(实际上是 Mybatis 编译 SQL 失败)。

     但是问题又来了,为什么 Mybatis 较低版本的时候没有问题,而较高版本则暴露出这个问题了? 我们深入源码分析一下。因为我对 Mybatis 源码比较熟悉,加上实际生产中报错的堆栈信息也很全,所以直接定位到了 Mybatis 的这个类型:

ifnode

     上述代码的作用:在我们上述 SQL 脚本中,根据 if 子句的测试语句(就是 … && _parameter!=’’ 那一坨)判断,当前 if 子句所包裹的 sql 是否需要动态编译进最终的执行sql中。当我们进一步追踪,就进入到了 OGNL 的源码中,OGNL 是一套表达式解析引擎,一直定位下去就到了具体报错的方法。到这里我们补充一下版本依赖关系:

1
2
mybatis-3.2.5  ->  ognl-2.6.9
mybatis-3.4.4 -> ognl-3.1.14

     高版本 OGNL 源码如下:

高版本 OGNL 代码

     低版本 OGNL 源码如下:

低版本 OGNL 代码

     类型标识相关的源码如下:

类型标记

     case 为 NONUMBERIC 的含义是当比较的值是非数值类型,所以 _parameter!=’’ 子句的判断自然是走该分支语句的代码。t1、t2,v1、v2 的含义是两个待比值( _parameter 和 ‘’)的类型和 value,在这个场景中分别是如下调试面板所示的(不明白的请观察为了复现问题所编写的 SQL 脚本和 dao 层语句):

调试信息如下

     解释一下:t1 = t2 = 10,表示 _parameter 与 ‘’ 都是非数值类型。v1 表明了 _parameter 是个 HashMap 类型的变量,有一个 (blurname,cat) 的键值对,v2 = ‘’。另外,类的 Class 实例中有一个 isAssignableFrom 方法,这个方法是用来判断两个类的之间的关联关系,也可以说是一个类是否可以被强制转换为另外一个实例对象。

     至此所需信息全部已经准备完毕,我们可以来分析高低版本 OGNL 的源码了。高版本 OGNL 中,我们直接看 case:NONUMBERIC 的分支子句。代码含义为:

     如果 V1 是 Comparable 类型的并且 V1 可以强转为 V2 的类型,则进入 if 分支,否则进入 else 分支,而 else 分支直接报错,而且报错信息是我们实际生产环境中遇到的。显然,V1 既不是 Comparable 类型,也无法转换为 V2 的类型(HashMap -> String),所以进入了 else 分支,mybatis 升级之后携带 OGNL 的升级,数据库不规范的写法导致 mybatis 编译 sql 语句报错,阻塞了业务

     低版本的 OGNL 的 case:NONUMBERIC 的分支子句的代码逻辑说实话非常拧巴,含义是:

     如果 v1、v2 任一变量为 null,则进入 if 分支,显然不会进入。else 先判断v1、v2 是否能互转,显然不能,直接跳过。接下来是重中之重:如果 equals 为 true ,跳出 case,否则报错。我们根据结果看,equals 必定为 true,因为我们那种不规范的 mybatis 在这个地方,它每没报错——事实上是应该将该问题抛出来的,从而引导开发者更正 mybatis 脚本。接下来我们看方法外面这个 equals 的来源:

equals

     我惊呆了,直接写死传经来的,至于这个 equals 意欲何为,当初作者为什么这么写,也许只有作者自己知道。反正高版本的 OGNL 已经将这部分的代码逻辑全部重构了。

     我们可以得到如下结论: _低版本的 mybatis 依赖了低版本的 OGNL ,低版本的 OGNL 在上述分析的函数中存在一定缺陷,这个缺陷会导致我们在编写 Mybatis 脚本的时候类似于 parameter!=’’ 的不规范写法不被发现。当我们升级了 Mybatis 之后,这种不规范的写法反而兜不住暴露出来了,加上组件升级测试不充分,直接上到了生产环境。

     反思:

  • 日常开发要严格要求自己,追求正规、大气的编程素养,每一行代码,每一个字符,都要过大脑,不要太随便,不要随便复制粘贴能跑就行。
  • 组件升级要慎之又慎,测试要充分。

IP数据报

     IP 协议控制传输的协议单元称为 IP 数据报(IP Datagram,IP数据报、IP包或IP分组)。IP协议屏蔽了下层各种物理子网的差异,能够向上层提供统一格式的IP数据报。lP数据报采用数据报分组传输的方式,提供的服务是无连接方式。IP数据报的格式能够说明lP协议具有什么功能。IPv4数据报由报头和数据两部分组成,其中,数据是高层需要传输的数据,报头是为了正确传输高层数据而增加的控制信息。报头的前一部分长度固定,共20字节,是所有IP数据报必须具有。在首部固定部分的后面是可选字段,长度可变。

IP报文结构

1、固定部分

  • 版本:占 4 位,指 IP 协议的版本。通信双方使用的 IP 协议版本必须一致。广泛使用的 IP 协议版本号为 4(即 IPv4)。关于 IPv6,还处于草案阶段。
  • 首部长度:占 4 位,可表示的最大十进制数值是 15。请注意,这个字段所表示数的单位是 32 位字长(1 个 32 位字长是 4 字节),因此,当 IP 的首部长度为 1111 时(即十进制的 15),首部长度就达到 60 字节。当 IP 分组的首部长度不是 4 字节的整数倍时,必须利用最后的填充字段加以填充。因此数据部分永远在 4 字节的整数倍开始,这样在实现 IP 协议时较为方便。首部长度限制为 60 字节的缺点是有时可能不够用。但这样做是希望用户尽量减少开销。最常用的首部长度就是 20 字节(即首部长度为 0101),这时不使用任何选项。
  • 区分服务:占 8 位,用来获得更好的服务。这个字段在旧标准中叫做服务类型,但实际上一直没有被使用过。1998 年 IETF 把这个字段改名为区分服务DS(Differentiated Services)。只有在使用区分服务时,这个字段才起作用。
  • 总长度:总长度指首部和数据之和的长度,单位为字节。总长度字长为 16 位,因此数据报的最大长度为 2^16-1=65535 字节。在 IP 层下面的每一种数据链路层都有自己的帧格式,其中包括帧格式中的数据字段的最大长度,这称为最大传送单元 MTU(Maximum Transfer Unit)。当一个数据报封装成链路层的帧时,此数据报的总长度(即首部加上数据部分)一定不能超过下面的数据链路层的 MTU 值。
  • 标识:占 16 位。IP 软件在存储器中维持一个计数器,每产生一个数据报,计数器就加1,并将此值赋给标识字段。但这个“标识”并不是序号,因为IP是无连接服务,数据报不存在按序接收的问题。当数据报由于长度超过网络的 MTU 而必须分片时,这个标识字段的值就被复制到所有的数据报的标识字段中。相同的标识字段的值使分片后的各数据报片最后能正确地重装成为原来的数据报。
  • 标志:占 3 位,但只有 2 位有意义。标志字段中的最低位记为 MF(More Fragment)。MF=1 即表示后面“还有分片”的数据报。MF=0 表示这已是若干数据报片中的最后一个。标志字段中间的一位记为 DF(Don’t Fragment),意思是“不能分片”。只有当 DF=0 时才允许分片。
  • 片偏移:占 13 位。片偏移指出:较长的分组在分片后,某片在原分组中的相对位置。也就是说,相对用户数据字段的起点,该片从何处开始。片偏移以 8  个字节为偏移单位。这就是说,除了最后一个分片,每个分片的长度一定是 8 字节(64 位)的整数倍。
  • 生存时间:占 8 位,生存时间字段常用的的英文缩写是 TTL(Time To Live),表明是数据报在网络中的寿命。由发出数据报的源点设置这个字段。其目的是防止无法交付的数据报无限制地在因特网中兜圈子,因而白白消耗网络资源。最初的设计是以秒作为 TTL 的单位。每经过一个路由器时,就把 TTL 减去数据报在路由器消耗掉的一段时间。若数据报在路由器消耗的时间小于 1 秒,就把 TTL 值减 1。当 TTL 值为 0 时,就丢弃这个数据报。后来把 TTL 字段的功能改为“跳数限制”(但名称不变)。路由器在转发数据报之前就把 TTL 值减 1。若 TTL 值减少到零,就丢弃这个数据报,不再转发。因此,TTL 的单位不再是秒,而是跳数。TTL 的意义是指明数据报在网络中至多可经过多少个路由器。显然,数据报在网络上经过的路由器的最大数值是 255。若把 TTL 的初始值设为 1,就表示这个数据报只能在本局域网中传送。
  • 协议:占 8 位,协议字段指出此数据报携带的数据是使用何种协议,以便使目的主机的 IP 层知道应将数据部分上交给哪个处理过程。6 指 TCP 协议,17 指的是 UDP 协议。
  • 首部校验和:占16位。这个字段只检验数据报的首部,但不包括数据部分。这是因为数据报每经过一个路由器,路由器都要重新计算一下首部检验和(一些字段,如生存时间、标志、片偏移等都可能发生变化)。不检验数据部分可减少计算的工作量。
  • 源地址和目的地址:32位,IPV4 地址。

2、可变部分

     IP 首部的可变部分就是一个可选字段。选项字段用来支持排错、测量以及安全等措施,内容很丰富。此字段的长度可变,从 1 个字节到 40 个字节不等,取决于所选择的项目。某些选项项目只需要 1 个字节,它只包括 1 个字节的选项代码。但还有些选项需要多个字节,这些选项一个个拼接起来,中间不需要有分隔符,最后用全 0 的填充字段补齐成为 4 字节的整数倍。增加首部的可变部分是为了增加 IP 数据报的功能,但这同时也使得 IP 数据报的首部长度成为可变的。这就增加了每一个路由器处理数据报的开销。实际上这些选项很少被使用。新的 IP 版本 IPv6 就将 IP 数据报的首部长度做成固定的。这些任选项定义如下:

  • 安全和处理限制(用于军事领域)。
  • 记录路径(让每个路由器都记下它的IP地址)。
  • 时间戳(Time Stamp)(让每个路由器都记下IP数据报经过每一个路由器的IP地址和当地时间)。
  • 宽松的源站路由(Loose Source Route)(为数据报指定一系列必须经过的IP地址)。
  • 严格的源站路由(Strict Source Route)(与宽松的源站路由类似,但是要求只能经过指定的这些地址,不能经过其他的地址)。

     这些选项很少被使用,并非所有主机和路由器都支持这些选项。

  • Copyrights © 2017 - 2025 杨海波
  • 访问人数: | 浏览次数:

请我喝杯咖啡吧~

支付宝
微信