【课程笔记】南大软件分析课程5——过程间分析

Tattoo

发布日期: 2020-07-15 10:12:26 浏览量: 71
评分:
star star star star star star star star star star_border
*转载请注明来自write-bug.com

最近在看“静态分析”技术相关的文章,看到这个系列的笔记和视频教程,感觉介绍得很好,通俗易懂,而且还比较详细,故转载分享,同时也备份保留下,方便自己今后阅读。(PS:建议大家一边看笔记,一边看视频,加深理解)
原作者:bsauce
原文链接:https://www.jianshu.com/p/2d14c0ae41cd

首先非常感谢南京大学李樾谭添老师的无私分享,之前学习程序分析是看的北大熊英飞老师的ppt,但是很多地方没看懂,正如李樾老师所说的那样,熊英飞老师的授课涵盖非常广,不听课只看ppt的话,理解起来还是很有难度的。但李樾老师的视频就讲解的非常易懂,示例都是精心挑选的,所以墙裂推荐。

推送门南大课件 南大视频课程 北大课件


目录

  1. Motivation
  2. 调用图构建
  3. 过程间控制流分析
  4. 过程间数据流分析

重点:

学习如何利用类层级分析来构建调用图;过程间控制流/数据流分析;过程间的常量传播。

1.Motivation

问题:过程内的分析未考虑函数调用,导致分析不精确。

过程间分析:Inter-procedural Analysis,考虑函数调用,又称为全程序分析(Whole Program Analysis),需要构建调用图,加入Call edges和Return edges。

2.调用图构建

(1)调用图

定义:本质是调用边的集合,从调用点(call-sites)到目标函数(target methods / callees)的边。

示例

应用:是所有过程间分析(跨函数分析)的基础,程序优化,程序理解,程序调试。

(2)面向对象语言的调用图构造(Java)

代表性算法:从上往下精度变高,速度变慢,重点分析第1、4个算法。

  • Class hierarchy analysis(CHA)
  • Rapid type analysis(RTA)
  • Variable type analysis(VTA)
  • Pointer analysis(k-CFA)

Java调用分类

Method Dispatch:最难的是Virtual call,其中关键步骤是Method Dispatch,就是找到最终调用的实际函数

virtual call在程序运行时才能得到,基于2个要素得到:

  1. reciever object的具体类型:c

  2. 调用点的函数签名:m。(通过signature可以唯一确定一个函数)

    1. signature = 函数所在的类 + 函数名 + 描述符
    2. 描述符 = 返回类型 + 参数类型

    简记为C.foo(P, Q, R)

(3)Method Dispatch(virtual call)

定义:用Dispatch(c, m)来模拟动态Method Dispatch过程,c表示reciever object,m表示函数签名。

解释:若该类的非抽象方法(实际可执行的函数主体)中包含和m相同名字、传递/返回参数的m‘,则直接返回;否则到c的父类中找。

示例

(4)Class Hirarchy Analysis (CHA) 类层级分析

目的:根据每个virtual call 的 receiver varible 的声明类型来求解所有可能调用的目标函数。如 A a = ... ; a.foo(); 这个a就是receiver varible,声明类型就是A。假定a可以指向A以及A所有子类对象,CHA的过程就是从A和子类中去找目标函数。

算法:Resolve(cs)——利用CHA算法找到调用点所有可能的调用目标。

算法示例:

算法应用:

错误:以上b.foo()的调用目标 C.foo()和D.foo()是错误的,因为已经指定了是B类型,所以b.foo()根本不会调用C、D的foo()。因为CHA只考虑声明类型,也就是B,导致准确度下降。多态性就是说,父类可以引用子类的对象,如B b=new C()

优缺点:CHA优点是速度快,只考虑声明类型,忽略数据流和控制流;缺点是准确度低。

总结:本类中有同名函数就在本类和子类找,没有就从父类找,接着找父类的子类中的同名函数(CHA分析)。

(5)利用CHA构造调用图

算法:遍历每个函数中的每个调用指令,调用CHA的Resolve()找到对应的目标函数和调用边,函数+调用边=调用图。

示例:

3.过程间控制流分析

定义:过程间控制流图ICFG = CFG + (Call edges + Return edges)。

  • Call edges:连接调用点和目标函数入口
  • Return edges:从return语句连到Return site(Call site后面一条语句)

示例

4.过程间数据流分析

说明:对ICFG进行数据流分析,没有标准的一套算法。

对比

常量传播数据流分析

  • Node transfer:与过程内分析相同,对每个调用点,将等号左边部分去掉。
  • Call edge transfer:传参
  • Return edge transfer:传返回值

常量传播示例

说明:黄色背景边必须有,从b = addOne(a)c=b-3,a通过此边传递,b通过addOne()传递。若a也通过addOne()传递,会额外消耗系统资源。

上传的附件

发送私信

人生最好的三个词:久别重逢,失而复得,虚惊一场

93
文章数
34
评论数
最近文章
eject