AndroidNativeEmu和unidbg对抗ollvm的字符串混淆
题目出自3w班12月题——对抗字符串混淆。
字符串混淆在保护中是很常见的一个手段,熟练使用unicorn能轻松的解决曾经实现起来非常复杂的问题。
AndroidNativeEmu和unidbg都是对unicorn进行了一定程度封装的开源项目,让我们可以很方便的调用jni函数,以及对没有实现的函数进行hook实现处理,并且让我们可以实现so里面模拟调用java函数。
下面首先使用AndroidNativeEmu来对抗ollvm的字符串混淆,对so进行修复,让我们可以更加便捷的进行静态分析。
在实现之前,先总结下原理。
ollvm的字符串混淆,我们使用IDA的时候,看到的结果如下:
这里相当于是一个解密函数,通过这个函数将会还原成正常的字符串。然后我们看看在哪里调用到了这个解密函数。
可以看到是在.init_array中使用解密函数对字符串进行还原。也就是说,当我们执行完.init_array后,就会将正常的字符串写入内存中,这时我们就得到了真正的字符串了。所以根据这个情况:
第一步,我们需要监控内存的读写,然后运行.init_array。这样发生的内存写入时,基本可以确定是字符串还原函数在写入恢复的字符串。
写之前我们先看看unicorn的内存写入的相关注释:
/*
Callback function for hooking memory (READ, WRITE & FETCH)
@type: this memory is being READ, or WRITE
@address: address where the code is being executed
@size: size of data being read or written
@value: value of data being written to memory, or irrelevant if type = READ.
@user_data: user data passed to tracing APIs
*/
这里就知道了,size是写入或读取数据的长度,value是写入或读取的数据。那么开始写我们第一步的代码:
import logging
import sys
from unicorn import UC_HOOK_MEM_WRITE
import struct
from androidemu.emulator import Emulator
# Configure logging
logging.basicConfig(
stream=sys.stdout,
level=logging.DEBUG,
format="%(asctime)s %(levelname)7s %(name)34s | %(message)s"
)
logger = logging.getLogger(__name__)
def hook_mem_write(uc,type,address,size,value,userdata):
curdata=struct.pack("I",value)[:size]
print(curdata)
emulator = Emulator(vfp_inst_set=True)
emulator.load_library("example_binaries/libc.so", do_init=False)
#设置内存的写入监控
emulator.mu.hook_add(UC_HOOK_MEM_WRITE, hook_mem_write)
#后面的do_init为true就会调用.init_array
lib_module = emulator.load_library("example_binaries/obf.so", do_init=True)
输出的结果如下:
这里能看到,真实的字符串已经能在回调监控中打印出来了。接下来的第二步,我们需要把所有真实字符串以及写入真实字符串的位置给保存下来。
dstr_datas={}
def hook_mem_write(uc,type,address,size,value,userdata):
curdata=struct.pack("I",value)[:size]
dstr_datas[address]=curdata
print(curdata)
这样我们就将init_array过程中所有还原出来的真实字符串给保存下来了,最后我们要将我们的真实字符串再写回so中。
那么写回到哪里呢?我们监控内存写入时,当时是给什么地址写入数据,我们就写入到哪里,这样我们写入的so就能直接在IDA中打开就看到真实字符串了。
在写入时需要注意的是,我们保存的address是有一个基址的。也就是说,我们写入时需要减掉基址,才是真正应该写入的位置。
#获取到基址
base_addr=lib_module.base
sofile=open("example_binaries/obf.so","rb")
#我们要将真实的字符串回填到sodata中。然后再保存
sodata=sofile.read()
for address,v in dstr_datas.items():
#仅仅将so范围内的保存原字符串进行写回
if address > base_addr and address < base_addr+lib_module.size:
offset=address-base_addr
print("address:0x%x data:%s offset:0x%x" % (address, v,offset))
然后我贴上几行打印的内容:
address:0xcbc6a004 data:b'j' offset:0x4004
address:0xcbc6a005 data:b'n' offset:0x4005
address:0xcbc6a006 data:b'i' offset:0x4006
address:0xcbc6a007 data:b'\x00' offset:0x4007
address:0xcbc6a008 data:b'g' offset:0x4008
第一个offset的偏移是0x4004,那么我们打开IDA检查一下是否对的上:
能看到IDA里面显示的确实是对的上的。但是这里要留意最左下角的00003004,实际这个才是文件中的真实位置。所以我们这里直接写回so要再将offset-0x1000。下面我们开始将so的数据修改,并且保存成一个新的文件。最后贴上完整代码:
import logging
import sys
from unicorn import UC_HOOK_MEM_WRITE
import struct
from androidemu.emulator import Emulator
# Configure logging
logging.basicConfig(
stream=sys.stdout,
level=logging.DEBUG,
format="%(asctime)s %(levelname)7s %(name)34s | %(message)s"
)
logger = logging.getLogger(__name__)
dstr_datas={}
def hook_mem_write(uc,type,address,size,value,userdata):
curdata=struct.pack("I",value)[:size]
dstr_datas[address]=curdata
# print(curdata)
emulator = Emulator(vfp_inst_set=True)
emulator.load_library("example_binaries/libc.so", do_init=False)
#设置内存的写入监控
emulator.mu.hook_add(UC_HOOK_MEM_WRITE, hook_mem_write)
#后面的do_init为true就会调用.init_array
modulePath="example_binaries/obf.so"
lib_module = emulator.load_library(modulePath, do_init=True)
#获取到基址
base_addr=lib_module.base
sofile=open("example_binaries/obf.so","rb")
#我们要将真实的字符串回填到sodata中。然后再保存
sodata=sofile.read()
sofile.close()
for address,v in dstr_datas.items():
#仅仅将so范围内的保存原字符串进行写回
if address > base_addr and address < base_addr+lib_module.size:
offset=address-base_addr-0x1000
print("address:0x%x data:%s offset:0x%x" % (address, v,offset))
sodata=sodata[:offset]+v+sodata[offset+len(v):]
#保存成一个新的so
savepath=modulePath+".new"
nfile=open(savepath,"wb")
nfile.write(sodata)
nfile.close()
那么实际效果怎么样呢,我们打开IDA来对比一下修改前和修改后的效果。
修改前:
修改后:
接着再使用unidbg来实现一次字符串的反混淆。
按照上面的思路,我们首先设置内存写入的监控,然后加载so。而unidbg在加载的时候,就会自动的执行init和init_array。所以我们接下来看看unidbg是怎么进行内存的写入监控的。搜索一下unidbg源码,就能找到是如何使用的了。我们搜索hook_add_new:
这里我们就知道了是设置了一个TraceMemoryHook对象进行监控的。由于我们是需要自己修改里面监控后的逻辑,所以不要变动他原有的。拷贝一份出来,然后删除里面原有的打印逻辑,再加上我们之前逻辑。也就是打印一下写入的数据,将监控到的写入数据和写入地址给保存起来。
class DeStrWriteHook implements WriteHook {
private final boolean read;
DeStrWriteHook(boolean read) {
this.read = read;
}
PrintStream redirect;
TraceWriteListener traceWriteListener;
//保存的写入数据地址和写入的数据
public Map<Long,byte[]> dstr_datas=new HashMap<Long,byte[]>();
/**
* long类型转byte[] (大端)
* @param n
* @return
*/
public static byte[] longToBytesBig(long n) {
byte[] b = new byte[8];
b[7] = (byte) (n & 0xff);
b[6] = (byte) (n >> 8 & 0xff);
b[5] = (byte) (n >> 16 & 0xff);
b[4] = (byte) (n >> 24 & 0xff);
b[3] = (byte) (n >> 32 & 0xff);
b[2] = (byte) (n >> 40 & 0xff);
b[1] = (byte) (n >> 48 & 0xff);
b[0] = (byte) (n >> 56 & 0xff);
return b;
}
/**
* long类型转byte[] (小端)
* @param n
* @return
*/
public static byte[] longToBytesLittle(long n) {
byte[] b = new byte[8];
b[0] = (byte) (n & 0xff);
b[1] = (byte) (n >> 8 & 0xff);
b[2] = (byte) (n >> 16 & 0xff);
b[3] = (byte) (n >> 24 & 0xff);
b[4] = (byte) (n >> 32 & 0xff);
b[5] = (byte) (n >> 40 & 0xff);
b[6] = (byte) (n >> 48 & 0xff);
b[7] = (byte) (n >> 56 & 0xff);
return b;
}
@Override
public void hook(Backend backend, long address, int size, long value, Object user) {
if (read) {
return;
}
try {
Emulator<?> emulator = (Emulator<?>) user;
if (traceWriteListener == null || traceWriteListener.onWrite(emulator, address, size, value)) {
//将写入的地址和写入的数据保存下来,先转long为小端序
byte[] writedata=longToBytesLittle(value);
byte[] resizeWriteData=new byte[size];
//将指定大小的数据保存
System.arraycopy(writedata,0,resizeWriteData,0,size);
dstr_datas.put(address,resizeWriteData);
}
} catch (BackendException e) {
throw new IllegalStateException(e);
}
}
}
然后我们按之前的步骤,使用这个类来hook,并且遍历一下我们保存出来的结果看和AndroidNativeEmu是不是一致的:
public class DestrOllvm {
private final AndroidEmulator emulator;
public DeStrWriteHook trace;
public Module module;
public DestrOllvm(){
emulator=new AndroidARMEmulator("com.example.unicorncourse08");
try {
trace = new DeStrWriteHook(false);
final Memory memory=emulator.getMemory();
LibraryResolver resolver = new AndroidResolver(23);
memory.setLibraryResolver(resolver);
emulator.getBackend().hook_add_new(trace,1,0,emulator);
module=emulator.loadLibrary(new File("unidbg-android/src/test/resources/example_binaries/obf.so"));
} catch (IOException e) {
e.printStackTrace();
}
}
public static byte[] readFile(String strFile){
try{
InputStream is = new FileInputStream(strFile);
int iAvail = is.available();
byte[] bytes = new byte[iAvail];
is.read(bytes);
is.close();
return bytes;
}catch(Exception e){
e.printStackTrace();
}
return null ;
}
public static void main(String[] args){
DestrOllvm destr=new DestrOllvm();
String savepath="unidbg-android/src/test/resources/example_binaries/obf.so.new";
byte[] sodata=readFile("unidbg-android/src/test/resources/example_binaries/obf.so");
long base_addr=destr.module.base;
long module_size=destr.module.size;
//遍历保存的写入地址和写入数据
for(Map.Entry<Long, byte[]> item : destr.trace.dstr_datas.entrySet()){
//如果范围是在模块内的。则进行处理
if(item.getKey()>base_addr && item.getKey()<base_addr+module_size){
long offset=item.getKey()-base_addr-0x1000;
System.out.println(String.format("address:0x%x data:%s",offset, OtherTools.byteToString(item.getValue())));
}
}
}
}
然后看看打印的结果和之前是不是差不多的:
address:0x3004 data:6A
address:0x3005 data:6E
address:0x3006 data:69
address:0x3007 data:00
address:0x3008 data:67
address:0x3009 data:6F
address:0x300a data:20
address:0x300b data:69
address:0x300c data:6E
对比AndroidNativeEmu的日志是正确的。那么我们完成最后的步骤,生成新的so文件。下面贴上完整代码:
public class DestrOllvm {
private final AndroidEmulator emulator;
public DeStrWriteHook trace;
public Module module;
public DestrOllvm(){
emulator=new AndroidARMEmulator("com.example.unicorncourse08");
try {
trace = new DeStrWriteHook(false);
final Memory memory=emulator.getMemory();
//这里的android版本指定后会自动load相关的so
LibraryResolver resolver = new AndroidResolver(23);
memory.setLibraryResolver(resolver);
//设置内存写入的监控
emulator.getBackend().hook_add_new(trace,1,0,emulator);
module=emulator.loadLibrary(new File("unidbg-android/src/test/resources/example_binaries/obf.so"));
} catch (IOException e) {
e.printStackTrace();
}
}
public static byte[] readFile(String strFile){
try{
InputStream is = new FileInputStream(strFile);
int iAvail = is.available();
byte[] bytes = new byte[iAvail];
is.read(bytes);
is.close();
return bytes;
}catch(Exception e){
e.printStackTrace();
}
return null ;
}
public static void writeFile(byte[] data,String savefile){
try {
FileOutputStream fos=new FileOutputStream(savefile);
BufferedOutputStream bos=new BufferedOutputStream(fos);
bos.write(data,0,data.length);
bos.flush();
bos.close();
} catch (Exception e) {
e.printStackTrace();
}
}
public static void main(String[] args){
DestrOllvm destr=new DestrOllvm();
String savepath="unidbg-android/src/test/resources/example_binaries/obf.so.new";
byte[] sodata=readFile("unidbg-android/src/test/resources/example_binaries/obf.so");
long base_addr=destr.module.base;
long module_size=destr.module.size;
ByteArrayOutputStream baos = new ByteArrayOutputStream();
//遍历保存的写入地址和写入数据
for(Map.Entry<Long, byte[]> item : destr.trace.dstr_datas.entrySet()){
//如果范围是在模块内的。则进行处理
if(item.getKey()>base_addr && item.getKey()<base_addr+module_size){
//获取到正确的写入的偏移位置
baos = new ByteArrayOutputStream();
Long offset=item.getKey()-base_addr-0x1000;
System.out.println(String.format("address:0x%x data:%s",offset, OtherTools.byteToString(item.getValue())));
//先把前半部分取出来
byte[] start=new byte[offset.intValue()];
System.arraycopy(sodata,0,start,0,offset.intValue());
//然后把后半部分的大小计算出来
int endsize=sodata.length-offset.intValue()-item.getValue().length;
//把后半部分的数据填充上
byte[] end=new byte[endsize];
System.arraycopy(sodata,offset.intValue()+item.getValue().length,end,0,endsize);
//将三块位置的数据填充上
baos.write(start,0,start.length);
baos.write(item.getValue(),0,item.getValue().length);
baos.write(end,0,end.length);
//最后把so保存起来
sodata=baos.toByteArray();
}
}
writeFile(baos.toByteArray(),savepath);
}
}
最后IDA打开一下生成的so看看结果:
最后我们将libcrypt.so以及libcrack.so都直接用unidbg跑一次,然后下面贴上IDA查看这两个so的结果。
Libcrypt.so的IDA结果如下:
Libcrack.so的IDA结果如下:
最后贴上三个例子的下载地址:
https://pan.baidu.com/s/1wAgjruBJe-a9T2Y63bKH7w
密码:4qsj
贴上unidbg的字符串反混淆例子:
https://github.com/dqzg12300/unidbg_tools.git
看雪ID:misskings
https://bbs.pediy.com/user-home-659397.htm
*本文由看雪论坛 misskings 原创,转载请注明来自看雪社区。
# 往期推荐
球分享
球点赞
球在看
点击“阅读原文”,了解更多!
[广告]赞助链接:
关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
让资讯触达的更精准有趣:https://www.0xu.cn/
随时掌握互联网精彩
- 虚谷数据库原创的原生分布式数据
- GrapesJS 开源的网页构建框架
- 紧急提醒!黑客正利用假 ChatGPT 来推送恶意软件
- 美国一家航空公司意外泄露涉恐“禁飞名单”
- 华为轮值董事长胡厚崑:没有自建芯片厂计划;苹果赔偿1亿美元给App开发者;Git.io停用|极客头条
- 因爬虫滥用,CTO和程序员被刑拘
- 美英澳联合总结2021年勒索软件态势并提供缓解建议
- 技术“摸鱼” 5 年,国外小哥白拿 45 万工资!
- P6+架构技术揭秘:Redis+Nginx+Dubbo精选+面试题+架构师精选视频(送)
- 报名倒计时!2020京麒大会 物联网安全攻防实战训练营
- 祸从天上来,Spotify35万账号遭泄露
- Firefox发布安全更新 新增仅HTTPS模式