最近程序在linux系统中出现程序的进程意外死掉的现象,查看日志发现是信号量异常导致。结合进程死机异常产生的core文件和程序版本通过GDB工具进行程序的调试,发现是内存的问题。
为了更好的使用GDB工具,查阅资料进行总结,也希望能够帮助开始使用GDB的新手。
1、GDB是什么
GDB就是一个帮助程序猿调试程序的工具,类似于windows下的IDE自带的调试工具(如断点调试、内存查看、堆栈信息显示等)。
一般来说 GDB 主要调试的是 C/C++的程序。要调试 C/C++的程序,首先在编译时,必须要把调试信息加到可执行文件中。使用编译器(cc/gcc/g++)的 -g 参数可以做到这一点。
> cc -g hello.c -o hello
> g++ -g hello.cpp -o hello
如果没有-g,你将看不见程序的函数名、变量名,所代替的全是运行时的内存地址
2、如何启动GDB
1、gdb <program>
program 也就是你的执行文件,一般在当前目录下。
2、gdb <program> core
用gdb同时调试一个运行程序和core 文件,core 是程序非法执行后core dump 后产生的文件。
3、gdb <program> <PID>
如果你的程序是一个服务程序或者已经在运行了,那么可以指定这个服务程序运行时的进程 ID。gdb 会自动attach 上去,并调试他。program 应该在PATH 环境变量中搜索得到
也可以这样:先用 gdb <program>关联上源代码,并进行 gdb,在 gdb 中用 attach 命令来挂接进程的 PID。并用detach 来取消挂接的进程
3、简单使用
l <-------------------- l 命令相当于list,从第一行开始例出原码
<-------------------- 直接回车表示,重复上一次命令
break 16 <-------------------- 设置断点,在源程序第16行处
break func <-------------------- 设置断点,在函数func()入口处
r <--------------------- 运行程序,run 命令简写
n <--------------------- 单条语句执行,next命令简写
c <--------------------- 继续运行程序,continue 命令简写
p i <--------------------- 打印变量i的值,print命令简写
bt <--------------------- 查看函数堆栈
finish <--------------------- 退出函数
q <--------------------- 退出 gdb
4、程序运行参数和环境操作
1、GDB中调用 UNIX 的 shell 来执行linux命令
shell <command string>
如:(gdb) shell $PWD
bash: /home/duxx/test_gdb: is a directory
2、GDB中执行make命令,重新build 自己的程序
make <make-args> 等价于“shell make <make-args>”
3、设置程序运行参数
set args 可指定运行时参数。
show args 命令可以查看设置好的运行参数。
(gdb) set args 5
(gdb) show args
Argument list to give program being debugged when it is started is “5”.
4、运行路径和环境变量
path <dir> 可设定程序的运行路径。
show paths 查看程序的运行路径。
set environment varname [=value] 设置环境变量。如:set env USER=hchen
5、断点调试
1、设置断点BreakPoint
我们用break 命令来设置断点。正面有几点设置断点的方法:
break <function> eg:break func()
在进入指定函数时停住。C++中可以使用class::function 或 function(type,type)格式来指定函数名。
break <linenum> eg:break 8
在指定行号停住。
break +offset (当前行号+offset)
break -offset (当前行号-offset)
在当前行号的前面或后面的offset行停住(是在程序运行前和运行时都可设置)。offiset 为自然数。
break filename:linenum eg:break test.cpp:18
在源文件filename 的linenum 行处停住。
break filename:function eg:break test.cpp:func()
在源文件filename 的function 函数的入口处停住。
break *address eg:break 0x0804895b
在程序运行的内存地址处停住。
break
break 命令没有参数时,表示在下一条指令处停住。
break … if <condition>
…可以是上述的参数,condition 表示条件,在条件成立时停住。比如在循环境体中,可以设置
break if i=100,表示当i为 100 时停住程序。
查看断点时,可使用info 命令,如下所示:(注:n 表示断点号)
info breakpoints [n]
info break [n]
eg:
1 breakpoint keep y 0x080488bd in func() at test.cpp:19
breakpoint already hit 1 time
2 breakpoint keep y 0x08048852 in test1() at test.cpp:8
3 breakpoint keep y <PENDING> +2
2、设置观察点WatchPoint
观察点一般来观察某个表达式(变量也是一种表达式)的值是否有变化了,如果有变化,马上停住程序。我们有下面的几种方法来设置观察点:
watch <expr> 为表达式(变量)expr设置一个观察点。当表达式值有变化时,马上停住程序。
rwatch <expr> 当表达式(变量)expr被读时,停住程序。
awatch <expr> 当表达式(变量)的值被读或被写时,停住程序。
info watchpoints 列出当前所设置了的所有观察点
注意:设置观察点时,要在其观察的变量处设置断点,然后run程序,走到此断点时,才可设置观察点,continue观察设置的观察点是否有变化
3、清除停止点
clear
清除所有的已定义的停止点,测试不能全部删除,使用delete即可
clear <function>
clear <filename:function>
清除所有设置在函数上的停止点。
clear <linenum>
clear <filename:linenum>
清除所有设置在指定行上的停止点。
delete [breakpoints] [range…]
删除指定的断点,breakpoints 为断点号。如果不指定断点号,则表示删除所有的断点。range 表示断点号的范围(如:3-7)。其简写命令为d。
4、修改停止的条件
可以在设置断点的时候加入条件
break foo if value_a > value_b
也可以用 condition 命令来修改断点的条件。(只有break 和watch 命令支持if,catch 目前暂不支持if)
condition <bnum> <expression> eg: condition 3 i=5(不需要 if)
修改断点号为bnum的停止条件为expression
condition <bnum>
清除断点号为bnum的停止条件。
还有一个比较特殊的维护命令ignore,你可以指定程序运行时,忽略停止条件几次。
ignore <bnum> <count>
表示忽略断点号为bnum的停止条件count次。
6、查看栈信息
1、查看栈简单信息 bt
bt 打印当前的函数调用栈的所有信息 调用顺序:从下向上依次调用
bt <n>
n 是一个正整数,表示只打印栈顶上n个层的栈信息。
-n 表一个负整数,表示只打印栈底下n个层的栈信息 eg:
(gdb) bt <------------------------栈的信息
#0 test1 () at test.cpp:8 <------------------------栈的第0层(栈顶)
#1 0x080488f6 in func () at test.cpp:22 <------------------------栈的第1层
#2 0x0804895b in main (argv=1, argc=0xbffff4c4) at test.cpp:33
(gdb) bt 2 <------------------------打印栈顶2个层的栈信息
#0 test1 () at test.cpp:8
#1 0x080488f6 in func () at test.cpp:22
(More stack frames follow...)
2、切换当前栈,查看当前栈详细信息 frame
frame <n>
f <n> n 是一个从0 开始的整数,是栈中的层编号。比如:frame 0,表示栈顶,frame 1,表示栈的第二层。
up <n> 表示向栈的上面移动 n层,可以不打n,表示向上移动一层。
down <n> 表示向栈的下面移动n 层,可以不打 n,表示向下移动一层。
info frame 会打印出这些信息:栈的层编号,当前的函数名,函数参数值,函数所在文件及行号,函数执行到的语句
info args 打印出当前函数的参数名及其值。
info locals 打印出当前函数中所有局部变量及其值。
info catch 打印出当前的函数中的异常处理信息
(gdb) info frame <------------------ 打印出当前栈的详细信息
Stack level 0, frame at 0xbffff3f0:
eip = 0x8048852 in test1 (test.cpp:8); saved eip = 0x80488f6
called by frame at 0xbffff410
source language c++.
Arglist at 0xbffff3e8, args:
Locals at 0xbffff3e8, Previous frame's sp is 0xbffff3f0
Saved registers:
ebx at 0xbffff3e4, ebp at 0xbffff3e8, eip at 0xbffff3ec
(gdb) f 0 <------------------ 打印栈顶信息和代码
#0 test1 () at test.cpp:8
8 int* ppp = (int *)new int[10];
(gdb) f 2
#2 0x0804895b in main (argv=1, argc=0xbffff4c4) at test.cpp:33
33 func();
(gdb) up 1 <------------------ 当前栈的指向向上移动一层即#1的栈
#1 0x080488f6 in func () at test.cpp:22
22 test1();
(gdb) info frame <------------------ 打印当前栈的详细信息
Stack level 1, frame at 0xbffff410:
eip = 0x80488f6 in func (test.cpp:22); saved eip = 0x804895b
called by frame at 0xbffff440, caller of frame at 0xbffff3f0
source language c++.
Arglist at 0xbffff408, args:
Locals at 0xbffff408, Previous frame's sp is 0xbffff410
Saved registers:
ebp at 0xbffff408, eip at 0xbffff40c
7、代码查看
查看源码 list
在程序编译时一定要加上-g 的参数,把源程序信息编译到执行文件中,list简写l。
list <linenum>
显示程序第linenum行的周围的源程序(一般是打印当前行的上 5 行和下 5 行)。
list <function>
显示函数名为function 的函数的源程序(如果显示函数是是上 2 行下 8 行,默认是 10 行)。
list
显示当前行后面的源程序(默认行数)。
list –
显示当前行前面的源程序(默认行数)。
指定显示的行数
也可以定制显示的范围,使用下面命令可以设置一次显示源程序的行数。
set listsize <count>
设置一次显示源代码的行数。
show listsize
查看当前listsize 的设置。
list 命令还有下面的用法:
list <first>, <last> 显示从first行到last行之间的源代码。
list , <last> 显示从当前行到 last 行之间的源代码(包含首尾行)。
list + 往后显示源代码(默认行数)。
一般来说在list 后面可以跟以下这们的参数:
<linenum> 行号。
<+offset> 当前行号的正偏移量。
<-offset> 当前行号的负偏移量。
<filename:linenum> 哪个文件的哪一行。
<function> 函数名。
<filename:function> 哪个文件中的哪个函数。
<*address> 程序运行时的语句在内存中的地址。
搜索源代码
forward-search <regexp>
search <regexp>
向前面搜索。
reverse-search <regexp>
全部搜索。
其中,<regexp>就是正则表达式,也主一个字符串的匹配模式
8、程序运行时数据查看
查看程序的变量或地址
1、全局变量(所有文件可见的) eg: p g
2、静态全局变量(当前文件可见的)
3、局部变量(当前Scope 可见的) eg: p m
如果你的局部变量和全局变量发生冲突(也就是重名),一般情况下是局部变量会隐藏全局变量,查看格式:file::variable eg: p ‘test.cpp’::m
查看某个函数的变量:function::variable eg:没有成功
数组查看 “@”
格式:*内存地址@内存长度 “@”的左边是第一个内存的地址的值,“@”的右边则你你想查看内存的长度
int arr[]={2,23,5,6,7,8};
(gdb) p *ppp@10
$2 = {1, 2, 0, 0, 0, 0, 0, 0, 0, 0}
int* ppp = (int *)new int[10];
(gdb) p *arr@6
$3 = {2, 23, 5, 6, 7, 8}
输出格式
用GDB的数据显示格式:
x 按十六进制格式显示变量。
d 按十进制格式显示变量。
u 按十六进制格式显示无符号整型。
o 按八进制格式显示变量。
t 按二进制格式显示变量。
a 按十六进制格式显示变量。
c 按字符格式显示变量。
f 按浮点数格式显示变量。
(gdb) p m
$5 = 10
(gdb) p/x m
$6 = 0xa
(gdb) p/o m
$7 = 012
(gdb) p/c m
$8 = 10 '\n'
(gdb) p/f m
$9 = 1.40129846e-44
查看内存的值 examine
格式:x/<n/f/u> <addr> examine 命令(简写是x)来查看内存地址中的值
n、f、u是可选的参数
n 是一个正整数,表示显示内存的长度,也就是说从当前地址向后显示几个地址的内容。
f 表示显示的格式,参见上面。如果地址所指的是字符串,那么格式可以是 s,如果地十是指令地址,那么格式可以是 i。
u 表示从当前地址往后请求的字节数,如果不指定的话,GDB 默认是 4 个 bytes。u 参数可以用下面的字符来代替,b 表示单字节,h 表示双字节,w 表示四字节,g 表示八字节。当我们指定了字节长度后,GDB会从指内存定的内存地址开始,读写指定字节,并把其当作一个值取出来。
<addr>表示一个内存地址
(gdb) p/x m (查看变量m的值)
$10 = 0xa
(gdb) p/x &m (查看变量m的地址)
$11 = 0xbffff3d8
(gdb) x 0xbffff3d8 (根据内存地址查看其值)
0xbffff3d8: 0x0000000a
(gdb) x/4ub 0xbffff3d8 (查看此内存后4个单字节的值)
0xbffff3d8: 10 0 0 0
(gdb) x/2uh 0xbffff3d8 (查看此内存后2个双字节的值)
0xbffff3d8: 10 0
GDB环境变量设置与查看
1、GDB的环境变量和UNIX 一样,也是以$起头
2、环境变量可以定义任一的类型。包括结构体和数组
3、查看当前所设置的所有的环境变量 show convenience
4、查看单一变量 p $变量名 eg:p $foo
eg: set $foo = 12
set $pp=”abcdef”
查看寄存器的值
info registers 查看寄存器的情况。(除了浮点寄存器)
info all-registers 查看所有寄存器的情况。(包括浮点寄存器)
info registers <regname …> 查看所指定的寄存器的情况。
p $寄存器名字 看看指定的寄存器的情况 eg: p $eip
9、改变程序的执行
1、修改变量值
使用GDB的 print 命令即可完成:eg (gdb) print x=4【C/C++的语法,Pascal的语法:x:=4】
变量和GDB中的参数冲突,set var 命令来修改:eg set var width=47
2、跳转执行
GDB 可以修改程序的执行顺序,可以让程序执行随意跳跃。
jump <linespec>
指定下一条语句的运行点。<linespce>可以是文件的行号,可以是 file:line 格式,可以是+num 这种偏移量格式
jump <address>
这里的<address>是代码行的内存地址。
注意,jump 命令不会改变当前的程序栈中的内容,所以,当你从一个函数跳到另一个函数时,当函数运行完返回时进行弹栈操作时必然会发生错误,可能结果还是非常奇怪的,甚至于产生程序 CoreDump。所以最好是同一个函数中进行跳转
3、产生信号
使用 singal 命令,可以产生一个信号量给被调试的程序
语法是:signal <singal>,UNIX 的系统信号量通常从1 到 15。所以<singal>取值也在这个范围
注意:single 命令和 shell 的 kill 命令不同,系统的 kill 命令发信号给被调试程序时,运行程序马上会被GDB停住,而single 命令所发出一信号则是直接发给被调试程序的
4、强制函数返回
return
return <expression>
使用 return 命令取消当前函数的执行,并立即返回,如果指定了<expression>,那么该表达式的值会
被认作函数的返回值。
5、强制调用函数
call <expr>
表达式中可以一是函数,以此达到强制调用函数的目的。并显示函数的返回值,如果函数返回值是
void,那么就不显示。
最后给大家推荐一本书:陈皓的《用GDB调试程序》。希望对大家有所帮助。