[2] 线程
在配置好windbg之后,我们载入一个clr程序并执行至clr被载入,然后开始我们的clr探索之旅。
首先,使用!threads命令看看当前clr中有哪些线程正在执行
以下为引用:
0:004> !threads
threadcount: 2
unstartedthread: 0
backgroundthread: 1
pendingthread: 0
deadthread: 0
preemptive gc alloc lock
id threadobj state gc context domain count apt exception
0 6ec 0014e708 6020 enabled 00000000:00000000 00148a90 0 sta
2 a68 00157618 b220 enabled 00000000:00000000 00148a90 0 mta (finalizer)
前面5个计数器分别表示托管(managed)线程、未启动线程、后台线程、阻塞线程和僵死线程的数量。
下面的列表是当前托管线程的详细信息:第一个域是windbg的线程编号;id是win32线程id;threadobj是线程的对象;state是一个标志位,以后再详细介绍;preemptive gc表示gc是否与此线程协作;gc alloc context是gc的相关信息;domain是线程所在appdomain;lock count是线程拥有锁的计数器;apt是线程类型,沿用com中sta/mta/nta(netural)的概念;最后的exception表示线程类型,除了普通的用户线程外还有finalizer、gc、theadpool worker和threadpool completion port,其功能与名字相符。
我们可以在.net framework sdk的tool developers guide\samples\sos子目录下找到所有sos.dll支持命令的详细说明;在rotor的clr\src\tools\sos子目录下找到针对rotor系统的sos.dll的实现代码。这份源代码在功能上实现了与clr正规发行版本基本上相同的功能,也是我们下面研究的主要目标之一。
其中strike.cpp是sos功能命令的实现所在。每个sos的命令在strike.cpp中以一个函数实现,通过declare_api宏定义函数参数。
以下为引用:
#define declare_api(s) \
cppmod void \
s( \
handle hcurrentprocess, \
handle hcurrentthread, \
ulong dwcurrentpc, \
ulong dwprocessor, \
pcstr args \
)
函数参数分别传入windbg正在调试的进程句柄、当前线程句柄、当前指令地址、处理器和命令行参数信息。函数内再对此信息进行处理,输出调试信息到windbg界面中。
让我们先看看threads命令(strike.cpp:1237)的实现原理。
threads函数首先从一个全局线程存储池中获取当前线程统计信息,并将之存储在一个结构并内打印统计值;然后调用getthreadlist函数(sos\util.cpp:2259)获取线程列表;对每个线程获取线程信息,并将之存储在一个结构内并打印线程详细信息;在打印线程信息时,会判断此线程的类型,并打印相关信息。
首先来看看全局线程存储池threadstore类(vm\threads.h:1998)的设计和使用思路。
clr在启动时,会通过 coinitializeee 函数(vm\ceemain.cpp:1100)初始化一个执行引擎(execute engine),这儿的ee类似jvm的概念,实际上就是clr的运行时环境。关于clr的详细启动过程请参见笔者另外一篇文章《.net平台下clr程序载入原理分析》。
coinitializeee函数使用全局变量保障每个进程最多只有一个clr环境;对没有构造clr的进程,调用tryeestartup函数(vm\ceemain.cpp:500)尝试初始化clr。伪代码如下:
以下为引用:
hresult stdmethodcalltype coinitializeee(dword fflags)
{
if(++g_refcount <= 1 && !g_feestarted && !g_feeinit)
{
g_eestartupstatus = tryeestartup(fflags);
}
return succeeded(g_eestartupstatus) ?
(setupthread() ? s_ok : e_outofmemory) : g_eestartupstatus;
}
tryeestartup函数则以异常安全策略包装eestartup函数(vm\ceemain.cpp:206)完成实际的clr启动工作。在eestartup函数中会真正调用initthreadmanager函数(vm\threads.cpp:2068)完成线程管理器的初始化工作。而initthreadmanager函数出了初始化tls外,绝大部分工作是由实现threadstore类的singleton模式的threadstore::initthreadstore函数(vm\threads.cpp:4345)实现的。其中保存全局唯一threadstore类实例的就是前面获取线程统计信息的全局线程存储池。
以下为引用:
threadstore *g_pthreadstore;
bool threadstore::initthreadstore()
{
g_pthreadstore = new threadstore;
return (g_pthreadstore != null);
}
因此,threadstore类实际上是一个全局唯一的线程管理器,新增和终止一个clr线程都需要在此存储中更新相关信息。此线程管理器除了维护一个当前线程列表的链表外,还维护了一套线程相关信息的统计值。前面threads命令获取的几个统计值就是从此而来。而获取当前线程列表的getthreadlist函数(sos\util.cpp:2259),实际上也是直接从线程管理器的线程列表中获取每个线程对象的入口。
最后来看看线程信息的获取步骤。
每个线程thread类(vm\threads.h:544)的对象表示一个managed线程。此线程是一个逻辑上的线程,如果被启动则可能直接对应于一个系统的物理线程。而一个物理线程则无需绑定到一个被管理的逻辑线程上,物理线程却可以在多个appdomain中共享以运行被调度到的被管理线程。此外每个被管理的线程必须有一个运行时环境(contex),但不一定在一个确定的应用程序域(appdomain)中。呵呵,搞糊涂了吧 :d 这里绕的几个弯子我以后再写篇详细的文章讨论好了 :p
被管理的线程除了可以获取当前线程id和绑定到的物理线程id外,还有一个threadstate状态(vm\threads.h:576)定义其当前运行情况。
对线程类型的判断逻辑,首先将线程与finalizerthread(finalizer)和gcthread(gc)两个全局变量指向的系统功能线程比较,判断是否是这两种特殊线程;然后根据线程状态的thread::ts_threadpoolthread位是否被设置来判断是否在线程池中;如果在线程池中还要通过状态的thread::ts_tpworkerthread标志位进一步判断是否为工作者线程(threadpool worker),不是工作者线程则为完成端口线程(threadpool completion port)。这几种线程缓冲池中线程的概念,我们以后章节讨论线程池时再详细讨论。