C 对象布局及多态实现探索之虚函数调用
2008-02-23 05:27:09来源:互联网 阅读 ()
struct C041 { C041() : c_(0x01) {} virtual void foo() { c_ = 0x02; } char c_; }; |
执行如下代码:
C041 obj; PRINT_DETAIL(C041, obj) PRINT_VTABLE_ITEM(obj, 0, 0) obj.foo(); C041 * pt = &obj; pt->foo(); |
结果如下:
The detail of C041 is 14 b3 45 00 01 obj : objadr:0012F824 vpadr:0012F824 vtadr:0045B314 vtival(0):0041DF1E |
我们打印出了C041的对象内存布局及他的虚表信息。
先看看obj.foo();的汇编代码:
004230DF lea ecx,[ebp FFFFF948h] 004230E5 call 0041DF1E |
和前一篇文章中看过的普通的成员函数调用产生的汇编代码相同。这说明了通过对象进行函数调用,即使被调用的函数是虚函数也是静态绑定,即在编译时决议出函数的地址。不会有多态的行为发生。
我们跟踪进去看看函数的汇编代码。
01 004263F0 push ebp 02 004263F1 mov ebp,esp 03 004263F3 sub esp,0CCh 04 004263F9 push ebx 05 004263FA push esi 06 004263FB push edi 07 004263FC push ecx 08 004263FD lea edi,[ebp FFFFFF34h] 09 00426403 mov ecx,33h 10 00426408 mov eax,0CCCCCCCCh 11 0042640D rep stos dword ptr [edi] 12 0042640F pop ecx 13 00426410 mov dword ptr [ebp-8],ecx 14 00426413 mov eax,dword ptr [ebp-8] 15 00426416 mov byte ptr [eax 4],2 16 0042641A pop edi 17 0042641B pop esi 18 0042641C pop ebx 19 0042641D mov esp,ebp 20 0042641F pop ebp 21 00426420 ret |
值得注意的是第14、15行。第14行把this指针的值移到eax寄存器中,第15行给类的第一个成员变量赋值,这时我们能够看到在取变量的地址时用的是[eax 4],即跳过了对象布局最前面的4字节的虚表指针。
接下来我们看看通过指针进行的虚函数调用pt->foo();,产生的汇编代码如下:
01 004230F6 mov eax,dword ptr [ebp FFFFF900h] 02 004230FC mov edx,dword ptr [eax] 03 004230FE mov esi,esp 04 00423100 mov ecx,dword ptr [ebp FFFFF900h] 05 00423106 call dword ptr [edx] |
第1行把pt指向的地址移入eax寄存器,这样eax中就保存了对象的内存地址,同时也是类的虚表指针的地址。第2行取eax中指针指向的值(注意不是 eax的值)到edx寄存器中,实际上也就是虚表的地址。执行完这两条指令后,我们看看eax和edx中的值,果然和我们前面打印的obj的虚表信息中的 vpadr和vtadr的值是相同的,分别为0x0012F824和0x0045B314。第4行同样用ecx寄存器来保存并传递对象地址,即 this指针的值。第5行的call指令,我们能够看到目的地址不象通过对象来调用那样,是个直接的函数地址。而是将edx中的值做为指针来进行间接调用。前面我们已知道edx中存放的实际是虚表的地址,我们也知道虚表实际是个指针数组。这样第5行的调用实际就是取到虚表中的第一个条目的值,即 C041::foo()函数的地址。假如被调用的虚函数对应的虚表条目的索引不是0,将会看到edx后加上一个索引号乘4后的偏移值。继承跟踪能够发现, ptr[edx]的值为0x0041DF1E,也和我们打印的vtival(0)的值相同。前面已提到过,这个地址实际也不是真正的函数地址,是个跳转指令,继续执行就到了真正的函数代码部分(即前面列出的代码)。
我们在上面看到的这个过程,就是动态绑定的过程。因为我们是通过指针来调用虚成员函数,所以会产生动态绑定,即使指针的类型和对象的类型是相同的。为了确保多态的语义,编译器在产生call指令时,不象静态绑定时那样,是在编译时决议出一个确定的地址值。相反他是通过用发出调用的指针指向的对象中的虚指针,来迂回的找到对象所对应类型的虚表,及虚表中相应条目中存放的函数地址。这样具体调用哪个函数就和指针的类型是无关的,只和具体的对象相关,因为虚指针是存放在具体的对象中,而虚表只和对象的类型相关。这也就是多态会发生的原因。
请回忆一下前面讨论过的C071类,当子类重写从父类继承的虚函数时,子类的虚表内容的变化,及和父类虚表内容的区别(请参照第二篇中打印的子类和父类的虚表信息)。具体的通过指向子类对象的父类指针来调用被子类重写过的虚函数时的调用过程,请有兴趣的朋友自己调试一下,这里不再列出。
另外前面在《C 对象布局及多态实现之动态和强制转换》中我们讨论了指针的类型动态转换。我们在这里再利用C041、C042及C051类,来看看指针的类型动态转换。这几个类的定义请参见前文。类C051从C041和C042多重继承而来,且后两个类都有虚函数。执行如下代码:
C051 obj; C041 * pt1 = dynamic_cast<C041*>(&obj); C042 * pt2 = dynamic_cast<C042*>(&obj); pt1->foo(); pt2->foo2(); |
第一个动态转型对应的汇编代码为:
00404B59 lea eax,[ebp FFFFF8ECh] 00404B5F mov dword ptr [ebp FFFFF8E0h],eax |