C 中extern “C”含义深层探索

2008-02-23 05:41:27来源:互联网 阅读 ()

新老客户大回馈,云服务器低至5折

  1.引言

  C 语言的创建初衷是“a better C”,但是这并不意味着C 中类似C语言的全局变量和函数所采用的编译和连接方式和C语言完全相同。作为一种欲和C兼容的语言,C 保留了一部分过程式语言的特点(被世人称为“不完全地面向对象”),因而他能够定义不属于任何类的全局变量和函数。但是,C 毕竟是一种面向对象的程式设计语言,为了支持函数的重载,C 对全局函数的处理方式和C有明显的不同。

  2.从标准头文档说起

  某企业曾给出如下的一道面试题:

  面试题:为什么标准头文档都有类似以下的结构?

  #ifndef __INCvxWorksh

  #define __INCvxWorksh

  #ifdef __cplusplus

  extern "C" {

  #endif

  /*...*/

  #ifdef __cplusplus

  }

  #endif

  #endif /* __INCvxWorksh */

  分析

  显然,头文档中的编译宏“#ifndef __INCvxWorksh、#define __INCvxWorksh、#endif” 的作用是防止该头文档被重复引用。

  那么

  #ifdef __cplusplus

  extern "C" {

  #endif

  #ifdef __cplusplus

  }

  #endif

  的作用又是什么呢?我们将在下文一一道来。

  3.深层揭密extern "C"

  extern "C" 包含双重含义,从字面上即可得到:首先,被他修饰的目标是“extern”的;其次,被他修饰的目标是“C”的。让我们来周详解读这两重含义。

  被extern "C"限定的函数或变量是extern类型的;

  extern是C/C 语言中表明函数和全局变量作用范围(可见性)的关键字,该关键字告诉编译器,其声明的函数和变量能够在本模块或其他模块中使用。记住,下列语句:

  extern int a;

  仅仅是个变量的声明,其并不是在定义变量a,并未为a分配内存空间。变量a在任何模块中作为一种全局变量只能被定义一次,否则会出现连接错误。

  通常,在模块的头文档中对本模块提供给其他模块引用的函数和全局变量以关键字extern声明。例如,假如模块B欲引用该模块A中定义的全局变量和函数时只需包含模块A的头文档即可。这样,模块B中调用模块A中的函数时,在编译阶段,模块B虽然很难找到该函数,但是并不会报错;他会在连接阶段中从模块A编译生成的目标代码中找到此函数。

  和extern对应的关键字是static,被他修饰的全局变量和函数只能在本模块中使用。因此,一个函数或变量只可能被本模块使用时,其不可能被extern “C”修饰。

  被extern "C"修饰的变量和函数是按照C语言方式编译和连接的;

  未加extern “C”声明时的编译方式

  首先看看C 中对类似C的函数是怎样编译的。

  作为一种面向对象的语言,C 支持函数重载,而过程式语言C则不支持。函数被C 编译后在符号库中的名字和C语言的不同。例如,假设某个函数的原型为:

  void foo( int x, int y );

  该函数被C编译器编译后在符号库中的名字为_foo,而C 编译器则会产生像_foo_int_int之类的名字(不同的编译器可能生成的名字不同,但是都采用了相同的机制,生成的新名字称为“mangled name”)。

  foo_int_int 这样的名字包含了函数名、函数参数数量及类型信息,C 就是靠这种机制来实现函数重载的。例如,在C 中,函数void foo( int x, int y )和void foo( int x, float y )编译生成的符号是不相同的,后者为_foo_int_float。

  同样地,C 中的变量除支持局部变量外,还支持类成员变量和全局变量。用户所编写程式的类成员变量可能和全局变量同名,我们以"."来区分。而本质上,编译器在进行编译时,和函数的处理相似,也为类中的变量取了一个独一无二的名字,这个名字和用户程式中同名的全局变量名字不同。

  未加extern "C"声明时的连接方式

  假设在C 中,模块A的头文档如下:

  // 模块A头文档 moduleA.h

  #ifndef MODULE_A_H

  #define MODULE_A_H

  int foo( int x, int y );

  #endif

  在模块B中引用该函数:

  // 模块B实现文档 moduleB.cpp

  #include "moduleA.h"

  foo(2,3);

  实际上,在连接阶段,连接器会从模块A生成的目标文档moduleA.obj中寻找_foo_int_int这样的符号!

  加extern "C"声明后的编译和连接方式

  加extern "C"声明后,模块A的头文档变为:

  // 模块A头文档 moduleA.h

  #ifndef MODULE_A_H

  #define MODULE_A_H

  extern "C" int foo( int x, int y );

  #endif

  在模块B的实现文档中仍然调用foo( 2,3 ),其结果是:

  (1)模块A编译生成foo的目标代码时,没有对其名字进行特别处理,采用了C语言的方式;

  (2)连接器在为模块B的目标代码寻找foo(2,3)调用时,寻找的是未经修改的符号名_foo。

  假如在模块A中函数声明了foo为extern "C"类型,而模块B中包含的是extern int foo( int x, int y ) ,则模块B很难找到模块A中的函数;反之亦然。

  所以,能够用一句话概括extern “C”这个声明的真实目的(任何语言中的任何语法特性的诞生都不是随意而为的,来源于真实世界的需求驱动。我们在思考问题时,不能只停留在这个语言是怎么做的,还要问一问他为什么要这么做,动机是什么,这样我们能够更深入地理解许多问题):

  实现C 和C及其他语言的混合编程。

  明白了C 中extern "C"的设立动机,我们下面来具体分析extern "C"通常的使用技巧。

  4.extern "C"的惯用法

  (1)在C 中引用C语言中的函数和变量,在包含C语言头文档(假设为cExample.h)时,需进行下列处理:

标签:

版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点,本站所提供的摄影照片,插画,设计作品,如需使用,请与原作者联系,版权归原作者所有

上一篇: C 指针使用方法

下一篇: C 程式的异常处理技巧