水滴石穿C语言之编译器引出的问题

2008-02-23 05:26:24来源:互联网 阅读 ()

新老客户大回馈,云服务器低至5折

 基本解释
  • 本节主要探讨C编译器下面两方面的特点所引发的一系列常见的编程问题。
  • 对C文档进行分别编译:
    C程式通常由几个小程式(.c文档)组成,编译器将这几个小程式分别编译,然后通过链接程式将他们组合在一起形成一个目标代码。由于编译器每次只能编译一个文档,因此他不能立即检查需要几个源文档配合才能发现的错误。
  • 对函数的参数和返回值建立临时变量
    C编译器会对函数的参数建立临时参数,也可能会对函数的返回值隐含传递一个指针。因为这些临时变量的隐含性存在,使得在某些情况下,特别是有指针存在的时候,会引发一系列的问题。
  • C文档中所包含的头文档会和C语言一同编译

    C语言中被包含的头文档是和.c文档一起编译的,头文档中的问题会反映到.c文档的编译中。
  问题:C文档的分别编译

  我有一个数组a定义在f1.c中,但是我想在f2.c中计算他的元素个数,用sizeof能够达到这个目的吗?

   答案和分析:

  答案是否定的,您没有办法达到目的,本质原因是sizeof操作符只是在“编译时(compile time)”起作用,而C语言的编译单位是每次单个.c文档进行编译(其他语言也都如此)。因此,sizeof能够确定同一个源文档中某个数组的大小,但是对于定义在另一个源文档中的数组他无能为力了,因为那已是“运行时(run time)”才能确定的事情了。

  一件事情要想做,总会有办法的,下面提供有三种可选的办法来解决这个问题:

  1)、定义一个全局变量,让他记住数组的大小,在另外一个.c文档中我们通过访问这个全局变量来得到数组的大小信息(似乎有点小题大做得不偿失^_^)。

  2)、在某个.h文档中用宏定义数组的大小,例如#define ARRAY_SIZE 50,然后在两个源文档中都包含这个.h文档,通过直接访问ARRAY_SIZE来得到定义在不同.c文档中的数组的大小。

  3)、配置数组的最后一个元素为特别值,例如0,-1,NULL等,然后我们通过遍历数组来寻找这个特别的结尾元素,从而判断数组的长度(这个办法效率低,也是笨笨的)。

   问题:函数返回值隐含传递指针

  下面的代码能够正常工作,但是在程式结束时会有一个致命错误产生。究竟是什么原因呢?

struct list
{
 char *item;
 struct list *next;
}

main (argc, argv)
{
 ...
}

  答案和分析:

  原因很简单,稍微注意一点不难发现,在定义结构list的右花括弧后面加一个分号就能够解决这个问题:

struct list
{
 char *item;
 struct list *next;
};//缺了这个分号可不行!

  好了,问题是解决了,但,您知道这个错误究竟导致了什么致命问题吗?问题不是表面上那么简单的,OK,让我们来看看事情背后的真相。

  首先看一看下面这段代码:

VOID Func ( struct my_struct stX)
{
 .......
}
struct my_struct stY = {...};
Func (stY);

  当调用函数Func的时候,是把结构变量stY的值拷贝一份到调用栈中,从而作为参数传递给函数FUNC的,这个叫做C语言的参数值传递。我相信这个您一定很清楚,那么,您应该知道:假如函数的返回值是结构变量的话,函数应该如何将值返回给调用者呢?且看下面这段代码:

struct my_structFunc (VOID)
{
 .......
}
struct my_struct stY = Func();


  此时函数Func的返回值是个结构类型的值,这个返回值被放在内存中一个阴暗恐怖的地方,同时安排了一个指针指向这个地方(暂时称为“神秘指针”),而这个指针会由C语言的编译器作为一个隐藏参数传递给函数Func。当函数Func返回时,编译器生成的代码将这个由隐藏指针指向的内存区的值拷贝到返回结构stY中,从而完成将结构变量值返回给调用者。

  您明白了上述所讲的东东,那么今天问题的真正原因也就呼之欲出了:

  因为struct list {...}的定义后面没有加分号,导致主函数main (argc, argv)被编译器理解为是个返回值为结构变量的函数,从而期望得到除了argc和argv以外的第三个参数,也就是我们上面提到的那个隐含传入的“神秘指针”。可是,大家知道,这里函数是main函数,main函数的参数是由程式中的启动代码(startup code)提供的。而启动代码当然认为main()天生就应该只得到两个参数,要“神秘指针”,当然没有,如此一来, main()在返回时自作主张地去调用栈中访问他的那个并不存在的第三个参数(即神秘指针),这样导致非法访问,产生致命问题。这才是这个问题的真正根源。

  建议:

   1)、尽量将结构变量的指针而不是结构本身作为函数参数,否则函数调用时内存拷贝的开销可不小,尤其是对那些调用频繁、结构体大的情况。

   2)、结构定义的后面一定要加分号,经过上面我的大段讲述,我相信您不会犯相同的错误



[1] [2] 下一页