距离本笔记的上一篇已经过了很长时间了,很多人问我为什么不写了,其实理由很简单,我写不出什么东西,正如上篇笔记所说的在这之前的东西只是为了向朋友们推荐一本好书以及帮助初学者熟悉作者的思考习惯,这个很容易,但也很肤浅,这样的东西是不合适写的太多的(地球人都知道的东西,还是看书为好)。这就意味着必须选择话题来写(当然也大大增加了笔者犯错的机会)。上面这些话算是对一直支持我的朋友们做个解释,也希望再得到你们的支持。
在本篇文字中,我选择的话题是指针,是的,我已经听到很多人开始抱怨这个麻烦的该死的东西,但是我不得不说离开了这个东西(那个麻烦的该死的)你很难干得成什么事情,对于c/c++程序员来说这是个不可能回避的问题,那么我们最好还是看看这个东西到底麻烦在那儿,这样比抱怨更能解决问题。
第一, 指针的定义和初始化:在本书的3.3节在这方面作了详细的描述,很简单,指针是一种间接操作对象的方式,指针中存放的是所操作对象在内存中的地址,但请注意,如果指针表示的仅仅是地址的话,事情就好办得多,但是指针还必须与他表示的对象的类型保持一致,就象本书p73的例子:
int *p = NULL;”
double dval = 3.14;
p = &dval; // error
不是p物理上不能存放dval的地址,而是两种类型的内存布局和内容的解释完全不同(对编译器而言),编译器只好从一开始就拒绝这种赋值形式,当然,从你开始看上面的代码的那一刻,我就知道你不以为然了,一个学过编程的人是不会犯这种低级错误的,真的是这样吗?那么好,我想有时候你会希望对指针直接赋个地址,你是否会这样写?
int *p = 0x00001010;
然后,编译器就开始骂人了,“0x00001010是那个对象的地址?什么类型?一定是int吗?你让我咋解释他呢?重写!”呵呵,也难怪他脾气这么大,你这个地址根本就没有告诉编译器类型信息嘛,当然如果你非要这样做,要么告诉他你需要这个地址的类型:
int *p = (int*)0x00001010;
要么干脆先不管类型的事情:”
void *p = 0x00001010;
但不管你选那个方式,cast总是免不了,建议少用。
第二,野指针:当指针赋值的时候,编译器会检查地址的类型信息,这很好,但赋值之后他就不管了,这个正是一切麻烦的根源,比如有个典型的代码:
#include <iostream>
#include <cstdlib>
using namespace std;
int*f()
{
int a = 0;
return &a;
}
int g()
{
double a;
cin >> a;
return 0;
}
int main()
{
int *p = f();
cout << *p << endl;
g();
cout << *p << endl;
system("pause");
return 0;
}
我们发现编译器没有报错,而p中存放的地址也没被改变,但两次提领的结果完全不同,这是因为一旦函数f结束后,局部对象a进入了栈粉碎机,但是,请注意,栈粉碎机除去的不是该对象的地址编号和数据。而是该对象地址的类型标志(当然这是编译器行为,和纯内存无关)。而指针则仍然按照之前的约定对该对象地址进行提领等操作,一旦该对象地址被改变了类型信息,就必然错误。一个指针指向的对象的类型信息被改变者被消除,从而使得指针操作的结果不可预测,就成为野指针。
第三,内存泄漏:这个问题跟堆上分配有直接的关系,首先,我们要明白什么是内存泄漏,下面这个函数f内存泄漏了吗?
int*f()
{
int *p = new(int);
return p;
}
int main()
{
int *p = f();
*p = 11;
cout << *p << endl;
system("pause");
delete p;
return 0;
}
我们还是引用《effective c++》里的一段话来回答这个问题:
引起内存泄露的原因在于内存分配后指向内存的指针丢失了。如果没有垃圾处理或其他语言之外的机制,这些内存就不会被收回
显然我们没有丢掉控制该地址的指针,被分配的内存仍掌握在我们手里。只不过要相当注意罢了。特别是当有异常出现的时候,不要忘记在程序退出之前delete这个内存。(当然有时候auto_ptr也是个不错的选择)