By value? Or by reference?
传值?还是传引用?
(Wang hailong)
关于编程的参数传递问题,总是存在着这样的争论。传值?还是传引用?(还是传指针?还是传地址?)这些提法,经常出现在C++, java, C#的编程技术文档里面。这个问题也经常引起开发人员的争论,徒耗人力物力。实际上,这根本不成为问题,只是由于人为加入的概念,混淆了人们的视听。
从程序运行的角度来看,参数传递,只有传值,从不传递其它的东西。只不过,值的内容有可能是数据,也有可能是一个内存地址。
开发人员应该了解程序的编译结果是怎样在计算机中运行的。程序运行的时候,使用的空间可以分为两个部分,栈和堆。栈是指运行栈,局部变量,参数,都分配在栈上。程序运行的时候,新生成的对象,都分配在堆里,堆里分配的对象,栈里的数据参数,或局部变量。
下面举一个C++的例子。
public class Object{
int i;
public Object(int i){
this.i = i;
}
public int getValue(){
return i;
}
public void setValue(int i){
this.i = i;
}
};
class A {
Void func1(int a, Object b){
Object * c = new Object( a );
b = c;
}
public void main(){
Object * param = new Object( 1 );
func1( 2, param );
// what is value of parram now ?
// it is still 1.
}
};
我们来看一下,当调用到func1函数时,运行到Object * c = new Object( a ); 栈和堆的状态。不同编译器生成的代码运行的结果可能会稍有不同。但参数和局部变量的大致排放顺序都是相同的。
… 运行栈
param
Object
(1)
return value
main addr
堆空间
main addr
a = 2
b
c
Object
(2)
func1 addr
这时候,我们来看,param变量被压入运行栈的时候,只是进行了简单的复制。把param里面的内容拷贝到b里面。这时候,b就指向了Object(1)。这里的参数传递,是把param的值传递给b。
下面我们来看,程序执行到b = c;时候的堆栈状态。
… 运行栈
param
Object
(1)
return value
main addr
堆空间
main addr
a = 2
b
c
Object
(2)
func1 addr
我们可以看到,b现在指向了Object(2)。但是对param的值毫无影响。param的值还是Object(1)。
所以,我们说,对参数的赋值不会影响到外层函数的数据,但是,调用参数的操作方法,却等于直接操作外层函数的数据。比如,如果我们在func1()函数中,不调用b=c;而调用b.setValue(3),那么Object(1)的数据就会变为3,param的数据也会改变为3。
在java和C#中的情况,也都是一样。
C++还有一种变量定义方法,表面上看起来,不符合上面的说明,这里进行说明。
Object * a = new Object(1);
Object & * b = a;
这里的b就等于是a的另外一个别名,b就是a。对b赋值就等于对a赋值。甚至作为参数传递时,也是如此。对这种类型的参数的赋值,就等于对外层函数数据的赋值。
public class B{
void func1(Object & * b){
b = new Object(4);
}
public void main(){
Object * a = new Object(1);
func1(a);
// a is changed to Object(4) now.
}
}
当运行完func1(a);时,a的值变化为Object(4)。这是因为编译器实际把参数Object & * b编译为Object ** b_addr,b_addr的值是b的地址,也就是a的地址。
当调用func1()的时候,实际上是把b_addr作为参数压到栈里,b_addr的值是a的地址。
当执行b = new Object(4); 时,实际执行了 b_addr->b = new Object(4); 也就是执行了 b_addr->a = new Object(4); a的值当然变化了。
还有一点需要说明,当使用COM,CORBA等中间件规范进行开发时,我们需要定义IDL语言。参数的类型分为,[in],[out],[in, out],其中的RPC远程调用的参数打包规范,就更复杂了,但原理却是一样的。