我将抱着非谨慎的探讨式的态度来聊聊关于编程语言的一些本质问题,有失偏颇的地方望大家指出。
编程语言我认为可以分为两种,一种是封闭式的,如VB,JAVA,SMALLTALK等高级语言,另一种是开放式的(或者说可扩充的),如C,C++,汇编(你可能对此有异议)。前者和后者的区别的本质不在于前者是动态语言,后者是静态语言,而在于后者具有“指针”这种机制。注意我这里所说的“指针”是指一种机制是广义的,以下就谈谈“指针”机制在各类语言中的具体表现形态。
指针在汇编中表现的形态是统一的,那就是存储器地址。无论是代码还是数据的地址,对地址中的内容的处理是统一的不受限制的,同样地址是不受限制的没有类型区别的,借用一下软件工程中的术语说就是指针的原型,即原始形态。
到了C中指针就有了类型区别,对指针的所指内容的操作也有了限制,最基本的指针分类就是函数指针和数据指针,前者指向代码,后者指向数据,操作方式完全不同,而且同种指针还有不同的“接口”分类,如函数指针的接口类型等,但在C中是不严格的(可以在运行时隐性转化),也正是如此使得C语言的行为难以捉摸。
而到了C++中,指向对象的指针我个人认为还是称为“句柄”更为合适点,所以指针在面向对象语言中的表现形态是句柄(句柄在动态语言中是高度受限的,难于扩展的)。句柄是指针的高级形态,具有更严格的类型检测,在这里指针类型的转化有严格的原则或通过现式的进行。那么句柄里面到底有些什么呢?我认为里面应该只有一种东西——类型,注意我说的不是类而是类的接口即类型(可能引自抽象代数的泛代数分支中的概念)。那么具体说到底是什么呢?我可以说有两种东西,1。数据的地址及类型,2。函数的指针的地址及类型(即虚表地址,可能是以指针数组的方式实现)。如果一个句柄中包含的以上内容在另一个类型中都有的话,那么后者可以映射到前者,反之将会发生“切割”,这是有离散数学依据的。所以是否可以说指向对象的指针里有虚表地址和成员数据地址及它们的类型标识构成呢?
有个词汇可能代表着高界的编程技术,近来被人提得比较多,这就是“设计模式”,设计模式之所以如此的重要,在于其可以赋予代码强大的复用能力,而强大的复用性又来自那里呢?我认为主要是代码灵活的运行时动态行为,而运行时的行为的根源又源于什么呢?我认为是指针机制,设计模式实现的基础就是指针机制所带来的间接性。指针是如何带来强大的灵活性的呢?那么指针的本质到底是什么呢?怎样用通俗的比方来说明指针的本质呢(因为最高深的往往是通俗的:))?我正在思考中。。。。。。
以后,我将继续思考指针的本质问题,希望大家一起来探讨。