v EM78系列单芯片-提升软件效率的小程序 ■ 谭振文EM78系列单芯片-提升软件效率的小程序谭振文分享笔者闲暇时总喜欢一个人窝在房里拿烙铁 ,焊电路板,在网络上游走,看到喜欢的DIY也一定仔细端详,即使按图施工也可以得到不少的乐趣,相信酷爱此道的人应该也不少 ,除了喜欢看看别人的作品,也可以互相比较一下看谁用的零件少,谁提供的功能强,谁的速度最快,所以经常很容易就搜集到一些不错的电路,日子久了就像堆积木一样,可以一个方块一个方块的拿来用,吾人戏称为积木设计法。将许多有用的电路组合在一起,又是一个新的东西。这种方式的确又快又经济,符合现代人快餐的观念。不仅是硬件可以像堆积木一样的收集起来,软件当然也可以适用于积木法则,于是在不少有心人的努力之下,笔者也收集了EM78系列单芯片一些很好的链接库,所以说麻雀虽小,五脏俱全。也因为这些链接库极具参考价值,笔者不忍独享,故决定将紊乱的笔记重新整理后公开出来,与热爱此系列单芯片的朋友们一同分享。EM78XXX单芯片自从问世以来已经陆续推出十余种不同等级的单芯片,小到8Pin的78P152,大到100Pin OTP的78P860,其汇编语言指令都是一样的,仅有57个,所以反复练习几次就能熟悉指令的用法。汇编语言用在I/O控制非常容易,也有很高的效率,所以坊间的书籍大部份以讨论控制为主显,显少专门探讨软件技巧的篇幅,其实老手都知道,关于芯片之控制往往用到时再去翻一翻DATA BOOK,注意一下TIMING,然后准备一部示波器,三两下就可以搞定。反倒是算法用的好不好会大大影响产品的稳定度,所以有经验的程序设计师通常都有自己的一套葵花秘笈,所以要提升自己的功力最好的方式除了多练习之外,看看别人的程序也会使你进步很快。BCD转换成Binary由于EM78XXX是8位的微控器,因此为了节省内存,我们的范例仅以一个BYTE存放两位BCD数为例,数字的范围在0~99之间,转换后的结果放在ACC,如果您需要更多的位数,相信您在看完之后应该不难自行修改才是。程序一这个范例程序共花费13个指令CYCLE,需要两个变量空间,执行后会影响到原BCD的内容。MOV A,BCDMOV TMP,AMOV A,@0x0FAND TMP,ASWAP BCDAND BCD,ABC PSW,0RLC BCD ; *2MOV A,BCDADD TMP,ARLC BCDRLCA BCD ; *8ADD A,TMP说明在程序一中所采用的方式应该算是最多人知道的方式,也是一种最直觉的方法,先将BCD个位数保存起来,因为十位数必须要乘以10,所以利用移位的技巧乘以10再加上个位数,所得的答案放入ACC。程序二在程序一的缺点,就是在执行程序以后,原本BCD的内容已经在移位的过程中被破坏掉了,为了改善这项缺失,我们换一种方式看看。下面这个程序,我们企图改善前面的缺失,共花费11个指令CYCLE,仍需要两个变量空间,但是执行后不会破坏原来BCD的内容。SWAPA BCDMOV TMP,AMOV A,@0x0FAND BCD,AAND TMP,ABC PSW,0RLCA TMPSWAP TMPRRC TMPADD A,TMPADD A,BCD程序三对于程序二的结果我们仍然不满意,似乎稍嫌复杂,虽然速度有所改善,但在内存的分配上仍有余地,所以我们再改善成程序三的型态。转换过程只花费10个指令CYCLE,而且只需要一个变量空间,执行之后也不会改变原来BCD的内容。MOV A,@0x0fAND A,BCDJBC BCD,4ADD A,@10JBC BCD,5ADD A,@20JBC BCD,6ADD A,@40JBC BCD,7ADD A,@80说明看过以上三个范例,您是否觉得程序三最简洁而且容易了解?写程序的确是一项极具挑战性的工作,而且还可以找到很多灵感及乐趣,想不到吧!Binary转换成BCD码下面的范例程序会将存放在ACC内的二进制数转换成两位BCD码(Compacted BCD Code),可转换最大的BCD码是99。CLR BCDDIGIT_HI:ADD A,@256-10JBS PSW,FCJMP DIGIT_LOINC BCDJMP DIGIT_HIDIGIT_LO:ADD A,@10SWAP BCDOR BCD,A减法的陷阱EM78系列汇编语言的减法指令是SUB,使用这个指令时您得特别注意,因为ACC永远都是减数,不可为被减数。SUB指令的语法有以下三种:SUB A,R (R-A→A)SUB R,A (R-A→R)SUB A,K (K-A→A)也就是说如果我们想计算A-2的值,如果写成:SUB A,@2其实是执行2-A,解决方法如下:ADD A,@256-2 或ADD A,@254交换两组缓存器的内容如果你觉得要交换两组内存的内容一定要借用第三组变量,那么您可以参考以下的方式,只是用了一些数学技巧就变得又快又简单。MOV A,REG1SUB A,REG2ADD REG1,ASUB REG2,A原理说明A=REG1A=REG2-REG1REG1=REG1+A=REG1+(REG2-REG1)=REG2REG2=REG2-(REG2-REG1)=REG1若X>Y就交换...延续上一个例子,此法用应用在Bubble Sort特别管用。MOV A,XSUB A,YJBC PSW,FCJMP NO_CHANGEADD X,ASUB Y,A2补码2补码加法经常代替减法,传统上的做法是先取1补码,然后加1。COM REGINC REG或是可以利用另一种方式求得,所不同的是第二种方式会影响PSW缓存器。ADD A,REGSUB A,REG如果您所要求的数已经放在ACC里面,那只要一行就能解决了。SUB A,@0旋转字节运算在8051指令中位左旋有RLC与RL两种指令区分,RLC在ACC左旋时会连带将CY一并旋转,而RL只会将ACC的MSB旋入LSB。EM78XXX指令只有RLC,那么要如何才能做到不带CY旋转呢?答案是旋转两次:RLCA REG1RLC REG1如图1所示,第一次位旋转并没有真正改变REG1的内容,目的是将REG1的MSB先放入FC,第二次位旋转才将刚刚放在FC内的MSB旋入LSB。同理,两个BYTES不经FC的位旋转也是相同的原理。RLCA HI_BYTERLC LO_BYTERLC HI_BYTE范围判断写程序免不了会碰到IF..THEN..的场合,有些人觉得EM78XXX的条件判断式太过繁琐,所以笔者也将它们整理归纳一下。条件判断式可分为开放区间条件式与封闭区间条件式来讨论,以图2来表示。开放条件式是以N点为出发点,当待测值大于N或是小于等于N时的条件判断,以C的语法描述如下:if(number>n)... /* number大于N */else... /* number小于等于N */EM78XXX汇编语言写法如下:MOV A,@N+1SUB A,NumberJBC PSW,FCJMP LABEL_1 ; 大于NJMP LABEL_2 ; 小于等于N封闭式条件判断是指待测值N是否在X与Y的范围之内,若以C的语法描述:if((number>=x) && (number<=y)).... /* in range */else.... /* False */如何以EM78汇编语言做到呢?一般做法是以减法后的PSW做条件判断,程序如下:MOV A,@2SUB A,numberJBS PSW,FCJMP FALSEMOV A,@y+1SUB A,SIJBC PSW,FCJMP FALSEIN_RANGE:; ....FALSE:; ....这个IF条件式要花费8个指令Cycle,还不算太复杂。但是还有个更简洁的方法,以下用加法后的PSW(R3)做条件判断,一共只要5行就清洁溜溜了。MOV A,NumberADD A,@255-yADD A,@y-x+1JBC PSW,FCJMP IN_RANGEFALSE:; ....IN_RANGE:; ....说明关键就在前三行,x表示条件式的下限值,y表示条件式的上限值,可以看得出仍是利用CY旗标制造的特效,不但精简而且有点小聪明,许多老手都爱用,这也是他们口袋里的秘密武器之一。如果您觉得不错,不妨也收入锦囊中,尔后就可以依样画葫芦了。ACC与缓存器内容交换这理我们要介绍一种快速的逻辑算法,只需要3个指令CYCLE,就可以将ACC的内容与缓存器的内容交换,不拖泥带水,Very cute!XOR Number,AXOR A,NumberXOR Number,A请读者自行在纸上推算一次,就知道答案了。交换多组缓存器内容利用上面介绍的方法,可以推广到多组缓存器交换的例子上,下面的程序将5组DATA内容移位,第一笔缓存器的资料传到第二笔缓存器内,第二缓存器的资料再传送到第三笔缓存器内,依此类推,最后一笔资料则传给第一个缓存器,形成一种字节资料旋转。MOV A,@5MOV COUNT,AMOV A,@DATA1MOV RSR,AMOV A,DATA5NEXT:XOR INDIR,AXOR A,INDIRXOR INDIR,AINC RSRDJZ COUNTJMP NEXT计算MOD 2N假如你刚好需要计算ACC MOD X,且X刚好是2的N次方,使用ACC AND (X-1)是最快的方法了。例如要判断YEAR是否为闰年,有个简单的方法,可以排除一些非闰年的条件,只要不能被4整除者就不是闰年。所以可以用YEAR AND 3解决。MOV A,@4-1AND A,YEARJBS PSW,FZJMP NOLEAP清除一段连续的内存对于连续一段内存做读写最好的方式就是使用间接寻址法,但是要注意在一些如M78447/811/860等高阶MCU,内存20H~ 3FH又可以分成4组BANK,如果之前没有切换到正确的BANK会造成读写错误。下面的范例程序会将BANK1内的32个BYTES全部清为0。INDIR == 0x00RSR == 0x04COUNT == 0x10REG == 0x20BANK1 == 0x40BANK2 == 0x80BANK3 == 0xC0MOV A,@32MOV COUNT,AMOV A,@REG|BANK1MOV RSR,ANEXT:CLR INDIRINC RSRDJZ COUNTJMP NEXT计算一个BYTE中有多少个"1"这个小程序可以检查出在某个BYTE中共有几个1,在某些算法的过程可能会用得到,计算的结果放在ACC。RRCA DATAAND A,@0x55SUB DATA,AMOV A,DATAAND A,@0x33ADD DATA,ARRC DATAADD DATA,ARRC DATASWAPA DATAADD A,DATAAND A,@0x0F节省NOP指令的方法您还在为程序挤不下伤脑筋吗?NOP指令有时候在延迟指令时间很有用,假如你有连续两个NOP指令可以用JMP到下一个指令的方式代替,因为这样可以减少一个指令BYTE,又可以达到相同的效果。例如:NOPNOP可以写成:JMP NEXT_INSTNEXT_INST:;....因为一个NOP花费一个指令Cycle,但是一个JMP指令就需要2个指令Cycle,虽然有时候会抱怨JMP指令会多花一点时间,但是想不到它也有如此妙用吧。LABEL太多?写汇编语言最令人伤脑筋的问题之一就是程序中到处是label,这有两个坏处,第一就是不小心就会造成label重复的问题,第二就是想不出适当的label名称。如果您已经为label的命名问题肠枯思竭,给您提供一个小方法,程序中如果用「$」可以表示目前PC的地址,依此推论「$+2」表示PC+2,「$-4」表示PC-4,看看底下的例子您立刻就明白:MOV R,RJBS PSW,FZJMP $+2JMP $-4; ....不过也要给您一个建议,label有个重要的意义就是具有批注的功能,特别是针对一些懒的写批注的人格外重要。所以这个方法仅适合使用在重复性很高的程序片断。SWITCH...CASE叙述在程序设计的过程中,免不了常常会碰到多重选项的问题,利用EM78XXX的查表指令试试看,所以TBL除了当作一般查表指令以外,还可以当作多重条件判断之用。MOV A,CASETBLJMP EVENT1 ; CASE=0JMP EVENT2 ; CASE=1JMP EVENT3 ; CASE=2JMP EVENT4 ; CASE=3多字节的递增及递减运算因为EM78XXX是8位的单芯片,如果要执行8位以上的计算,必须将多个字节看成是一个变量,以下我们举例说明如何将一组24位的变量,做到递增及递减运算。递增(Increment)MOV A,@1ADD INT24,AJBC STATUS,FCADD INT24+1,AJBC STATUS,FCADD INT24+2,A递减(Decrement)MOV A,@1SUB INT24,AJBS STATUS,FCSUB INT24+1,AJBS STATUS,FCSUB INT24+2,A判断多字节变量是否为零使用简单的逻辑运算指令,将多字节OR在一起,然后依据Z旗标就可以判断此多字节变量是否为零了。MOV A,INT24OR A,INT24+1OR A,INT24+2JBS PSW,FZ;...复制某些位有时候我们需要将一些特定的几个位由某个缓存器复制给另一组缓存器,由于并非完全复制缓存器的内容,所以会多了一些抽取位的步骤,现在我们找到一个方法,只要四个步骤就可以将指定的位复制到另一组缓存器里面,举例说明,假设位复制前(SOURCE)=44H,(TARGET)=5AH,如果我们希望将SOURCE的BIT0~BIT2复制到TARGET,则执行程序后(SOURCE)=44H,(TARGET)=5CH。MOV A,SOURCEXOR A,TARGETAND A,@00000111BXOR TARGET,A无论您希望复制哪几个BIT,只要将第三行程序MASK所需的位即可。奇偶位对调以下这段程序是根据Dmitry Kiryashov的算法设计,假设原本ACC内所有位的排列顺序为abcdefgh,交换后ACC顺序变成badcfehg,程序只有五行,颇耐人寻味。MOV REG,AAND A,@0x55ADD REG,ARRC REGADD A,REG中断程序不需保留ACC及PSW的方法中断程序一定要保留ACC及PSW吗?那倒未必!特别是如果您使用的是EM78P152/156之类的迷你级的MCU,RAM SIZE都特别小,如果您只需要让TCC中断做简单的计数工作,只要小心使用指令,就可以避免中断程序会破坏到ACC及PSW。原因是有些指令并不会对PSW产生影响,有些指令不需要经过ACC。首先设定好预除器,并且让TCC Free Run。下面的例子完全没用到ACC及PSW。ORG 0JMP INITORG 8TCCINT:BC RF,TCIF ;清除中断旗标INC COUNTERRETIMultiple Task管理与状态机Multiple Task就是将CPU时间平均分配(也可以是不平均分配)给多个Task,所以在程序中会有一个时间管理者,依照指定的时间对指定的Task服务,没有分配到时间的Task必需等候时间到来才能执行。TCCINT:MOV R10,ASWAP R10SWAPA PSWMOV R11,AINC TASKMOV A,@4SUB A,TASKJBS PSW,FCJMP ENDINTCLR TASKENDINT:BC ISR,TCIFSWAPA R11MOV PSW,ASWAPA R10RETI;-------------------------MAIN:MOV A,@0x21CONTWCLR TCCCLR ISRMOV A,@0x01IOW IOCFCLR TASKSTART:MOV A,TASKTBLJMP TASK0JMP TASK1JMP TASK2JMP TASK3JMP TASK4;-------------------------TASK0:; ....JMP STARTTASK1:; ....JMP STARTTASK2:; ....JMP STARTTASK3:; ....JMP STARTTASK4:; ....JMP START上面这个程序将TCC规划为62.5ms中断一次(系统震荡选用32.768KHz),所以Task每62.5ms会切换到下一个Task,也就是说每个Task都能够平均分享CPU的时间,这就是分时多任务的原理。至于中断程序部分不是必须的,可一情况决定是否要由TCC安排时间的管理。状态机(State Machine)是根据目前所在的State所产生的条件,来决定下一个状态,所以程序原理和上面这个例子大同小异,所不同的是,我们应该把标示为TASKn的Label视为一个单独的State,然后根据某些条件将最后面的JMP转移到另外一个State。在这里时间控制也不一定要用到,视需求决定。例如:TASK1:MOV A,INPUTJBS PSW,FZJMP TASK2JMP TASK3说明如果INPUT=0的话,将由目前所在的TASK1转移到TASK3执行,否则状态转移到TASK2。后记戏法人人会变,只是巧妙各有不同,希望笔者提供的这些小技巧对于喜欢玩单芯片的读者能够有所助益,我们不仅只是强调硬件应该节省,在软件技巧上也应该多发展一些好的算法,如此才能双管齐下,对症下药。吾人期盼藉此拋砖引玉能激发您更多的创意,写出更精简的程序,也期盼您的指教。竭诚欢迎所有喜爱EM78x系列单芯片的朋友来信和我们一起讨论。笔者E-MAIL:sa2tjw@emc.com.tw
欢迎访问:http://mcu.bak.cn/