分享
 
 
 

分析PHP的similar_text函數

王朝php·作者佚名  2008-12-22
窄屏简体版  字體: |||超大  

//比較字串,返回兩個字串第一個相同字符的區域

static void php_similar_str(const char *txt1, int len1, const char *txt2, int len2, int *pos1, int *pos2, int *max)

{

char *p, *q;

char *end1 = (char *) txt1 + len1;

char *end2 = (char *) txt2 + len2;

int l;

*max = 0;

//遍歷字串

for (p = (char *) txt1; p < end1; p++) {

for (q = (char *) txt2; q < end2; q++) {

for (l = 0; (p + l < end1) && (q + l < end2) && (p[l] == q[l]); l++);

if (l > *max) {

//保存相同區域信息

*max = l;

*pos1 = p - txt1;

*pos2 = q - txt2;

}

}

}

}

//遞歸函數,比較txt1和txt2的相同字符數量

static int php_similar_char(const char *txt1, int len1, const char *txt2, int len2)

{

int sum;

int pos1, pos2, max;

php_similar_str(txt1, len1, txt2, len2, &pos1, &pos2, &max);

if ((sum = max)) {//這樣寫有什麽意義?????!!!!!

//遞歸上次不同部分的前部

if (pos1 && pos2) {

sum += php_similar_char(txt1, pos1, txt2, pos2);

}

//遞歸上次不同部分的後部

if ((pos1 + max < len1) && (pos2 + max < len2)) {

sum += php_similar_char(txt1 + pos1 + max, len1 - pos1 - max,

txt2 + pos2 + max, len2 - pos2 - max);

}

}

//返回本次比較後的相同字符數量

return sum;

}

//PHP函數本身,一堆宏,做了些串轉換和返回值換算,主功能由上面兩個函數做了。

PHP_FUNCTION(similar_text)

{

zval **t1, **t2, **percent;

int ac = ZEND_NUM_ARGS();

int sim;

if (ac < 2 || ac > 3 || zend_get_parameters_ex(ac, &t1, &t2, &percent) == FAILURE) {

WRONG_PARAM_COUNT;

}

convert_to_string_ex(t1);

convert_to_string_ex(t2);

if (ac > 2) {

convert_to_double_ex(percent);

}

if (Z_STRLEN_PP(t1) + Z_STRLEN_PP(t2) == 0) {

if (ac > 2) {

Z_DVAL_PP(percent) = 0;

}

RETURN_LONG(0);

}

sim = php_similar_char(Z_STRVAL_PP(t1), Z_STRLEN_PP(t1), Z_STRVAL_PP(t2), Z_STRLEN_PP(t2));

if (ac > 2) {

Z_DVAL_PP(percent) = sim * 200.0 / (Z_STRLEN_PP(t1) + Z_STRLEN_PP(t2));

}

RETURN_LONG(sim);

}

所有看出similar_text是根據ASCII做比較的,是不考慮詞組問題的。

測試了一下,結果如下:

int main(int argc, char *argv[])

{

char *str1="weican wuxin";

char *str2="wuxin weican";

int pos1,pos2,max;

php_similar_str(str1,strlen(str1),str2,strlen(str2),&pos1,&pos2,&max);

printf("php_similar_str:%d,%d=%d\n",pos1,pos2,max);

max=php_similar_char(str1,strlen(str1),str2,strlen(str2));

printf("php_similar_char:%d\n",max);

system("PAUSE");

return 0;

}

php_similar_str:0,6=6

php_similar_char:6

char *str1="TCP協議通訊工作原a理";

char *str2="TCPa協議通訊工作原理";

php_similar_str:3,4=14

php_similar_char:19

 
 
 
免責聲明:本文為網絡用戶發布,其觀點僅代表作者個人觀點,與本站無關,本站僅提供信息存儲服務。文中陳述內容未經本站證實,其真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,並請自行核實相關內容。
2023年上半年GDP全球前十五強
 百态   2023-10-24
美眾議院議長啟動對拜登的彈劾調查
 百态   2023-09-13
上海、濟南、武漢等多地出現不明墜落物
 探索   2023-09-06
印度或要將國名改為「巴拉特」
 百态   2023-09-06
男子為女友送行,買票不登機被捕
 百态   2023-08-20
手機地震預警功能怎麽開?
 干货   2023-08-06
女子4年賣2套房花700多萬做美容:不但沒變美臉,面部還出現變形
 百态   2023-08-04
住戶一樓被水淹 還衝來8頭豬
 百态   2023-07-31
女子體內爬出大量瓜子狀活蟲
 百态   2023-07-25
地球連續35年收到神秘規律性信號,網友:不要回答!
 探索   2023-07-21
全球鎵價格本周大漲27%
 探索   2023-07-09
錢都流向了那些不缺錢的人,苦都留給了能吃苦的人
 探索   2023-07-02
倩女手遊刀客魅者強控制(強混亂強眩暈強睡眠)和對應控制抗性的關系
 百态   2020-08-20
美國5月9日最新疫情:美國確診人數突破131萬
 百态   2020-05-09
荷蘭政府宣布將集體辭職
 干货   2020-04-30
倩女幽魂手遊師徒任務情義春秋猜成語答案逍遙觀:鵬程萬裏
 干货   2019-11-12
倩女幽魂手遊師徒任務情義春秋猜成語答案神機營:射石飲羽
 干货   2019-11-12
倩女幽魂手遊師徒任務情義春秋猜成語答案昆侖山:拔刀相助
 干货   2019-11-12
倩女幽魂手遊師徒任務情義春秋猜成語答案天工閣:鬼斧神工
 干货   2019-11-12
倩女幽魂手遊師徒任務情義春秋猜成語答案絲路古道:單槍匹馬
 干货   2019-11-12
倩女幽魂手遊師徒任務情義春秋猜成語答案鎮郊荒野:與虎謀皮
 干货   2019-11-12
倩女幽魂手遊師徒任務情義春秋猜成語答案鎮郊荒野:李代桃僵
 干货   2019-11-12
倩女幽魂手遊師徒任務情義春秋猜成語答案鎮郊荒野:指鹿為馬
 干货   2019-11-12
倩女幽魂手遊師徒任務情義春秋猜成語答案金陵:小鳥依人
 干货   2019-11-12
倩女幽魂手遊師徒任務情義春秋猜成語答案金陵:千金買鄰
 干货   2019-11-12
 
>>返回首頁<<
靜靜地坐在廢墟上,四周的荒凉一望無際,忽然覺得,淒涼也很美
© 2005- 王朝網路 版權所有