| 導購 | 订阅 | 在线投稿
分享
 
 
當前位置: 王朝網路 >> php >> 分析PHP的similar_text函數
 

分析PHP的similar_text函數

2008-12-22 08:09:22  編輯來源:互聯網  简体版  手機版  評論  字體: ||
 
 
  //比較字串,返回兩個字串第一個相同字符的區域

  static void php_similar_str(const char *txt1, int len1, const char *txt2, int len2, int *pos1, int *pos2, int *max)

  {

  char *p, *q;

  char *end1 = (char *) txt1 + len1;

  char *end2 = (char *) txt2 + len2;

  int l;

  *max = 0;

  //遍曆字串

  for (p = (char *) txt1; p < end1; p++) {

   for (q = (char *) txt2; q < end2; q++) {

   for (l = 0; (p + l < end1) && (q + l < end2) && (p[l] == q[l]); l++);

   if (l > *max) {

   //保存相同區域信息

   *max = l;

   *pos1 = p - txt1;

   *pos2 = q - txt2;

   }

   }

  }

  }

  //遞歸函數,比較txt1和txt2的相同字符數量

  static int php_similar_char(const char *txt1, int len1, const char *txt2, int len2)

  {

  int sum;

  int pos1, pos2, max;

  php_similar_str(txt1, len1, txt2, len2, &pos1, &pos2, &max);

  if ((sum = max)) {//這樣寫有什麽意義?????!!!!!

   //遞歸上次不同部分的前部

   if (pos1 && pos2) {

   sum += php_similar_char(txt1, pos1, txt2, pos2);

   }

   //遞歸上次不同部分的後部

   if ((pos1 + max < len1) && (pos2 + max < len2)) {

   sum += php_similar_char(txt1 + pos1 + max, len1 - pos1 - max,

   txt2 + pos2 + max, len2 - pos2 - max);

   }

  }

  //返回本次比較後的相同字符數量

  return sum;

  }

  //PHP函數本身,一堆宏,做了些串轉換和返回值換算,主功能由上面兩個函數做了。

  PHP_FUNCTION(similar_text)

  {

  zval **t1, **t2, **percent;

  int ac = ZEND_NUM_ARGS();

  int sim;

  if (ac < 2 || ac > 3 || zend_get_parameters_ex(ac, &t1, &t2, &percent) == FAILURE) {

   WRONG_PARAM_COUNT;

  }

  convert_to_string_ex(t1);

  convert_to_string_ex(t2);

  if (ac > 2) {

   convert_to_double_ex(percent);

  }

  if (Z_STRLEN_PP(t1) + Z_STRLEN_PP(t2) == 0) {

   if (ac > 2) {

   Z_DVAL_PP(percent) = 0;

   }

   RETURN_LONG(0);

  }

  sim = php_similar_char(Z_STRVAL_PP(t1), Z_STRLEN_PP(t1), Z_STRVAL_PP(t2), Z_STRLEN_PP(t2));

  if (ac > 2) {

   Z_DVAL_PP(percent) = sim * 200.0 / (Z_STRLEN_PP(t1) + Z_STRLEN_PP(t2));

  }

  RETURN_LONG(sim);

  }

  所有看出similar_text是根據ASCII做比較的,是不考慮詞組問題的。

  測試了一下,結果如下:

  int main(int argc, char *argv[])

  {

   char *str1="weican wuxin";

   char *str2="wuxin weican";

   int pos1,pos2,max;

   php_similar_str(str1,strlen(str1),str2,strlen(str2),&pos1,&pos2,&max);

   printf("php_similar_str:%d,%d=%d\n",pos1,pos2,max);

   max=php_similar_char(str1,strlen(str1),str2,strlen(str2));

   printf("php_similar_char:%d\n",max);

   system("PAUSE");

   return 0;

  }

  php_similar_str:0,6=6

  php_similar_char:6

  char *str1="TCP協議通訊工作原a理";

  char *str2="TCPa協議通訊工作原理";

  php_similar_str:3,4=14

  php_similar_char:19
 
 
 
上一篇《不需要mod_rewrite直接使用php實現僞靜態化頁面》
下一篇《在PHP中使用Sockets:從Usenet中獲取文件》
 
 
 
 
 
 
日版寵物情人插曲《Winding Road》歌詞

日版寵物情人2017的插曲,很帶節奏感,日語的,女生唱的。 最後聽見是在第8集的時候女主手割傷了,然後男主用嘴幫她吸了一下,插曲就出來了。 歌手:Def...

兄弟共妻,我成了他們夜裏的美食

老鍾家的兩個兒子很特別,就是跟其他的人不太一樣,魔一般的執著。兄弟倆都到了要結婚的年齡了,不管自家老爹怎麽磨破嘴皮子,兄弟倆說不娶就不娶,老父母爲兄弟兩操碎了心...

如何磨出破洞牛仔褲?牛仔褲怎麽剪破洞?

把牛仔褲磨出有線的破洞 1、具體工具就是磨腳石,下面墊一個硬物,然後用磨腳石一直磨一直磨,到把那塊磨薄了,用手撕開就好了。出來的洞啊很自然的。需要貓須的話調幾...

我就是掃描下圖得到了敬業福和愛國福

先來看下敬業福和愛國福 今年春節,支付寶再次推出了“五福紅包”活動,表示要“把欠大家的敬業福都還給大家”。 今天該活動正式啓動,和去年一樣,需要收集“五福”...

冰箱異味産生的原因和臭味去除的方法

有時候我們打開冰箱就會聞到一股異味,冰箱裏的這種異味是因爲一些物質發出的氣味的混合體,聞起來讓人惡心。 産生這些異味的主要原因有以下幾點。 1、很多人有這種習...

《極品家丁》1-31集大結局分集劇情介紹

簡介 《極品家丁》講述了現代白領林晚榮無意回到古代金陵,並追隨蕭二小姐化名“林三”進入蕭府,不料卻陰差陽錯上演了一出低級家丁拼搏上位的“林三升職記”。...

李溪芮《極品家丁》片尾曲《你就是我最愛的寶寶》歌詞

你就是我最愛的寶寶 - 李溪芮 (電視劇《極品家丁》片尾曲) 作詞:常馨內 作曲:常馨內 你的眉 又鬼馬的挑 你的嘴 又壞壞的笑 上一秒吵鬧 下...

烏梅的功效與作用以及烏梅的食用禁忌有哪些?

烏梅,又稱春梅,中醫認爲,烏梅味酸,性溫,無毒,具有安心、除熱、下氣、祛痰、止渴調中、殺蟲的功效,治肢體痛、肺痨病。烏梅泡水喝能治傷寒煩熱、止吐瀉,與幹姜一起制...

什麽是脂肪粒?如何消除臉部脂肪粒?

什麽是脂肪粒 在我們的臉上總會長一個個像脂肪的小顆粒,弄也弄不掉,而且顔色還是白白的。它既不是粉刺也不是其他的任何痘痘,它就是脂肪粒。 脂肪粒雖然也是由油脂...

網絡安全治理:國家安全保障的主要方向是打擊犯罪,而不是處置和懲罰受害者

來源:中國青年報 新的攻擊方法不斷湧現,黑客幾乎永遠占據網絡攻擊的上風,我們不可能通過技術手段杜絕網絡攻擊。國家安全保障的主要方向是打擊犯罪,而不是處置和懲罰...

河南夫妻在溫嶺網絡直播“造人”內容涉黃被刑事拘留

夫妻網絡直播“造人”爆紅   1月9日,溫嶺城北派出所接到南京警方的協查通告,他們近期打掉了一個涉黃直播APP平台。而根據掌握的線索,其中有一對涉案的夫妻主播...

如何防止牆紙老化?牆紙變舊變黃怎麽辦?

如何防止牆紙老化? (1)選擇透氣性好的牆紙 市場上牆紙的材質分無紡布的、木纖維的、PVC的、玻璃纖維基材的、布面的等,相對而言,PVC材質的牆紙最不透氣...

鮮肌之謎非日本生産VS鮮肌之謎假日貨是謠言

觀點一:破日本銷售量的“鮮肌之謎” 非日本生産 近一段時間,淘寶上架了一款名爲“鮮肌之謎的” 鲑魚卵巢美容液,號稱是最近日本的一款推出的全新護膚品,産品本身所...

中國最美古詩詞精選摘抄

系腰裙(北宋詞人 張先) 惜霜蟾照夜雲天,朦胧影、畫勾闌。人情縱似長情月,算一年年。又能得、幾番圓。 欲寄西江題葉字,流不到、五亭前。東池始有荷新綠,尚小如...

關于女人的經典語句

關于女人的經典語句1、【做一個獨立的女人】 思想獨立:有主見、有自己的人生觀、價值觀。有上進心,永遠不放棄自己的理想,做一份自己喜愛的事業,擁有快樂和成就...

未來我們可以和性愛機器人結婚嗎?

你想體驗機器人性愛嗎?你想和性愛機器人結婚嗎?如果你想,機器人有拒絕你的權利嗎? 近日,第二屆“國際人類-機器人性愛研討會”大會在倫敦金史密斯大學落下帷幕。而...

全球最變態的十個地方

10.土耳其地下洞穴城市 變態指數:★★☆☆☆ 這是土耳其卡帕多西亞的一個著名景點,傳說是當年基督教徒們爲了躲避戰爭而在此修建。裏面曾住著20000人,...

科學家稱,人類死亡後意識將在另外一個宇宙中繼續存活

據英國《每日快報》報道,一位科學家兼理論家Robert Lanza博士宣稱,世界上並不存在人類死亡,死亡的只是身體。他認爲我們的意識借助我們體內的能量生存,而且...

《屏裏狐》片頭曲《我愛狐狸精》歌詞是什麽?

《我愛狐狸精》 - 劉馨棋   (電視劇《屏裏狐》主題曲)   作詞:金十三&李旦   作曲:劉嘉   狐狸精 狐狸仙   千年修...

 
 
 
//比較字串,返回兩個字串第一個相同字符的區域 static void php_similar_str(const char *txt1, int len1, const char *txt2, int len2, int *pos1, int *pos2, int *max) { char *p, *q; char *end1 = (char *) txt1 + len1; char *end2 = (char *) txt2 + len2; int l; *max = 0; //遍曆字串 for (p = (char *) txt1; p < end1; p++) { for (q = (char *) txt2; q < end2; q++) { for (l = 0; (p + l < end1) && (q + l < end2) && (p[l] == q[l]); l++); if (l > *max) { //保存相同區域信息 *max = l; *pos1 = p - txt1; *pos2 = q - txt2; } } } } //遞歸函數,比較txt1和txt2的相同字符數量 static int php_similar_char(const char *txt1, int len1, const char *txt2, int len2) { int sum; int pos1, pos2, max; php_similar_str(txt1, len1, txt2, len2, &pos1, &pos2, &max); if ((sum = max)) {//這樣寫有什麽意義?????!!!!! //遞歸上次不同部分的前部 if (pos1 && pos2) { sum += php_similar_char(txt1, pos1, txt2, pos2); } //遞歸上次不同部分的後部 if ((pos1 + max < len1) && (pos2 + max < len2)) { sum += php_similar_char(txt1 + pos1 + max, len1 - pos1 - max, txt2 + pos2 + max, len2 - pos2 - max); } } //返回本次比較後的相同字符數量 return sum; } //PHP函數本身,一堆宏,做了些串轉換和返回值換算,主功能由上面兩個函數做了。 PHP_FUNCTION(similar_text) { zval **t1, **t2, **percent; int ac = ZEND_NUM_ARGS(); int sim; if (ac < 2 || ac > 3 || zend_get_parameters_ex(ac, &t1, &t2, &percent) == FAILURE) { WRONG_PARAM_COUNT; } convert_to_string_ex(t1); convert_to_string_ex(t2); if (ac > 2) { convert_to_double_ex(percent); } if (Z_STRLEN_PP(t1) + Z_STRLEN_PP(t2) == 0) { if (ac > 2) { Z_DVAL_PP(percent) = 0; } RETURN_LONG(0); } sim = php_similar_char(Z_STRVAL_PP(t1), Z_STRLEN_PP(t1), Z_STRVAL_PP(t2), Z_STRLEN_PP(t2)); if (ac > 2) { Z_DVAL_PP(percent) = sim * 200.0 / (Z_STRLEN_PP(t1) + Z_STRLEN_PP(t2)); } RETURN_LONG(sim); } 所有看出similar_text是根據ASCII做比較的,是不考慮詞組問題的。 測試了一下,結果如下: int main(int argc, char *argv[]) { char *str1="weican wuxin"; char *str2="wuxin weican"; int pos1,pos2,max; php_similar_str(str1,strlen(str1),str2,strlen(str2),&pos1,&pos2,&max); printf("php_similar_str:%d,%d=%d\n",pos1,pos2,max); max=php_similar_char(str1,strlen(str1),str2,strlen(str2)); printf("php_similar_char:%d\n",max); system("PAUSE"); return 0; } php_similar_str:0,6=6 php_similar_char:6 char *str1="TCP協議通訊工作原a理"; char *str2="TCPa協議通訊工作原理"; php_similar_str:3,4=14 php_similar_char:19
󰈣󰈤
 
 
 
  免責聲明:本文僅代表作者個人觀點,與王朝網路無關。王朝網路登載此文出於傳遞更多信息之目的,並不意味著贊同其觀點或證實其描述,其原創性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,並請自行核實相關內容。
 
 
寶貝清純百變豬豬
美女喜太狼裙裝時代
美麗幹練的OL
平面模特楊棋涵
石系列印象
海洲錦屏磷礦
再憶桂林
觀:重金屬所攝影:元陽梯田所想
 
>>返回首頁<<
 
 
 
 熱帖排行
 
 
 
 
© 2005- 王朝網路 版權所有