��ǰλ�ã�首页 > 集团介绍

集团介绍

主题:DEDE采集时自动生成摘要和关键字

����:ʱ��:2019-04-13
主题:DEDE采集时自动生成摘要和关键字最近在学习织梦CMS的采集功能,在采集的过程我总是发现织梦5.6可以采集到内容,但不可自动生成摘要和关键字,关键字和摘要都是空的。感觉很遗憾,怎么办呢?可能很多人都遇到了和我一样的问题,在论坛实在没找到好的解决办法,就自己动手去改改文件。废话不多说了。下面是我的解决办法比如我采集了网站:http://www.ytljz.cn首页的meta代码是:<meta http-equiv="Content-Type" c="c"  /><title>一条龙建站 - 建站服务,建站教程,新云建站教程,织梦建站教程,CMS建站教程</title><meta name="description" c="c"  /><meta name="keywords" c="c"  />如果用dedecms的采集的时候就没有办法自动获取description和keywords的值的。 1、修改 include/dedecollection.class.php//自动分析关键字和摘要 preg_match("/<meta[\s]+name=['\"]keywords['-:special:1:-] content="['-:special:1:-](.*)['-:special:1:-]/isU",$this-"/>tmpHtml,$inarr); preg_match("/<meta[\s]+content=['-:special:1:-](.*)['-:special:1:-] name="['-:special:1:-]keywords['-:special:1:-]/isU",$this-"/>tmpHtml,$inarr2); if(!isset($inarr[1]) && isset($inarr2[1])) { $inarr[1] = $inarr2[1]; }用下面一段代码替换上面的//自动分析关键字和摘要 preg_match("/<meta[\s]+name=['-:special:1:-]keywords['-:special:1:-] content="['-:special:1:-](.*)['-:special:1:-]/isU",$this-"/>tmpHtml,$inarr); preg_match("/<meta[\s]+content=['-:special:1:-](.*)['-:special:1:-] name="['-:special:1:-]keywords['-:special:1:-]/isU",$this-"/>tmpHtml,$inarr2); preg_match("/<meta[\s]+name=keywords content="['-:special:1:-](.*)['-:special:1:-]/isU",$this-"/>tmpHtml,$inarr3); if(!isset($inarr[1]) && isset($inarr2[1])) { $inarr[1] = $inarr2[1]; } if(!isset($inarr[1]) && isset($inarr3[1])) { $inarr[1] = $inarr3[1]; }改了上面的, 还有另一个地方需要修改的preg_match("/<meta[\s]+name=['-:special:1:-]description['-:special:1:-] content="['-:special:1:-](.*)['-:special:1:-]/isU",$this-"/>tmpHtml,$inarr); preg_match("/<meta[\s]+content=['-:special:1:-](.*)['-:special:1:-] name="['-:special:1:-]description['-:special:1:-]/isU",$this-"/>tmpHtml,$inarr2); if(!isset($inarr[1]) && isset($inarr2[1])) { $inarr[1] = $inarr2[1]; }用下面的代码替换掉上面的:preg_match("/<meta[\s]+name=['-:special:1:-]description['-:special:1:-] content="['-:special:1:-](.*)['-:special:1:-]/isU",$this-"/>tmpHtml,$inarr); preg_match("/<meta[\s]+content=['-:special:1:-](.*)['-:special:1:-] name="['-:special:1:-]description['-:special:1:-]/isU",$this-"/>tmpHtml,$inarr2); preg_match("/<meta[\s]+name=description content="['-:special:1:-](.*)['-:special:1:-]/isU",$this-"/>tmpHtml,$inarr3); if(!isset($inarr[1]) && isset($inarr2[1])) { $inarr[1] = $inarr2[1]; } if(!isset($inarr[1]) && isset($inarr3[1])) { $inarr[1] = $inarr3[1]; }重新上传,大功告成。记得覆盖的时候一定要备份哦。  
���ű�ǩ: