这个方法的好处:
1、利用奇虎的分词数据库 数度快 准确率高
2、修改地方少!
3、我的网站是gbk 要utf-8 这个很简单!
方法
后台添加提取:
打开e/admin/ecmsinfo.php
找到“
if($enews=="AddNews")//增加信息
{ ”
在大括号后加入代码
前台投稿提取
打开e/DoInfo/ecms.php
找到“
if($enews=="MAddInfo")
{ ”
在大括号后加入代码
| //自动提取关键字tag开始 $charset = 'GBK'; //设定编码 $subjectenc=$_POST['title']; $subjectenc.=SubSmalltextVal($_POST['newstext'],160); //关键字提取字段 //远程提取关键子 $data = @implode('', file("http://keyword.discuz.com/related_kw.html?ics=$charset&ocs=$charset&title=$subjectenc&content=$subjectenc")); if($data){ //xml处理开始 谨慎修改 $parser = xml_parser_create(); xml_parser_set_option($parser, XML_OPTION_CASE_FOLDING, 0); xml_parser_set_option($parser, XML_OPTION_SKIP_WHITE, 1); xml_parse_into_struct($parser, $data, $values, $index); xml_parser_free($parser); //xml处理结束 谨慎修改 $kws = array(); foreach($values as $valuearray) { if($valuearray['tag']=='kw'||$valuearray['tag']=='ekw') { $kws[] =mb_convert_encoding(trim($valuearray['value']),"GBK","UTF-8"); //拆分关键字数组并转换编码 } } $keywords = ''; if($kws){ foreach($kws as $kw) { $kw = htmlspecialchars($kw); $keywords .= $kw.','; //关键字加,号 } $keywords = substr(htmlspecialchars($keywords), 0, -1) ;//去除尾部,号 } } $_POST['keyboard']=$keywords;//关键字赋值 $_POST['infotags']=$keywords;//tag赋值 //自动提取关键字tag结束 |
文章来源:
网络小编D
版权声明:
本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,请联系本站立刻删除。
