PHP采集腾讯微博只留文字部分

2018-07-20    来源:open-open

容器云强势上线!快速搭建集群,上万Linux镜像随意使用
PHP采集腾讯微博只留文字部分
<?php
header("Content-type:text/html;charset=utf-8");
$weibo = file_get_contents('http://t.qq.com/starank');

$preg = '/<div class="msgCnt">(.*)<\/div><div class="mediaWrap">/Uis';
preg_match_all($preg, $weibo, $string);

foreach ($string[1] as $key=>$value){
    echo delhtml($value)."<br/><br/><br/>";
}

function delhtml($str) // 清除HTML标签
{
    $st = -1; //开始
    $et = -1; //结束
    $stmp = array();
    $stmp[] = " ";
    $len = strlen($str);
    for($i = 0;$i < $len;$i++)
    {
        $ss = substr($str, $i, 1);
        if (ord($ss) == 60) // ord("<")==60
        {
            $st = $i;
        }
        if (ord($ss) == 62) // ord(">")==62
        {
            $et = $i;
            if ($st != -1)
            {
                $stmp[] = substr($str, $st, $et - $st + 1);
            }
        }
    }
    $str = str_replace($stmp, "", $str);
    return $str;
}

?>

标签:

版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点!
本站所提供的图片等素材,版权归原作者所有,如需使用,请与原作者联系。

上一篇:多线程之CountDownLatch工具类

下一篇:javascript 时间格式输出FormatDate函数