百度站长平台:新增数据标注工具
2019-04-08 09:46:03来源: 木木SEO博客 阅读 ()
一个网站的页面内容,例如人物、事件、餐厅、产品、电影、软件、评论、不仅要给用户看,还要让搜索引擎可识别,而目前要让其知会特定内容含义,我们需要使用结构化数据,结构化数据也是为了方便搜索引擎识别特别页面内容而产生的,有特定的规范,有特定的格式。
搜索引擎都支持标准的结构化数据,以便为用户提供更好的搜索体验。百度、谷歌、360都支持网站结构化数据的提交,结构化微数据可以让搜索引擎提供更丰富的搜索结果摘要展现,让搜索用户直接在搜索结果中看见你商品的重要信息,例如:商品的价格、名称、库存状况(商品是否有货)、评论者评分和评论等。这些丰富网页摘要可帮助用户了解网站与他们的搜索内容是否相关,可以让网页获得更多点击,提升网站的形象和流量。
百度新增数据标注工具(来自百度站长平台)
近日,百度站长平台为了方便网站更好的实现结构化数据提交,特别推出数据标记工具。
百度站长平台数据标注工具,是一种快速将网站结构化数据提交给百度的方式。只要用鼠标简单的划选,百度就可以快速学习如何从你网站中提取结构化数据,之后这些信息能在百度搜索结果中以富摘要的形式展现,提升网站的形象和流量。
如何使用百度站长平台数据标注工具?
以软件下载站为例,除了各种软件分类列表页外,软件下载站的主要页面为软件下载页,包含了许多结构化数据。例如“百度浏览器下载页”,页面含有软件名称、大小、更新时间、评分、下载链接等结构化数据。其他软件下载页,和这个页面包含的信息类似。
1、选择此网页为典型网址,作为百度学习提取结构化数据的起始网页。
如下图,我们若要告知百度网页哪部分内容代表软件名称,只要用右键划选“百度浏览器”,在弹出菜单中选择“名称”即可,其他信息采用类似的方式标注。其他结构化数据同样如此选择。
页面右侧列出了描述软件信息的字段,希望将网页中有的信息都标注完整。有些右侧带“重要”标识,这些字段是出富摘要的必要字段,需特别关注。
2、此页面标注完成后,点“继续标注”进入创建网页集页面。
网页集是指一类相似页面的集合,通过网址模式来圈定。对于网址结构良好的网站来说,一个网址模式可以代表一类网页,此模式覆盖的网页,网页结构是类似的。百度将结合对你网站结构的理解,根据你标注的第一个页面,自动推荐一个模式。
3、接下来到验收百度学习成绩时候了
大部分情况下,百度的学习是不错的。百度会根据网页集模式,随机抽样符合此模式的网页,并自动标注网页内容。
你需要详细检查百度的数据标注,并给予反馈:
如果随机抽样的网页,页面结构和首次标注的典型网页不一样,需点击“忽略”;
如果有些字段,没有自动抽取出来,需要用鼠标划选标注;
如果有些字段,自动标注的内容错了,需要删除,重新划选标注。
4、标注完成后,回到工具首页可以了解数据处理的状态和进度。
如果数据处理没问题,最终你的网站将获得类似下图的富摘要展现效果。
此工具目前处于邀请内测阶段,只支持软件类,之后逐步开放电影、游戏等类别。若要使用请发送邮件至zhanzhangpingtai@baidu.com申请权限。
再看谷歌数据标记工具
虽然百度站长平台数据标记工具才出来,并且还在内测,只适合软件类,我没怎么用,但谷歌站长平台的数据标记工具已经出来很久了,这个还是用得比较多的。据我的了解,这2个数据标记工具功能基本上是一致的(从名字上就知道了),而且谷歌的是要更甚一筹。
谷歌数据标记网页的过程也非常简单,无需更改自己网站的 HTML。只需使用鼠标突出显示数据条目并选择它们的类型即可,和百度是一样的。谷歌下次抓取你的网站时,活动数据将可用于搜索结果页上的丰富网页摘要。
进入谷歌站长管理工具,点击数据标记工具,输入你要标注的商品页URL,谷歌数据标记支持的数据类型有10种之多,非常丰富。这里以产品类型为例。
进入标注页面之后就简单了,和百度的数据标记一样,选择需要的项目然后设定对应的属性就可以了,可以发现商品属性主要是名称、图片、定价、评论之类的。在所有的标注设定好之后,记住要进行发布,之后在谷歌再次抓取后如果标注没问题就会被展示。
当然谷歌数据标记工具也可以进行页面集的标注,一次性标记一组类似的网页。
首先标记一个普通的网页。数据标注工具将会自动为你标记同类型网页,并且与你网站的更新内容保持同步。自动标注的页面你可以自行修改,如需向数据标注工具说明你网站上的哪些网页包含同类数据,你可以创建一个或多个网页集。网页集是网站上始终显示数据的一组网页。
谷歌蜘蛛每次在你的网站上抓取网页时,数据标注工具会提取数据并将数据用于丰富网页摘要。如果你对网页显示信息的方式或网站的网址做出重大更改,则应删除原始网页集,并向数据标注工具说明你网站的新结构。这一点谷歌有先见之明,用百度站长平台数据标记工具的朋友也一定要注意这一点。
总而言之
既然是数据标记工具,那么就是快速地简单地将网站的结构化数据提交给百度,而且是自动标记,无需更改代码或专门提交结构化数据,节省了大量的时间和技术成本,不像专门编写数据代码并且提交那么麻烦。每位站长只要有对应的数据类型就可以很方便的进行提交,这不仅可以提升网站的形象,而且可以大大提高网页在搜索结果的点击率。而且对于搜索引擎,这样搜索结果更加丰富,用户能得到更多的信息并找到更好的搜索结果,大大提供搜索体验。
所以,结构化数据的标记,无疑,是一箭三雕,站长赢、用户赢、搜索引擎也赢。
转载请注明木木SEO博客,http://blog.sina.com.cn/mumuhouzi。
标签:
版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点,本站所提供的摄影照片,插画,设计作品,如需使用,请与原作者联系,版权归原作者所有
- 《百度新闻源生存法则》之官方培训视频:什么是新闻源 2020-03-30
- 《百度新闻源生存法则》之官方培训视频:什么是新闻源 2020-03-29
- 《百度新闻源生存法则》之官方培训视频:什么是新闻源 2020-03-28
- 《百度新闻源生存法则》之官方培训视频:什么是新闻源 2020-03-27
- 《百度新闻源生存法则》之官方培训:影响时效性阿拉丁排序的 2020-03-27
IDC资讯: 主机资讯 注册资讯 托管资讯 vps资讯 网站建设
网站运营: 建站经验 策划盈利 搜索优化 网站推广 免费资源
网络编程: Asp.Net编程 Asp编程 Php编程 Xml编程 Access Mssql Mysql 其它
服务器技术: Web服务器 Ftp服务器 Mail服务器 Dns服务器 安全防护
软件技巧: 其它软件 Word Excel Powerpoint Ghost Vista QQ空间 QQ FlashGet 迅雷
网页制作: FrontPages Dreamweaver Javascript css photoshop fireworks Flash