作者:涂俊杰
来源:www.27sem.com
整理最新最全的搜索引擎术语,分为“搜索引擎、网站建设、页面优化、链接建设、数据分析、其他”六大部分。目前共整理65+30+30+17+22+8=172个术语解释。其中标注“*”为个人或网络释义,仅供参考。部分涉及到比率的算式略掉了“*100%”,计算时自行脑补。感谢所有有分享精神互联网人,希望你看完能有收获。
一、名词介绍
搜索引擎优化(SEO:Search Engine Optimization)
SEO是由英文Search Engine Optimization缩写而来, 中文意译为“搜索引擎优化”。SEO是指通过站内优化比如网站结构调整、网站内容建设、网站代码优化等及站外优化,比如网站站外推广、网站品牌建设等,使网站满足搜索引擎收录排名需求,在搜索引擎中提高关键词排名,从而把精准用户带到网站,获得免费流量,产生直接销售或品牌推广。
白帽SEO(White hat SEO)
白帽SEO是一种公正的手法,是使用符合主流搜索引擎发行方针规定的SEO优化方法。它与黑帽SEO相反。白帽SEO一直被业内认为是最佳的SEO手法,它是在避免一切风险的情况下进行操作的,同时也避免了与搜索引擎发行方针发生任何的冲突,它也是SEOer从业者的最高职业道德标准。
黑帽SEO(Black hat SEO)
笼统的说,所有使用作弊手段或可疑手段的,都可以称为黑帽SEO,比如说垃圾链接,隐藏网页,桥页,关键词堆砌等。黑帽SEO获利主要的特点就是短平快。这种针对搜索引擎漏洞而采用的作弊方法,随时会因为搜索引擎算法的改变而面临惩罚。
灰帽SEO(Grey hat SEO)
所谓灰帽SEO灰帽,即是指介于白帽与黑帽之间的中间地带,相对于白帽而言,会采取一些取巧的方式来操作,这些行为因为不算违规,但同样也不遵守规则,是为灰色地带。
搜索引擎营销(SEM:Search Engine Marketing)
SEM是由英文Search Engine Marketing缩写而来, 中文意译为“搜索引擎营销”。简单来说,搜索引擎营销就是基于搜索引擎平台的网络营销,利用人们对搜索引擎的依赖和使用习惯,在人们检索信息的时候将企业信息传递给目标用户。让用户主动的找到企业,并点击企业的广告,最终和企业产生联系或下单。
点击付费广告(PPC:Pay Per Click)
PPC是英文Pay Per Click的缩写形式,其中文意思就是点击付费广告。点击付费广告是大公司最常用的网络广告形式。提供点击付费的网站非常多,主要有各大门户网站(如搜狐、新浪)搜索引擎(Google和百度),以及其它浏览量较大的网站。
百度竞价排名(Baidu Bid)
百度竞价排名是百度国内首创的一种按效果付费的网络推广方式,简单便捷的网页操作即可给企业带来大量潜在客户,有效提升企业知名度及销售额。每天有超过1亿人次在百度查找信息,企业在百度注册与产品相关的关键词后,就会被主动查找这些产品的潜在客户找到。
需求方平台广告(DSP:Demand-Side Platform)
在互联网广告产业中,DSP是一个系统,也是一种在线广告平台。它服务于广告主,帮助广告主在互联网或者移动互联网上进行广告投放,DSP可以使广告主更简单便捷地遵循统一的竞价和反馈方式,对位于多家广告交易平台的在线广告,以合理的价格实时购买高质量的广告库存。
*需求方(DSP)提出广告需求,由交易平台(Ad Exchange)连接供应平台(SSP),通过数据管理平台(DMP)找到精准用户,实时竞价(RTB)计算出该次广告展示需求方需要出的价格。
互联网广告交易平台(Ad Exchange)
AdExchange是互联网广告交易平台,像股票交易平台一样,Ad Exchange联系的是广告交易的买方和卖方,也就是广告主方和广告位拥有方。
供应方平台(SSP:Sell-Side Platform)
供应方平台能够让媒体主也介入广告交易,从而使它们的库存广告可用。通过这一平台,媒体主希望他们的库存广告可以获得最高的有效每千次展示费用,而不必以低价销售出去。
数据管理平台(DMP:Data-Management Platform)
数据管理平台能够帮助所有涉及广告库存购买和出售的各方管理其数据、更方便地使用第三方数据、增强他们对所有这些数据的理解、传回数据或将定制数据传入某一平台,以进行更好地定位。
实时竞价(RTB:Real Time Bidding)
RTB是一种技术为王的精准营销手段,当一个用户在全网浏览过某种商品,或点击过特殊类目的广告后,其浏览痕迹都会通过cookie记录在案,而通过广告交易平台,你在下一次浏览网页的时候,将被推送符合偏好的广告。
应用商店搜索优化(ASO:App Store Optimization)
ASO是“应用商店搜索优化”的简称。ASO(App StoreOptimization)就是提升你APP在各类APP电子市场排行榜和搜索结果排名的过程。类似移动APP的SEO优化。
基于位置的服务(LBS:Location Based Service)
通俗的说,基于位置的服务,就是首先是确定移动设备或用户所在的地理位置;其次是提供与位置相关的各类信息服务。如LBS与O2O(美团)。用户通过LBS服务查询到自己周围的商业信息,然后顺着导航找到实体消费点,这是线上程序;在实体店完成消费,就是线下程序。
每点击成本(CPC:Cost Per Click)
网络广告每次点击的费用,是网络广告界最常见的定价形式。
每销售成本(CPS:Cost Per Sales)
以实际销售产品数量来计算广告费用的广告,这种广告更多的适合购物类、导购类、网址导航类的网站,需要精准的流量才能带来转化。
按时间成本(CPT:Cost Per Time)
这种方式的特点是按用户使用时长或使用周期计费,可以从根本上杜绝刷流量、激活作弊,是最真实的、有效的营销方式之一。
按事件成本(CPA:Cost Per Action)
这种计价方式是指按广告投放实际效果,即按预先设定好的转化目标来计费,而不限广告投放量。
每千人成本(CPM:Cost Per Mille)
即Cost Per Thousand Impression每千次印象数成本;广告主为它的广告显示1000次所付的费用。
每回应成本(CPR:Cost Per Response)
以浏览者的每一个回应计费,这种广告计费充分体现了网络广告“及时反应、直接互动、准确记录”的特点,但是,这个只是辅助销售的一种公式。
每用户平均收入(ARPU:Average Revenue Per User)
ARPU注重的是一个时间段内运营商从每个用户所得到的利润。很明显,高端的用户越多,ARPU越高。在这个时间段,从运营商的运营情况来看,ARPU值高说明利润高,这段时间效益好。
日活跃用户数量(DAU:Daily Active User)
通常统计一日(统计日)之内,登录或使用了某个产品的用户数(去除重复登录的用户),是用来衡量产品的用户粘性的重要指标。
投资回报率(ROI:Return On Investment )
投资回报率(ROI)=年利润或年均利润/投资总额×100%,通常用于评估企业对于某项活动的价值,ROI高表示该项目价值高。
二、展现样式
整合搜索
整合搜索即内容搜索、图片、视屏搜索等搜索结果整理在一起,在搜索引擎的显示区块内显示出来。
站点子链
站点子链提交工具,鼓励网站管理员将网站内优质子链提交给百度,这些信息能在百度搜索结果中以“站点子链”的形式展现,提升网站的权威性,帮助用户浏览您的网站,提升网站的流量和用户体验。
框计算
富摘要
数据标注
知心搜索
知识图谱
百度付费样式(略)
*
三、工作原理
全文搜索引擎(FullTextSearch Engine)
全文搜索引擎是目前广泛应用的主流搜索引擎。它的工作原理是计算机索引程序通过扫描文章中的每一个词,对每一个词建立一个索引,指明该词在文章中出现的次数和位置,当用户查询时,检索程序就根据事先建立的索引进行查找,并将查找的结果反馈给用户的检索方式。最常用的全文搜索引擎有百度、谷歌(Google)等。
元搜索引擎(METASearch Engine)
元搜索引擎、聚合搜索都是通过一个统一的用户界面帮助用户在多个搜索引擎中选择和利用合适的(甚至是同时利用若干个)搜索引擎来实现检索操作,是对分布于网络的多种检索工具的全局控制机制。中国第一个元搜索引擎是比比猫,但是目前已经倒闭。之前有段时间360出过综合搜索,其实基本等同元搜索,搜索结果展示为百度、360、谷歌等所有引擎结果的综合页面。但是后来没做了,大概因为版权原因。
目录搜索引擎
目录搜索引擎虽然有搜索功能,但严格意义上不能称为真正的搜索引擎,只是按目录分类的网站链接列表而已。用户完全可以按照分类目录找到所需要的信息。该类搜索引擎因为加入了人的智能,所以信息准确、导航质量高,缺点是需要人工介入、维护量大、信息量少、信息更新不及时。如早期的雅虎、搜狐。而现在的hao123导航网站虽然功能相近,但严格意义上来说并不算目录搜索引擎,仅仅是按目录分类的网站链接列表而已。
网页蜘蛛(Spider)
网页蜘蛛(又被称为网络爬虫,网络机器人,搜索引擎蜘蛛),是一种按照一定的规则,自动的抓取万维网信息的程序或者脚本。
蜘蛛陷阱(Spider trap)
“蜘蛛陷阱”是阻止蜘蛛程序爬行网站的障碍物,通常是那些显示网页的技术方法,目前很多浏览器在设计的时候考虑过这些因素,所以可能网页界面看起来非常正常,但这些蜘蛛陷阱会对蜘蛛程序造成障碍,如果消除这些蜘蛛陷阱,可以使蜘蛛程序收录更多的网页。
抓取频次
抓取频次是搜索引擎在单位时间内(天级)对网站服务器抓取的总次数,如果搜索引擎对站点的抓取频次过高,很有可能造成服务器不稳定,Baiduspider会根据网站内容更新频率和服务器压力等因素自动调整抓取频次。
搜索请求(Query)
搜索请求,又被称作搜索查询,指用户在搜索引擎键入某个关键词搜索并试图取得返回结果的过程。搜索请求代表查询者的搜索意图。
索引(Index)
俗称“预处理”。蜘蛛抓取的页面文件分解、分析,并以巨大表格的形式存入数据库,这个过程即是索引。在索引数据库中,网页文字内容,关键词出现的位置、字体、颜色、加粗、斜体等相关信息都有相应记录。
站点索引量
站点中有多少页面可以作为搜索候选结果,就是一个网站的索引量。
站点内容页面需要经过搜索引擎的抓取和层层筛选后,方可在搜索结果中展现给用户。页面通过系统筛选,并被作为搜索候选结果的过程,即为建立索引。
目前site语法的数值是索引量估算值,比较不准。推荐站长们使用我们的新工具,同时我们也正在努力改进site语法。
收录
指搜索引擎把网站索引到自己的数据库中,常见的搜索引擎收录有百度收录、谷歌收录、搜狗收录、有道收录、雅虎收录、夸搜收录、泽许收录等。用户可以通过搜索引擎提交入口提交网站吸引蜘蛛抓取页面,或通过外部链接吸引搜索引擎访问网站页面,当搜索引擎认为页面符合收录标准时,就会收录于网站页面。
建库
为新索引网页建立索引库。我们在判断网页收录的时候常常会分为两种情况,第一种就是搜索网页链接;第二种就是我们直接搜索网页标题。当出现搜索引擎只收录了网页链接而搜索标题找不到链接时,我们称作“该网页未建库”,就是搜索引擎发现了你的URL,但是却没有将其放入索引中。在这种情况下,你搜索任何和该网页相关的Query,都无法使网页出现在搜索结果中,除了搜索URL本身。
无效收录
关于无效收录,百度站长@hanbelt是这么说的:首先是字面意思,所谓“无效”,就是跟没有是一样的,不会带来任何搜索流量。举个例子,关于“小孩发烧怎么办”的内容,百度索引库里已经有50W个页面了,而这个主题短时间内也不可能有啥新鲜内容,除非科技突然大突破,百度认为,这个索引量的页面已经足够解决用户需求了,再多索引也是浪费资源,新索引进来的页面没必要再放入这个索引库里,转而放到底层库了。
底层库
底层库是什么,就是备胎!你的女神有50W个男友,你是50W位置后的备胎。怎么能转正呢?等50W里死掉一大半,估计你机会来了。不能参与排名的都在底层库里。所以,想要信息不被放入到底层库,一是要有足够的影响力,百度不敢忽视你,比如新浪网易之类的,就算发个广告,度娘也乖乖的索引起来,作为正式男友,不敢当备胎。二是要有新颖的内容,度娘也喜新厌旧,好东西当然不会错过。
*http://bbs.zhanzhang.baidu.com/thread-16734-1-3.html
排名(Ranking)
在搜索引擎里输入一个关键字,通常得到很多搜索结果,这些搜索结果的排名有先后之分,这就是搜索引擎排名。
自然排名
与付费和广告无关,只是依靠页面本身相关性、重要性而出现在搜索引擎结果页面的排名,在一个搜索引擎结果页面上,广告或付费排名通常都有企业推广、赞助商链接之类的名称,自然排名则没有这些标记。
网页快照
搜索引擎在收录网页时,对网页进行备份,存在自己的服务器缓存里,当用户在搜索引擎中点击“网页快照”链接时,搜索引擎将Spider系统当时所抓取并保存的网页内容展现出来,称为“网页快照”。
*http://www.mahaixiang.cn/seoyjy/451.html
网站权重(Page Strength)
网站权重是指搜索引擎给网站(包括网页)赋予一定的权威值,对网站(含网页)权威的评估评价。一个网站权重越高,在搜索引擎所占的份量越大,在搜索引擎排名就越好。其中有几点需要注意:1、权重不等于排名 2、权重对排名有着非常大的影响 3、整站权重的提高有利于内页的排名。
*误区:例如人们经常讨论的百度权重其实并不是百度官方给出的概念,而是爱站、站长工具等网站推出的针对网站关键词排名预计给网站带来流量,划分等级0-10第三方网站欢迎度评估数据。
网站降权(Rightdown)
利用搜索引擎策略缺陷,以恶意手段获取与网页质量不符排名,而引发搜索结果和用户体验下降的行为都会被搜索引擎视为作弊行为,作弊应为按照“轻者轻罚,重者重罚”原则:对用户体验及搜索结果质量影响不大的,去除作弊部分所获权值,对用户体验及搜索结果质量影响严重的,去除作弊部分所获权值并降低网站权重,直至彻底清理出搜索结果。
K站
俗称“拔毛”。所谓百度K站便是封杀了你的网站,你的收录会是0,从百度搜刮引擎上基础就找不到你的网站痕迹。K站可以说是给百度冻结了,通常需要很长时间才能恢复。
Alexa排名
它是指网站的世界排名,主要分为综合排名和分类排名,Alexa提供了包括综合排名、到访量排名、页面访问量排名等多个评价指标信息,大多数人把它当作当前较为权威的网站访问量评价指标。
网站PR值(Page Rank)
Page Rank,网页排名,又称网页级别、Google左侧排名或佩奇排名,是一种由搜索引擎根据网页之间相互的超链接计算的技术(级别从1到10),而作为网页排名的要素之一,以Google公司创办人拉里·佩奇(Larry Page)之姓来命名。
*2014谷歌官方宣布放弃PR
robots.txt
Robots协议(也称为爬虫协议、机器人协议等)的全称是“网络爬虫排除标准”(RobotsExclusion Protocol),网站通过Robots协议告诉搜索引擎哪些页面可以抓取,哪些页面不能抓取。
网站地图(sitemap)
网站地图,又称站点地图。一般有两种常用的格式,一种是xml格式的,一种是html格式。其中html多为静态页面,用于给用户展示,帮助用户更好地在网站搜索需要的内容。而xml格式多用于提交给搜索引擎,供搜索引擎抓取网页页面。
沙盒效应(Sandbox)
由最主要的搜索引擎Google所决定的搜索引擎结果页面(搜索结果)中,新发布的网站排名越来越低。这一现象被称为“沙盒效应”。它们会对那些链接流行度迅速攀升的网站进行冷处理以防止SEOer过度优化。网页可以展现它要的内容,但会被放在“沙箱”里面,而对任何搜索请求都不会得到最高排名其后来的流行度经过一段时间还保持不变,或者逐渐上升,那么搜索引擎就开始取消冷处理并且给链接流行度更高的权重,使得搜索排名上升。
搜索引擎结果页面(SERP:Search engine results page)
SERP是为特定搜索显示的列表或结果,SERP有时候定义为搜索引擎结果的安排(placement),根据本系列的目的,我将其称为页面而不是安排,在SEO领域中,在SERP中取得良好的表现就是一切。
搜索引擎垃圾技术(SPAM:Stupid Person Advertising Method)
搜索引擎垃圾技术是利用不道德的技巧去提高自己搜索引擎上的排名。不诚实的网站管理员就是利用这样的手段去欺骗搜索引擎从而获得较高的排名。这样的做法会让你的网站在短期内排名得到提高,但是后果却是十分严重的。有可能导致搜索引擎把你的网站从他的数据库里永久删除!
四、网站建设
互联网数据中心(IDC:Internet Data Center)
数据中心不仅是一个网络概念,还是一个服务概念,它构成了网络基础资源的一部分,提供了一种高端的数据传输服务和高速接入服务。数据中心提供给用户综合全面的解决方案,为政府上网、企业上网、企业IT管理提供专业服务。
互联网服务提供商(ISP:Internet Service Provider)
互联网服务提供商,即向广大用户综合提供互联网接入业务、信息业务、和增值业务的电信运营商。如中国电信、中国联通等互联网运营单位及其在各地的分支机构和下属的组建局域网的专线单位。
电信与信息服务业务经营许可证(ICP:Internet Content Provider)
网络内容服务商英文为 Internet Content Provider 简写为ICP,这个理解起来比较容易,就是只要网站放在国内主机空间上的网站都需要在工信部那里申请一个ICP号,也就是我们平时经常说的“网站备案”,网站所有者自己在工信部官方网站上申请或者通过主机空间商申请都可以。普通的ICP备案就是获取一个ICP号,这样国家就认可你的网站是合法的了,否则就是不合法的。ICP证由通信管理局核发。
网站备案
网站备案是指向主管机关报告事由存案以备查考。行政法角度看备案,实践中主要是《立法法》和《法规规章备案条例》的规定。网站备案的目的就是为了防止在网上从事非法的网站经营活动,打击不良互联网信息的传播,如果网站不备案的话,很有可能被查处以后关停。
*其实网站备案、ICP备案、域名备案本质上没有区别,都是需要给网站申请ICP备案号。网站的备案是根据空间IP来的,域名要访问空间必须要求能够解析一个IP地址。网站备案指的就是空间备案,域名备案就是对能够解析这个空间的所有域名进行备案。
*域名备案审核时间一般是20个工作日左右,若是在空间域名网络购买虚拟主机,一般七天左右即可协助域名备案完成。审核成功后即可正常访问。
云服务器(ECS:Elastic Compute Service)
是一种简单高效、处理能力可弹性伸缩的计算服务,其管理方式比物理服务器更简单高效。用户无需提前购买硬件,即可迅速创建或释放任意多台云服务器。
虚拟专用服务器(VPS:Virtual private server)
VPS是虚拟服务器,每个VPS都可分配独立公网IP地址、独立操作系统、独立超大空间、独立内存、独立CPU资源、独立执行程序和独立系统配置等。
*云服务器简单一点说,就是由超级计算机上划分出的虚拟机。本质上和传统VPS主机一样,都属于虚拟机,不同点在于,云主机是以超级计算机为物理支持,而VPS主机则是单台服务器为物理支持。所以云服务器可以弹性计算,随时升级,而VPS有独立的内存和硬盘,也有独立的带宽和IP。
虚拟专用网络(VPN:Virtual Private Network )
VPN,虚拟专用网络,等于在你的电脑和你公司的VPN服务器之间建立了一条你专用的“隧道”,“隧道”不需要物理(就是实物)链路,所以“虚拟”。你用账号密码登陆后就和你公司的内网建立了安全的连接(别人看不到传输的内容,所以很安全),然后就可以在你的电脑上使用公司内网,像在公司一样办公了。
*多用于翻墙。
内容分发网络(CDN:Content DeliveryNetwork)
CDN的全称是Content Delivery Network,即内容分发网络。其基本思路是尽可能避开互联网上有可能影响数据传输速度和稳定性的瓶颈和环节,其目的是使用户可就近取得所需内容,解决Internet网络拥挤的状况,提高用户访问网站的响应速度。
*几乎所有的大型网站都在用CDN,看看他们在搜索引擎中的表现就可以知道不会任何的负面影响了。但我们建议站长尽量选择技术成熟的CDN服务商,某些CDN服务商会导致网站在某些地区访问不稳定,可能会影响Baiduspider的抓取。
Whois
简单说,whois就是一个用来查询域名是否已经被注册,以及注册域名的详细信息的数据库(如域名所有人、域名注册商)。
域名(Domain Name)
域名是由一串用点分隔的名字组成的Internet上某一台计算机或计算机组的名称,用于在数据传输时标识计算机的电子方位(有时也指地理位置,地理上的域名,指代有行政自主权的一个地方区域)。域名是一个IP地址上有“面具”。
*搜索引擎对.cn .org .com没有偏好。
首选域
首选域是您希望搜索引擎用来将您的网页编入索引的域(有时也指规范域),就是网站首选的域名。比如:一个站点有两个域名:www.***.com.,***.com。那么搜索引擎默认以为,这两个域名是指向同一个网站的。在搜索引擎收录和展示稳定下来后,它会选择其中一个域名来展示给用户,那么这个域名就叫做首选域(基本等同主域名)。
顶级域名
域名由两个或两个以上的词构成,中间由点号分隔开,最右边的那个词称为顶级域名。
*一般来说,可以粗暴的认为域名中没有“.”,为顶级域名,有几个“.”代表为几级域名。
DNS解析(DNS analysis )
人们习惯记忆域名,但机器间互相只认IP地址,域名与IP地址之间是多对一的关系,一个ip地址不一定只对应一个域名,且一个域名只可以对应一个ip地址,它们之间的转换工作称为域名解析,域名解析需要由专门的域名解析服务器来完成,整个过程是自动进行的。
域名解析(Domain name resolution)
域名解析是把域名指向网站空间IP,让人们通过注册的域名可以方便地访问到网站的一种服务。IP地址是网络上标识站点的数字地址,为了方便记忆,采用域名来代替IP地址标识站点地址。域名解析就是域名到IP地址的转换过程。域名的解析工作由DNS服务器完成。
*举例,你进一个高级小区访问一个朋友,在门口你问保安我的朋友小明在哪儿。保安告诉你,在C座,这就叫“DNS解析”。当然,你的朋友小明早就告诉C座的看门大爷,如果有找小明的就让他来908室。这就叫“域名解析”。
A记录
将域名指向一个IPv4地址(例如:10.10.10.10),需要增加A记录。如百度IP地址为123.125.114.144,这是需要网民输入baidu.com就能访问到IP地址,则需要增加A记录。
CNAME记录(别名记录)
如果将域名指向一个域名,实现与被指向域名相同的访问效果,需要增加CNAME记录。如需要达到浏览器输入baidu.com和www.baidu.com相同效果,则需要CNAME记录。
泛解析(泛域名解析)
泛解析即所有子域名均被解析到统一地址,如zhidao.baidu.com和news.baidu.com全部指向www.baidu.com,则使用泛解析。
网络地址(URL)
统一资源定位符是对可以从互联网上得到的资源的位置和访问方法的一种简洁的表示,是互联网上标准资源的地址。互联网上的每个文件都有一个唯一的URL,它包含的信息指出文件的位置以及浏览器应该怎么处理它。
*你可以说“百度的域名是baidu.com”,不能说“百度知道的域名是zhidao.baidu.com”,应该说“百度知道的网址(URL)是zhidao.baidu.com”
超文本传输协议(HTTP:HyperText Transfer Protocol)
HTTP是一个客户端和服务器端请求和应答的标准(TCP)。客户端是终端用户,服务器端是网站。通过使用Web浏览器、网络爬虫或者其它的工具,客户端发起一个到服务器上指定端口(默认端口为80)的HTTP请求。(我们称这个客户端)叫用户代理(user agent)。应答的服务器上存储着(一些)资源,比如HTML文件和图像。(我们称)这个应答服务器为源服务器(originserver)。
*Web建站技术间关系:https://www.zhihu.com/question/22689579/answer/22318058
HTTPS(HTTPS:Hypertext Transfer Protocol over Secure Socket Layer)
它是一个安全通信通道,它基于HTTP开发,用于在客户计算机和服务器之间交换信息。它使用安全套接字层(SSL)进行信息交换,简单来说它是HTTP的安全版。
HTTP状态码
HTTP状态码(HTTP Status Code)是用以表示网页服务器HTTP响应状态的3位数字代码。
*HTTP状态码只是网页服务器的响应状态,而不代指某个网页。一般来说可以认为2**(请求成功);3** (重定向);4** (网页请求错误);5**(服务器错误)。其中,常见状态码为:200:正常访问;301:永久转向;302:暂时转向;404:文件不存在;502:服务器错误。
SSL证书
SSL证书是数字证书的一种,类似于驾驶证、护照和营业执照的电子副本。因为配置在服务器上,也称为SSL服务器证书。
SSL 证书就是遵守 SSL协议,由受信任的数字证书颁发机构CA,在验证服务器身份后颁发,具有服务器身份验证和数据传输加密功能。如果您的网站使用 SSL 证书 (SSLCertificates),并显示了签章(SecuredSeal),您的客户就知道他们的交易安全可靠,并且充分信赖您的网站。
内容管理系统(CMS:Content Management System)
指的是用来创建和管理网站软件,目前大部分网站都是CMS系统管理、数据库驱动的动态页面。
开放式分类目录(DMOZ:Open Directory Project)
DMOZ网站是一个著名的开放式分类目录(Open Directory Project),之所以称为开放式分类目录,是因为DMOZ不同于一般分类目录网站利用内部工作人员进行编辑的模式,而是由来自世界各地的志愿者共同维护与建设的最大的全球目录社区。
WordPress
WordPress是一种使用PHP语言开发的博客平台,用户可以在支持PHP和MySQL数据库的服务器上架设属于自己的网站。也可以把 WordPress当作一个内容管理系统(CMS)来使用。
镜像网站(克隆网站)
指一个或多个域名不同,但内容完全相同的网站。大多情况下,站长出于正优化,如负载均衡,以及某些被墙网站在国内能正常访问的手法称为镜像网站;为了负作弊,如黑帽SEO复制多个网站,意图获取更多排名等手段为克隆网站。
超文本标记语言(HTML:HyperText Markup Language)
“超文本”就是指页面内可以包含图片、链接,甚至音乐、程序等非文字元素。超文本标记语言的结构包括“头”部分(英语:Head)、和“主体”部分(英语:Body),其中“头”部提供关于网页的信息,“主体”部分提供网页的具体内容。
网站日志(web log)
网站日志是记录web服务器接收处理请求以及运行时错误等各种原始信息的以log结尾的文件,确切的讲,应该是服务器日志,网站日志最大的意义是记录网站运营中比如空间的运营情况,被访问请求的记录,通过网站日志可以清楚的得知用户在什么IP、什么时间、用什么操作系统、什么浏览器、什么分辨率显示器的情况下访问了你网站的哪个页面,是否访问成功。
客户端缓存(cookie)
浏览器用来存储网页需要记住信息的方法,例如,一个网页能够存储你访客名字在Cookie中,这样每次当他们再来的时候,他们的名字就能够出现在他们浏览器中你网站的首页上。
服务器缓存(session)
一般被翻译为“会话”或“时域”,具体到Web中的Session指的就是用户在浏览某个网站时,从进入网站到浏览器关闭所经过的这段时间,也就是用户浏览这个网站所花费的时间。需要注意的是,一个Session的概念需要包括特定的客户端,特定的服务器端以及不中断的操作时间。A用户和C服务器建立连接时所处的Session同B用户和C服务器建立连接时所处的Session是两个不同的Session。
*cookie和session的区别:1.cookie数据存放在客户的浏览器上,session数据放在服务器上;2.cookie不是很安全,别人可以分析存放在本地的COOKIE并进行COOKIE欺骗,考虑到安全应当使用session;3.session会在一定时间内保存在服务器上。当访问增多,会比较占用你服务器的性能考虑到减轻服务器性能方面,应当使用cookie;4.单个cookie保存的数据不能超过4K,很多浏览器都限制一个站点最多保存20个cookie。
五、页面优化
网页导航
一般的网页都有导航栏,方便用户的浏览。所谓的网站的导航栏指的是引导用户访问网站的栏目、菜单、在线帮助、分类等布局结构等形式的总称。所以网站建设的过程中一定要使网站导航结构清晰,能够使访问者在最短时间内找到自己喜欢的内容。
面包屑导航
面包屑导航(BreadcrumbNavigation)这个概念来自童话故事"汉赛尔和格莱特",当汉赛尔和格莱特穿过森林时,不小心迷路了,但是他们发现在沿途走过的地方都撒下了面包屑,让这些面包屑来帮助他们找到回家的路。所以,面包屑导航的作用是告诉访问者他们目前在网站中的位置以及如何返回。
分隔符
分隔符的使用是为了让搜索引擎能够正确识别以英文形式命名的URL中的关键字,我们需要使用相应的符号对词组之间的单词进行分隔,常见的分隔符包括:空格“”、横杠“-”、下划线”_”、逗号“,”及加号“+”等。
*http://t.cn/zRjHoIJ
网站TDK
TDK是个缩写,其中"T"代表页头中的title元素;"D"代表页头中的deion元素;"K"代表页头中的keywords元素。标题、描述、关键词在SEO界也被称为三大标签。
标题标签(Title Tag)
在Html的Head标签内被用来定义页面文档的标题。做SEO不优化标题标签,绝对是不可饶恕的低级错误,因为搜索引擎索引到的内容标题往往是网页Title的内容,想要有好的排名就必须多推敲Title,合理分配Title的关键词,让Title标签里面拥有最为核心的关键词。
描述标签(Deion Tag)
Deion标签一般出现在页面头部的meta标签中,主要用于概括或描述页面的内容。页面的Deion标签可以较详细地告诉搜索引擎这个页面是关于什么的。一个页面的Title标签可能是几个单词或短语,而与Title标签有所不同,页面的Deion标签则是一两句话或一个简短的段落。
关键词标签(Keywords Tag)
网站的首页关键词至关重要。首页网站关键词代表了网站主题内容,内页和栏目页的关键词一般紧扣页面主题,代表的是当前页面或者栏目内容的主体。
*keywords已经对搜索引擎排名没有任何作用了。
图片提示标签(Alt Tag)
alt标签实际上是网站上图片的文字提示。不好的习惯是每张图片都没有alt标签。而不可取的是,对于每个标签都采用关键词堆砌,这样就有可能会导致被视为Spam垃圾网站。
*Alt标签并不能提高关键词密度。
H标签(<h>)
一般来说H1标签主要用于修饰网页的主标题和文章标题的,<h2>主要用于修饰大段落的标题,<h3>要用于修饰段落的小节标题,<h4>-<h6>标签基本很少用到。
加粗标签(<b>)
<b>标签是最常用的字体样式之一。粗体标签在突出内容方面所起的作用仅次于标题标签。一般<b>标签常用在锚文本关键词上加粗,来区分锚文本关键词和文章的文字,使用<b>标签的锚文本关键词确实也能够给网站带来比较好的排名,但是一篇文章不适合放置超过3个以上的<b>标签,因为多了就是看的很不舒服。
加重语气标签(<strong>)
<strong>标签是权重标签中的代表,在搜索引擎中能够得到的高度重视。通过<strong>应用到你想强调的文本或者关键词中,这部分内容将会得到读者和搜索引擎的重视。
Meta robots标签
<meta name="robots"content="noindex">
noindex是谷歌发明的一个HTML标签,其作用是向搜索引擎声明该网页禁止被索引收录;
*noindex与nofollow是属于Meta robots标签的一个属性,robots.txt是一个协议文件。此外,如果您使用了robots.txt 文件拦截此网页,我们也无法看到此标记。
Nofollow属性
Nofollow标签的作用有两方面,简单的说,一是不给链接投票,降低此链接的权重,二是使添加nofollow的部分内容不参与网站排名,便于集中网站权重,减少权重的分散。
最初,"Nofollow"属性出现在网页级元标记中,用于指示搜索引擎不要追踪(即抓取)网页上的任何出站链接。例如:<meta name="robots" content="nofollow" />。而后我们使用将"nofollow"放在超链接中,告诉搜索引擎不要抓取特定的链接。<arel="external nofollow" href="https://www.sohu.com/a/url"><span>内容</span></a>。
规范网址标签(Canonical)
对一组内容完全相同或高度相似的网页,通过使用Canonical标签可以告诉搜索引擎哪个页面为规范的网页,能够规范网址并避免搜索结果中出现多个内容相同或相似的页面,帮助解决重复内容的收录问题,避免网站相同内容网页的重复展示及权重的分散,提升规范网页的权重,优化规范网页的排名。使用样式:<link rel=”canonical” href=https://www.sohu.com/a/”网页权威链接”/>。
*百度会根据网页内容实际情况考虑Canonical标签中推荐的网页,但不保证完全遵守该标签。
绝对路径
绝对路径是指文件在硬盘上真正存在的路径。例如c:/website/img/photo.jpg。
相对路径
所谓相对路径,就是相对于自己的目标文件位置。例c:/website/img/photo.jpg中“https://www.sohu.com/img/photo.jpg”就是相对路径。
*代码中使用绝对路径还是相对路径,一般看网站是否存在大量二级域名,如果存在的话,做相对路径一定要小心了,避免死链接。如果没有二级域名,做相对路径的好处大于绝对路径。但有一点,正文中的内部链接不管任何时候一定要用绝对路径(抄袭问题)。
关键词(keywords)
一个特定的词或者短语,搜索营销人员希望搜索者来经常输入作为搜索请求。
长尾关键词(Long Tail Keyword)
长尾关键词(LongTail Keyword)是指网站上非目标关键词但也可以带来搜索流量的关键词。 长尾关键词的特征是比较长,往往是2-3个词组成,甚至是短语,如“今天中午吃什么比较好”、“明天下班去哪里玩儿”等,搜索量非常少,并且不稳定。长尾关键词带来的客户,转化为网站产品客户的概率比目标关键词高很多,因为长尾词的目的性更强。
伪原创
所谓伪原创就是把一篇文章进行再加工,使其让搜索引擎认为是一篇原创文章,从而提高网站权重。
锚文本(Anchor Text)
锚文本又称锚文本链接,是链接的一种形式,和超链接类似,超链接的代码是锚文本,把关键词做一个链接,指向别的网页,这种形式的链接就叫作锚文本。
关键词密度(keyword density)
关键词密度(KeywordDensity)与关键词频率(KeywordFrequency)所阐述的实质上是同一个概念,用来量度关键词在网页上出现的总次数与其他文字的比例,一般用百分比表示,相对于页面总字数而言,关键词出现的频率越高,关键词密度也就越大。
*传说中的关键词密度3%-7%最好并不绝对,只要密度合理即可。
关键词堆积(keyword loading, keyword stuffing)
关键词堆积是指在页面上本来没有必要出现关键词的地方刻意重复或者说堆积关键词,寄希望于提高页面对关键词的相关度或关键词密度,进而提高排名。
停止词(stopword)
停止词,意指在自然语言中出现频率非常高,但对文章或页面意义没有实质影响的词。如英语中的“a”,“the”,“or”,“and”等,中文中的“也”、“的”、“它”、“啊”等。所以搜索引擎遇到停止词时无论索引或排名,都会将这一类词语全部忽略掉。
消除噪声
绝大部分页面上有一部分内容对页面主题没什么贡献,比如版权声明文字、导航条、广告等。所以这些区块都属于噪声,对页面主题只能起到分散作用。搜索引擎需要识别并消除这些噪声,排名时不使用噪声内容。消噪的基本方法是根据HTML标签对页面分块,区分出页头、导航、正文、页脚、广告等区域,在网站上大量重复出现的区块往往属于噪声。对页面进行消噪后,剩下的才是页面主体内容。
信噪比(Text/HTML ratio)
网页信噪比是指一个网页上的文字内容与html代码的比率。从搜索引擎的原理来讲,其抓取系统首先是将整个网页下载下来,然后将里面的文字内容提取出来,经过分析去除html格式,清除噪音,然后分词,最后存入索引库。在这个过程中,搜索引擎也会经过去噪的过程,很明显,网页信噪比越高,搜索引擎抓取的效率就会越高,搜索引擎蜘蛛每天需要处理很多的数据,如何能够快速的提取网页的主题信息是个十分重要的任务。
隐藏文字(hidden text)
隐藏文字是在网页的HTML文件中放上含有关键词的文字,但这些字不能被用户所看到,只能被搜索引擎看到。可以有几种形式,比如说超小字号的文字,与背景同样颜色的文字,放在评论标签当中的文字,放在表格input标签里面的文字,通过样式表把文字放在不可见的层上面等等。其目的也都是想提高网页的相关性。有的时候,有的人还在这些地方放上与网站内容无关的,但是很热门的关键词,希望网页能在这些热门关键词下得到好的排名和流量。
网页劫持(Page Hijacking)
页面劫持是一种SEO作弊手法,指的是黑帽SEO使用各种手段,将本来应该访问页面A的用户,转向到另一个页面B。302转向就是经常被用来实现页面劫持的手段。作弊者在自己的网站页面A上做302转向到其他网站上的页面B。由于误判,搜索引擎把页面A当作原始页面,在搜索引擎排名中出现。用户点击结果A后,作弊者在A网站上通过程序把用户转向到完全无关的(通常是成人内容、赌博、卖各种违禁药品等的网站)页面。页面劫持实际上是利用了其他网站上的高质量内容,却把用户劫持到自己的作弊网站上。
*http://bbs.kafan.cn/thread-1825061-1-1.html
着陆页(Landing Page)
在互联网营销中,引导页就是当潜在用户点击广告或者利用搜索引擎搜索后显示给用户的网页。一般这个页面会显示和所点击广告或搜索结果链接相关的扩展内容,而且这个页面应该是针对某个关键字(或短语)做过搜索引擎优化的。
桥页(doorway pages)
桥页也叫:门页、跳页、过渡页,通常是用软件自动生成大量包含关键词的网页,然后从这些网页做自动转向到主页。目的是希望这些以不同关键词为目标的桥页在搜索引擎中得到好的排名。当用户点击搜索结果的时候,会自动转到主页。
favicon
所谓favicon,即Favorites Icon的缩写,顾名思义,便是其可以让浏览器的收藏夹中除显示相应的标题外,还以图标的方式区别不同的网站。常用的Favicon.ico图标有3种16×16、32×32、48×48。最简单的方法就是将制作好的favicon文件命名为favicon.ico然后上传到网站的根目录下。
六、百度搜索引擎算法
绿萝算法(2013年2月19日上线)
该算法主要打击买卖链接的行为,包括超链中介、出卖链接、购买链接等超链作弊行为。该算法的推出有效制止恶意交换链接,发布外链的行为,有效净化互联网生态圈。
*http://zhanzhang.baidu.com/wiki/142
石榴算法(2013年5月17日上线)
石榴算法主要打击大量妨碍用户正常浏览的恶劣广告的页面,是百度针对低质量网站的进一步打击的升级版,与之前百度绿萝算法相对应。
*http://zhanzhang.baidu.com/wiki/174
绿萝算法2.0(2013年7月1日上线)
绿萝算法2.0针对的重点对象是发布软文的新闻站。惩罚的对象包括:软文交易平台、软文发布站、软文收益站三类;惩罚的方式包括:1.针对软文交易平台,将被直接屏蔽;2.针对软文发布站,将视不同程度而进行处理。例如一个新闻网站,存在发布软文的现象但情节不严重,该网站在搜索系统中将被降低评价;利用子域大量发布软文的,该子域将被直接屏蔽,并且清理出百度新闻源;更有甚者创建大量子域用于发布软文,此种情况整个主域将被屏蔽。3.针对软文受益站,一个网站的外链中存在少量的软文外链,那么此时该外链将被过滤清除出权重计算体系,该受益站点将被观察一段时间后视情况而进一步处理;一个网站的外链中存在大量的软文外链,那么此时该受益站点将被降低评价或直接屏蔽。
*http://zhanzhang.baidu.com/college/articleinfo?id=30
冰桶算法(2014年8月30日上线)
移动端广告弹窗、强制下载APP、登陆才能阅读全文等行为,如果发生在移动页面,则是本次冰桶算法惩罚的对象。
*http://zhanzhang.baidu.com/wiki/313
冰桶算法2.0(2014年11月18日上线)
本次2.0升级主要打击:全屏下载、在狭小的手机页面布设大面积广告遮挡主体内容、强制用户登录才可以使用等问题。
*http://zhanzhang.baidu.com/wiki/341
冰桶算法3.0(2016年7月15日上线)
严厉打击在百度移动搜索中,打断用户完整搜索路径的调起行为。通俗解释就是:用户通过百度搜索,进入你的页面,如果想查看主体内容,需要用户进行另外的操作,比如需要关闭好几个广告,需要分享,等等,之后才给你主体内容。就是你一进去一个网站,这网站不是逼你登陆就是逼你注册才能继续看,打击这种,因为妨碍了用户体验。
*http://zhanzhang.baidu.com/wiki/870
原创星火计划(2013年5月15日)
算法内容:打击抄袭复制等行为,鼓励原创优质内容,推出的首次与有优质原创能力的网站合作,如内容最新来自首发站点,首发站点优先获得排名。现该算法已升级,可直接让技术做好主动推送功能,如是原创内容,记得做标识。
*http://zhanzhang.baidu.com/act/spark
原创星火计划2.0(2015年12月17日)
百度星火计划所服务的原创内容,需要遵守星火计划原创规范,按照规范要求在原创内容中进行标识,同时使用百度站长平台提供的链接提交-主动推送方式进行提交。
*http://zhanzhang.baidu.com/college/courseinfo?id=746&page=2
天网算法(2016年8月10日)
近期,百度网页搜索发现部分站点存在盗取用户隐私的行为,主要表现为网页嵌恶意代码,用于盗取网民的QQ号、联系电话。而许多网民却误认为这是百度所为。为此,百度网页搜索和百度安全联合研发“天网算法”, 严厉打击站点窃取用户信息行为。
七、链接建设
内链(Internal links)
内链,顾名思义就是在同一网站域名下的内容页面之间的互相链接(自己网站的内容链接到自己网站的内部页面,也称之为站内链接)。合理的网站内链接构造,能提高搜索引擎的收录与网站权重。
外链(External links)
外链也叫做“导入链接(inboundLinks)”是指通过其他网站链接到你的网站的链接。
外部链接指的是针对搜索引擎,与其它站点所做的友情链接。高质量的外部链接指:和你的网站建立链接的网站知名度高,访问量大,同时相对的外部链接较少,有助于快速提升你的网站知名度和排名的其他网站的友情链接。
反链
对某个网页文档来说,所有来自其他文档指向自己的链接都叫“反向链接”。一个网页文档的反向链接越多,说明这个文档的“知名度”或“支持率”越高。
*如有三个页面,站内页A,站内页B,站外页C,则反链=C→A或B→A;外链=C→A;内链=C→A。
相关域
相关域即为针对搜索引擎使用“domain”查找到的域名。
*相关域不同于外链,外链只是相关域的一种。相关域可以分为有效相关域与无效相关域。所谓有效相关域就是指的我们常常提到的外链了,即网站的外部链接,在标签内且没有进行nofollow的链接,这种相关域价值较高,且对其他搜索引擎,如谷歌、雅虎也有效。无效相关域是指只具有文字效果的URL了。不管是有效相关域还是无效相关域,都在百度排名中起到了重要作用。
死链(Dead Link)
死链接也就是无效链接,死链接是网站建设中专业术语。页面的TCP协议状态/HTTP协议状态明确表示的死链,常见的如404、403、503状态等。
导出链接(outbound links)
导出链接就是网站或者页面中有指向别的网站的链接,是单向的。导出链接会导致网站的权重流向对方网站,PR还会传递到对方站,导出链接包括友情链接的交换和文章中的链接以及其他非本站的链接。
单向链接(one-way link)
链接到一个网页的超链接,而没有相应链接回到原来的网页。
友情链接(friendly link)
友情链接,也称为网站交换链接、互惠链接、互换链接、双向链接、联盟链接等,是具有一定资源互补优势的网站之间的简单合作形式,即分别在自己的网站上放置对方网站的LOGO图片或文字的网站名称,并设置对方网站的超链接(点击后,切换或弹出另一个新的页面),使得用户可以从合作网站中发现自己的网站,达到互相推广的目的,因此常作为一种网站推广基本手段。
隐藏链接(hidden link)
隐藏链接也叫做“黑链”,指的是正常的链接通过一些方法,如:把链接放入js代码中,使用display:none等等。隐藏链接和隐藏文字(hidden text)相似,但是区别是把关键词放在链接里面,而这个链接也是用户所看不到的。
链轮(Link Wheels)
SEO链轮是指通过在互联网上建立大量的独立站点网站或是在各大门户网站上开设博客,这些独立站点网站或是博客群通过单向的、有策略、有计划的紧密的链接到一个要优化的目标主网站(或主关键词);举例以ABCDE 五个博客名,其中在A 博客中发一个文章,这个锚文本的名字可能是B 博客的名字。同样的方法,B 博客写的文章也是关键字指向你的网站,在文章的结尾做一个链接到C 博客,以此类推。
站群
站群就是一网站的集合,但是一定要统一,分级管理,信息共享,单点登录才可以。最初的站群由政府提出,现在已经应用领域范围很广,例如政府门户网站群、大型企事业网站群、行业网站群等。站群,即一个人或一个团队操作多个网站,目的是通过搜索引擎获得大量流量,或者是将链接指向同一个网站,以提高搜索排名。
页面劫持(Page Hijacking)
页面劫持是一种SEO作弊手法,指黑帽SEO将本来应该访问的页面A的用户转向到另一个页面B。其中302转向经常被用来实现页面劫持的手段,作弊者在自己的网站页面A上做302转向到其他网站上的页面B,由于某种原因,搜索引擎把页面A当做原始页面,在搜索引擎排名中出现,用户点击结果A后,作弊者在A网站上通过程序把用户转向到完全无关的页面上。
空链接(<a href="https://www.sohu.com/a/132123258_329837#"></a>)
空链接是未指派的链接。空链接用于向页面上的对象或文本附加行为。
锚点链接
HTML中的链接,正确的说法应该称作"锚点",它命名锚点链接(也叫书签链接)常常用于那些内容庞大繁琐的网页,通过点击命名锚点,不仅让我们能指向文档,还能指向页面里的特定段落,更能当作"精准链接"的便利工具,让链接对象接近焦点。便于浏览者查看网页内容。类似于我们阅读书籍时的目录页码或章回提示。在需要指定到页面的特定部分时,标记锚点是最佳的方法。
静态URL
URL的定义,是指网页地址或者网页链接。一般通过URL中是否带有“?”、“=”“&”“php”'asp'等字符来分辩,换句话说就是不带有任何参数的URL,就是静态URL。
动态URL
URL又称动态页面,动态链接,即指在URL中出现“?” 这样的参数符号,并以aspx、asp、jsp、php、perl、cgi为后缀的url。
*一般情况下,看链接有无参数即可判断是动态还是静态。另外,目前普遍认为静态页面对SEO的效果优于动态页面,但是谷歌官方曾建议不要讲动态URL静态化,因为目前搜索引擎的抓取参数已经完全没问题,而且动态URL中的参数也有助于搜索引擎识别页面内容,利于搜索引擎理解网页。所以具体是使用静态还是动态URL各位自己斟酌即可,不必为了静态而静态。
伪静态
伪静态是相对真实静态来讲的,通常我们为了增强搜索引擎的友好面,都将文章内容生成静态页面,但是有的朋友为了实时的显示一些信息。或者还想运用动态脚本解决一些问题。不能用静态的方式来展示网站内容。但是这就损失了对搜索引擎的友好面。怎么样在两者之间找个中间方法呢,这就产生了伪静态技术。就是展示出来的是以html一类的静态页面形式,但其实是用ASP一类的动态脚本来处理的。
*在SEO方面,伪静态和静态页面的功能是相同的,但是伪静态本质上还是动态页面,所以消耗资源是和动态页面一样的,而且因为Rewrite服务器还需要消耗额外的资源。
八、数据分析
PV(访问量:Page View)
即页面浏览量或者点击量,用户每次对网站的访问均被记录1次。用户对同一页面的多次访问,访问量值累计。一个PV即电脑从网站下载一个页面的一次请求。当页面上的JS文件加载后,统计系统才会统计到这个页面的浏览行为,有如下情况需注意:1.用户多次打开同一页面,浏览量值累计。2.如果客户端已经有该缓冲的文档,甚至无论是不是真的有这个页面(比如Java生成的一些脚本功能),都可能记录为一个PV。但是如果利用网站后台日志进行分析,因为缓存页面可能直接显示而不经过服务器请求,那么不会记录为一个PV。
UV(独立访客:Unique Visitor)
访客数就是指一天之内到底有多少不同的用户访问了你的网站。访客数主要是以cookie为依据来进行判断的,而每台电脑的cookie也是不一样的。有些情况下IP数会大于真实的访客数。比如一个ADSL拨号用户,可能一天中在三个不同的时段拨号上网并访问了这个网站,那么网站获得的IP数是3,但是真实的访客数只是1。有时候访客数也会大于IP数,因为像公司、网吧这样的地方,往往都是多个用户共用一个IP。比如公司里的某个员工看到了一个非常优惠的团购信息,然后通过QQ群发给了公司内的所有同事,假设有50个人打开了这个团购页面,那么这个团购网站就获得了50个真实的用户,但是IP只有一个。通过上面的两个例子,我们能了解到访客数要比IP数更能真实准确地反映用户数量。
IP(网络之间互连的协议:Internet Protocol)
IP可以理解为独立IP的访问用户,指1天内使用不同IP地址的用户访问网站的数量,同一IP无论访问了几个页面,独立IP数均为1。但是假如说两台机器访问而使用的是同一个IP,那么只能算是一个IP的访问。
新独立访客(New Unique Visitor)
字面意思,新独立访客就是首次访问网站的独立访客,同样以cookie为依据来进行判断。用新独立访客/独立访客比率判断网站是否符合规划好的增长引擎,新用户的涌入及老用户的粘性。
访问次数(Visit)
访问次数是指访客完整打开了网站页面进行访问的次数。如果访问次数明显少于访客数,就说明很多用户在没有完全打开网页时就将网页关闭了。如果一个访客30分钟内没有新开或刷新页面,或者直接关闭了浏览器,到他下一次访问网站时,就记为一次新的访问。如果网站的用户黏性足够好,同一用户一天中多次登录网站,那么访问次数就会大于访客数。
人均浏览页数
平均每个独立访客产生的PV。人均浏览页数=浏览次数/独立访客。体现网站对访客的吸引程度。一般情况下,资讯栏目肯定比企业战士栏目输出的PV要多。所以分析该指标时,一定要追踪到不同的子栏目,找到峰值。
平均访问深度
平均每次访问(会话)产生的PV。平均访问深度=浏览次数/访问次数。体现网站对访客的吸引程度。
*访问页数是指访客在一次访问中浏览您的网站内页面的总数,如果对同一页面浏览了多次,访问页数也计多次,访问页数反映了访客对您的网站的总体关注度;访问深度是指访客在一次访问中浏览了您网站内不同页面的数量,反映了访客对您的网站各个页面的关注程度;
通常,可以建议您将这两个指标结合起来看,如果访问页数高,但访问深度低,说明访客集中关注您的网站上的少数页面;如果访问页数低,但访问深度高,说明访客关注点较分散。建议结合受访页面报告及页面上下游报告,定位访客行为具体原因,从而有针对性地优化网站质量。
平均访问时长
平均访问时长是用户访问网站的平均停留时间。平均访问时长=总访问时长/访问次数。如果用户不喜欢网站的内容,可能稍微看一眼就关闭网页了,那么平均访问时长就很短;如果用户对网站的内容很感兴趣,一连看了很多内容,或者在网站停留了很长时间,平均访问时长就很长。
跳出率(Bounce Rate)
也被称为“蹦失率”,表示仅浏览了1个页面就离开网站的访问(会话)次数占总访问次数的比率。跳出率=跳出次数/访问次数。跳出率是反映网站流量质量的重要指标,跳出率越低说明流量质量越好,用户对网站的内容越感兴趣,网站的营销功能越强,这些用户越可能是网站的有效用户、忠实用户。
对于单页营销的网站来说,跳出率只能是100%,因为用户只有一个页面可以访问,所以单页营销网站不必考虑这个指标。在百度搜索推广中跳出率和平均访问时长可以反映出推广关键词的选择是否精准,创意的撰写是否优秀,着陆页的设计是否符合用户体验。
*淘宝中有一个“跳失率”的概念,通俗的说就是从你的页面跳转到到其他店铺的页面,说明你的产品没另一家的好。而你店铺的A宝贝跳到B宝贝不算跳失率。注意区分。
退出率(Exit Rate)
退出率=该页退出的的页面访问数/进入该页的页面访问数=退出PV/进入PV。
*例如,10个visits来到a页面——5个visits直接离开,3个visits去b页面(2个visits去c页面然后直接离开)。 b页面的3个visits有2个visits返还a页面最终从a页面离开。则计算a页面的于Bounce Rate和Exit Rate 分别就是(5/10) *100% 和 (5+2/10+2 )*100%
*http://www.chinaz.com/web/2011/0613/188006.shtml
二跳率
当用户从外部链接到达网站时,被称为第一次跳转,如果用户再点击某一链接或按钮从而进入网站深层页面,则被称为“二跳”,外部来的用户中进行了二跳的用户的比例被称为“二跳率”。例如,100人进入网站,85人浏览了更多页面,则“二跳率”为85%。
*跳出率越低越好,二跳率越低越好。不明白相互关系的可以参看:http://www.tui18.com/a/200911/176305.shtml
站内来源(CNZZ)
“站内来源”指的是某访客某次浏览您的网站后,持续30分钟都没有后续访问;如果该访客于30分钟后某时刻,在超时页面上点击某链接对该站继续访问,则称该访客第二次访问开始。由于该次访问来源于站内某页面,因此在【来源分析-来源分类】中,归为“站内来源”。
搜索词
指用户在搜索引擎中搜索的关键词,通过这些关键词到达了你的网站。
热点图
热点图功能记录页面访客的鼠标点击行为,通过颜色区分不同区域点击热度。从热点图的点击轨迹看用户首先点击哪块区域,这点很重要。这些地方可以放置一些对用户有价值的内容供用户阅读,可以更好的控制跳出率。
转化目标
转化目标,也叫做转化目标页面或目标页面,指商户希望访客在网站上完成的任务,如注册、下订单、付款等所需访问的页面。
转化路径
转化路径报告提供了访客在目标的各个步骤上的访问行为数据。假如设定“一次咨询”即为转化目标,其目标路径为首页→关于我们→点击咨询按钮为一次转化路径,那么当网站访问用户照此路径操作后,网站后台统计该转化路径次数加一。
页面转化
页面类型的转化是指访客访问了您期望他浏览的页面,如注册提交后出现的“注册成功”页面,您可以将到“注册成功”的网址输入到页面转化设置中,百度统计能够为您统计“注册成功”的注册量。
事件转化
事件是网页内部某个可以点击的交互元素,下载、移动广告点击、小工具、Flash 元素、AJAX 嵌入式元素以及视频播放等这些都是事件,百度统计可以对其进行跟踪。事件转化可以帮助您了解您网站上的用户操作情况,如某个按钮的点击次数、某个表单的提交次数或文档的下载次数。您可以在转化设置中,定义您需要跟踪的事件目标,将其作为转化来统计。
转化率
转化率指在一个统计周期内,完成转化行为的次数占推广信息总点击次数的比率。计算公式为:转化率=(转化次数/点击量)×100%。例如:10名用户看到某个搜索推广的结果,其中5名用户点击了某一推广结果并被跳转到目标URL上,之后,其中2名用户有了后续转化的行为。那么,这条推广结果的转化率就是 (2/5)×100%=40%。
抵达率
访问某网站的抵达率=访问次数/点击次数。抵达率过低,则说明较多点击未能抵达网站,需要查看网站url是否正常打开,速度是否够快。
页面流失率
流失率指对指定路径对应的步骤而言,访客从该步骤进入到下一条步骤的过程中流失的比例。计算公式为:本步骤的流失率=[(本步骤的进入次数-下一步骤的进入次数)/本步骤的进入次数]×100%
用户流失率
用户流失率是按照不同时间段来定义用户的,比如一日用户流失率、一周用户流失率、一月用户流失率等。综上,一周用户流失率=一周内没登录的用户数/一周总注册用户数。
*http://t.cn/RcbC0DG(网站流量统计名词解释)*
九、其他
Bad Case
Bad Case直译过来就是坏案例,百度站长平台已经开启征集专区,如果遇到体验很不好的搜索结果可以提交审核,但是解决时间就不知道啦。
*http://bbs.zhanzhang.baidu.com/thread-13525-1-1.html
新闻源
新闻源是指符合百度、谷歌等搜索引擎种子新闻站的标准,站内信息第一时间被搜索引擎优先收录,且被网络媒体转载成为网络海量新闻的源头媒体。新闻源在网络领域内地位举足轻重,具有公信力与权威性,也是辐射传播至国内媒体网络的原点。
自适应网页设计(Adaptive Web Design)
自适应网页设计指能使网页自适应显示在不同大小终端设备上新网页设计方式及技术。
工具条(Toolbar)
安装在浏览器上的插件,提供一些搜索引擎或其他附加功能。用户可以在工具条上的搜索框内输入关键词直接搜索,而不必访问搜索引擎网站。几乎所有搜索引擎都开发了工具条供用户下载使用。
Unicode
Unicode(统一码、万国码、单一码)是计算机科学领域里的一项业界标准,包括字符集、编码方案等。
*目前百度对unicode编码只支持utf-8。
百度十一位
百度排名11位是指你的站点中流量不错的主要关键词(有些流量的,排名前几位的)百度排名从首页或第一位被固定在第二页的第一位(即第11位),且不止一个词,存在多个关键词同时掉到11位,期间无论是百度更新还是其他的站排名上升下降,关键字排名总是第11位或者之后(在11位-13位之间变化)。
*http://www.mahaixiang.cn/seoyjy/911.html
电子邮件营销(EDM:Email Direct Marketing)
利用电子邮件与受众客户进行商业交流的一种直销方式。
横幅广告(Banner)
广义上是图片或者动画展示类广告的统称。这个词的含义源于上街游行队伍中拉着写有标语的大横幅,后来扩展到互联网广告商。
*本文资料参考来源
百度搜索:
微信搜索:
金花站长工具:
百度站长学院:
艾奇学院:http://www.27sem.com/
搜外问答:
ITSEO:
CNZZ数据专家:
百度统计:
百度站长:
网站分析在中国:
《SEO实战密码》 作者:Zac
Google搜索质量评估指南2016
百度搜索引擎网页质量白皮书
百度搜索引擎优化指南2.0返回搜狐,查看更多
责任编辑: