从SEO看人工智能在搜索算法中的应用、未来学什么更有用武之

发布日期:2017-11-07 浏览:582 次


 如果你还不知道什么是人工智能时代、那你真的就OUT了。从SEO看人工智能在搜索算法中的应用、未来学什么更有用武之地?现在我们还在做传统的IT计算机领域的事情、虽然网站建设行业已经够枯燥的了,但是科派在软件领域也在不断的前行。
 
  2016 年以来,IT行业的技术突破应该是人工智能了,不仅在一年左右时间,在一个人类曾经自以为机器很难战胜人类的游戏项目上完胜人类,前几天更是出现了逆天的AlphaGo Zero,完全不用借鉴人类知识,自学 3 天就超越了人类。
 
  人工智能领域最牛X的公司,国外是Google,国内是百度。都是搜索引擎。这恐怕也不是什么巧合,而是因为搜索引擎是最适合开发人工智能的公司,他们拥有量的数据,包括文字、图片、视频,还有地图、路况、用户使用数据等等。
 
  搜索引擎公司的AI成果在多大程度上运用到了他们的核心业务-搜索中?他们都没有明确地对外说明,从搜索工程师的零碎发言中猜测,至少目前还没有大规模使用,并没有改变搜索算法的基础。毕竟人工智能虽然概念存在了几十年,但效果突飞猛进只是近几年的事,还没有出现通用人工智能,在围棋这种规则简单明确的领域中牛X,迁移到规则模糊的系统中,比如搜索,还需要一些时间。
 
  但我想,人工智能大规模应用于搜索算法是早晚的事。据说以前百度大搜索部门和人工智能/深度学习部门之间是有些矛盾的,现在吴恩达离开了百度,陆奇对百度又进行了很多人事调整,搜索部门对人工智能的排斥也许就大大降低了。
 
  其实人工智能已经在搜索算法中有所运用。举两个例子。
 
  前几个月看到了百度朱凯华的一篇《AI赋能的搜索和对话交互》演讲报道。数年前和朱凯华还做过一次访谈,那时候他还是Google的主任架构师,是的熊猫算法的主要参与者之一,现在他是百度的首席架构师了。演讲内容很多,感兴趣的搜索标题就能找到全文,很值得深入读一下。这么长时间SEO行业很少人注意到这篇这么有价值的关于搜索算法的公开信息,还是挺意外的。
 
  演讲里提到了百度 2013 年上线的DNN模型,极大提高了语义相关性的判断范围和准确性, 2013 年百度相关性提高的34%来自于DNN模型, 2014 年全年相关性提升的25%来自DNN模型。DNN模型使用的就是深度学习方法,通过 100 亿的用户点击数据训练模型,有超过 1 亿个参数。下面介绍的Google RankBrain是 2015 年上线的,所以百度是世界上个将人工智能应用到实际搜索算法中的公司。
   
  简单说,就是对同一个查询词,模型分析了真实用户点击了的页面的标题,和没有点击的页面标题,从而更深入理解哪些标题是满足了用户需求的。经常出现的情况是,页面标题并不包含查询词,用户却更愿意点击这些页面,说明这些页面满足了用户需求,这些页面的标题,即使不包含查询词,也是与查询词语义相关的。这是经典的页面-关键词相关性算法无法计算出来的。
 
  演讲中提到的例子:
 
  在DNN上线之前,用户搜索ghibli车头任何放置车牌时,由于相关信息很少,没有什么页面是以这个查询词为标题或者页面出现这些关键词的,所以搜索结果质量不高,传统搜索算法只能按关键词匹配返回一些ghibli相关信息,却没几乎有车头任何放置车牌的信息。
 
  DNN上线之后的搜索结果是这样的:
   
  可以看到,搜索结果中还是没有以ghibli车头任何放置车牌为标题的页面,但解决了用户的需要,算法理解了前前面和车头是一个意思,放哪里啊怎么装咋挂和;任何放置是一个意思,所以ghibli车牌咋挂这种页面回答了ghibli车头任何放置车牌这个查询,虽然他们包含的关键词是不一样的。
 
  这种对相关性的理解不是传统以关键词匹配为基础的搜索算法能算出来的,而是真实用户的点击数据告诉搜索算法的。用户搜索ghibli车头任何放置车牌时,经常点击ghibli车牌咋挂ghibli前面车牌照怎么装这些页面,DNN模型被训练后知道,这些词之间是语义相关的。
 
  Google RankBrain
 
  2015 年上线的Google RankBrain解决的也是对查询词的深入理解问题,尤其是比较长尾的词,找到与用户查询词不完全匹配、但其实很好回答了用户查询的那些页面。和百度DNN是非常类似的。Google没有具体说明RankBrain的训练方法,估计和百度DNN也是类似的。
 
  2015 年RankBrain上线时,15%的查询词经过RankBrain处理, 2016 年所有查询词都要结果RankBrain处理。
 
  Google自己经常举的RankBrain例子是这个查询:
 
  Whats the title of the consumer at the highest level of a food chain
 
  这个查询词相当长尾,完全匹配的结果比较少,而且查询中的几个词容易有歧义,比如consumer通常是消费者的意思,food chain也可以理解为餐饮连锁,但这个完整的查询和商场、消费者、饭馆之类的意思没有任何关系,RankBrain能理解其实用户问的是食物链顶端的物种是什么名字。同样,搜索结果不能按照传统的关键词匹配来处理。
 
  这种长尾查询数量很大,每天Google收到的查询里有15%是以前都没出现过的。这种查询要靠关键词匹配就比较难以找到高质量页面,数量太少,甚至没有,但理解了查询的语义和意图,就能找到满足用户需求的、关键词并不完全匹配的页面。
 
  对SEO的影响以后再详细写,这里只是先简单提示一下:页面要包含关键词,这在目前的关键词优化过程中是必然的,现在搜索引擎能理解两句不同的话意思是一样的了,以后创作或编辑页面内容时,是不是还一定要包含关键词呢?

相关推荐

网站制作推广优化提高手机移动端网站搜索排名

使用手机搜索网站的人越来越多了,2019年之后做网站科派还是建议您考虑一下PC和手机兼容性。让用户可以在不同的设备和浏览器进...

网站排名不是靠收录量(真正的质量才是王道)

营口网站优化文章 - 新网站的弯路尽量少走一些、你就能很快获得网站排名和盈利。 老站长都是从一个SEO小白走过来的,其中的艰...

不花一分钱的网站推广办法关键词互点要注意什么规律?

网站关键词互点,是人为提升用户体验度的方法,这个方法也有黑帽的优化手法在里面,因为IP ,PV 都不自然得来的,而是人为点...

汇聚营口网站推广效率犀利的微博VS微信观提升网站用户体验度?

在微博上无意中看到一个微博和微信的本质区别的博文,言辞相当犀利,就转来分享给大家,商业植入无处不在,当你一天天离不开,你...

企业网站内容建设:准备什么样的资料用户才会喜欢?

请站在用户角度来看自己的网站,用户如果有一天进到你的网站,他们来做什么? 需要什么? 你的网站能给用户最有价值的内容,你的...

营口SEO优化新视角、做网站怎能不考虑网站排名呢?

提高网站人气和流量最有效的办法就是把自己的网站排名优化上去,不论任何网站都是需要有搜索排名的,不然很难找到你做的网站,你...

营口SEO谈未来10年来AI技术对优化会?

关键词的设置应该遵循小至大,就好比吃苹果肯定是先吃靠近嘴的一边。在营口还没有单纯的SEO服务公司,但是科派做SEO很多年...

是写原创文章,做外链guocheng中你有用过论坛的签名来做吗?

从一个月前开始学习SEO到现在的有一个多月的时间了。我几乎做的做的工作就是写原创文章,做外链。原创文章今天就不和大家聊了...

添加客服微信
添加客服微信
关注公众号
关注公众号
2014-2024 www.ykkp.net 营口科派软件有限公司 版权所有
QQ客服:401403 | 辽ICP备15004956号-11 TAG关键词 | 站点地图