不忘初心,习近平接连部署这些工作
3231 2019-05-31
网易科技讯 6月22日消息,在近日戛纳国际创意节特设的“中国日”论坛上,搜狐董事局主席兼CEO张朝阳发表了45分钟英文演讲——Transforming Online Media and Entertainment in a Big Data Era(大数据时代的互联网媒体和娱乐产业演进),阐述了构成中国互联网的三条脉络:信息1 to N、N to N、内容形态的变迁,以及搜狐如何推进机器学习、VR技术的应用与发展。
张朝阳认为,人类高频社交时代正在到来,同时广告商的黄金时代即将来临。搜狐将在广告服务器中使用新技术,广告服务器能够计算用户正在阅读什么样的文章或新闻,及他感兴趣的类似主题内容,从而在广告投放计算中加入新维度的参数,使其投放更精准。
以下为张朝阳本次演讲全文翻译:
大家下午好,先自我介绍一下,我是搜狐的创始人兼CEO。
搜狐,作为中国最早的互联网公司,几乎是中国最早建立门户网站、拥有网络服务器并在IDC做托管的互联网公司。我认识到建立导航网站的重要性,所以开始着手建立分类目录导航。我在读了美国某年轻创业家的相关书籍后,深受启发,前往美国,与对方深度探讨并达成了合资和并购的协议,这就是搜狐成为中国最早的互联网公司的过程。
目前,搜狐拥有四大业务线,其一是搜狐媒体平台,搜狐是PC时代三大门户网站之一,旗下涉猎搜狐新闻客户端,PC新闻网页端等多项互联网产品。与此同时,搜狐在视频行业也有资深的积累,我们分别在2009年和2013年,成功打下关于视频版权的两场硬仗,这为中国视频行业奠定了基础,在这样稳健的框架基础上,视频领域现在几乎没有盗版。
搜狐还拥有搜索引擎搜狗。搜狗搜索是继百度之后中国第二大搜索引擎,绝大部分中国用户还使用了我们的中文拼音软件搜狗输入法。搜狐的第四项业务是游戏,搜狐早在PC时代,就成为游戏领域排名前三的网页游戏供应商,在向手游转型的过程中,我们同样得到了用户的良好反馈。
上面说的这些都是搜狐集团的介绍,但今天在这里,我想回顾一下中国互联网的历史。中国互联网的发展轨迹与美国类似却具有中国特色。简单回顾中国的互联网可以沿着三条脉络去追踪,第一个是信息1对N,第二个是N对N,第三个是内容形式,基本上构成搜狐的内容业务架构,最后,我还会讲到广告,这是我会讲到的第四点。
首先,互联网在中国的兴起与美国相似,都是1对N,这意味着一个消息来源、N个信息受众。搜狐最早开始建立网站导航索引,付出的代价是很大的。后来我们发现了内容的重要性,所以搜狐开启了门户网站原创内容的大门。由此,搜狐与新浪、网易一并成为中国三大门户网站。
作为关键词搜索引擎的百度,凭借其利用移动互联网的性质和移动手机的普及,通过将信息与移动端相结合的方式,后来居上,紧跟在三大门户网站之后。在PC时代,用户信息可以在短短几周之内被追踪并收集,但是在人们长期使用相同浏览器的情况下,门户网站并没有长期积累用户信息、收集用户画像的方法,但是时代在变迁,随着移动互联网的发展,移动终端成为了人们时刻携带的必要工具,人们日常生活的点点滴滴给予了足够的用户配置文件信息。而如今,机器深度学习配合电脑cpu和gpu强大的计算能力,我们可以利用电脑技术,从多个维度上匹配广告商与用户。
以上是过去中国互联网公司在PC时代如何利用用户资料为网站导航、门户、搜索提供信息。而当下,随着人工智能、机器深度学习能力逐渐成熟,在图像和视频制作上的应用也更为直高效。信息传递的战争愈演愈烈,而这一切,都被浓缩在我们手机小小的屏幕里的APP信息流里。
接下来,我们来谈谈交互行为和社交网络。其实1对N这种形式,已经存在多年,比如报纸和电视。而互联网的独特之处则在于其N对N的模式,即N个源头N个受众。最早期的网络社交起源于网上论坛,俗称BBS,我不知道你们当中是否还有人记得,后来论坛逐渐演变成为了个人主页,随之进一步升级成为了博客,从BBS到博客,在BBS时代,每个访客或用户都在留言板里被划分为不同的话题框,最极端的例子莫过于百度贴吧,不过,这依然是一个旧版本的留言板。在早期,搜狐也有类似的留言板服务,但从论坛到博客,互联网行业实现了质的飞跃,因为个人的理念变得越来越重要,一时间,用户信息画像的捕捉成为了互联网的中心现象。
从2005年开始的博客,到Twitter和Facebook。你知道,博客不仅仅是一个页面,因为你的访客看到你的博客,并且使用你的博客,如果有人想要浏览你的博客,他们就会来到你的页面。但从留言板到博客,个人主页出现了,网友不再是一个笼统的概念,个体的影响力初见端倪。而从博客到Twitter和Facebook,个人主页被分成了两个页面。一页是你的个人资料,另一页是你的工作状态,你可以关注其他人。就算不去任何地方,人们也可以浏览到所有朋友的状态以及他们正在做的事情。
这真的是一场革命,如果一个人想要访问别人的博客,他需要主观做出决定并主动去搜索想要访问的博客页面。但要是通过社交软件点击关注一个人之后,人们就不需要有任何特定的意识行为,只需要坐着接收信息,而这,就是创新,就是革命。现在人们可以通过软件社交,建立长久稳定甚至永久的人际关系。经研究表明,地球上有70亿人,任何两个人都可以通过“六层关系”找到对方,人与人之间的距离被拉近,遍布全球人际关系也不再遥不可及。
中国版的博客,叫做微博,当然,微信也符合个人迷你博客的性质,连接了千千万万的用户。一夜之间,社交媒体以其空前的高效在中国炸开了锅。想想电子邮件和短信,微博则是升级加强版的通讯工具,在有N个受众的情况下,量变带来质变,比如,如果你发了一条微博,有人跟你转发了,又有别人跟着你的粉丝转发了,它就像一个原子弹,导致了一系列的裂变和组合。从数学角度考虑,这种自动爆炸传播效果会带来多少种新的交互方式的可能,又会给人们带来多少交流的机会?
第三条发展脉络是内容的形式,从开始的图片到现在的视频,再到实时的直播。现在很多的中国人都在进行直播,尤其是那些一直在直播的年轻女孩们,粉丝会在网上给她们支付小费。
现如今,移动手机依靠其强大计算能力,将这一切新生内容聚集到自身。实际上,手机本身不仅限于接收和消耗视频/内容信息,它更是内容的贡献者,而且很方便。现在已经没有人使用相机了,你的手机就是相机。你甚至可以拍下一段视频,然后把它传到你的社交网络上。因此,内容的生产、传递和消费也变得相对容易。这就是是第三条发展线,互联网前20年的发展和积累,为现在的我们创造了的更多机会,在如今的移动互联网时代,每个人都可以用手机做各种各样的事情。
关于机器学习方面,如何掌握用户的资料和行为,并进行精准的匹配推送成为时下最热门的话题。当你用你使用应用程序在线上做各种各样的活动时,购物、阅读、冲浪,这一切的行为模式和数据都在被记录,都可以随时被提取。你的用户画像随着你的线上行为逐渐丰满,而搜索引擎通过自动学习,对用户动向日渐敏感。比方说,每当用户访问一个网站时,他可能带来1000个参数甚至10000个参数的大数据的坐标,比如你是谁,你住在哪里,你在网上买了什么产品,或者你在阅读什么新闻。机器根据这些参数,会在成千上万的文章中,为你精准推送,因为机器能够比人脑更好地理解内容。过往的互联网过分依赖于关键词进行分类,军事、国际、八卦,或者关于其他东西的,以最单一的维度对文章进行分类,但是现在机器可以做到前所未有的精算分析,这篇文章对于该用户是太简单还是太复杂,文章的视角是激进还是保守,机器都可以通过智能的方式分类总结这些文章并推送给相对应的读者用户。
接下来我们可以谈谈声音和视频的内容展现,比如你有一个很多帧组成的视频,时长约在1-5分钟,每帧都有一些人出现,通过人脸识别、颜色等等因素,机器会总结这段视频的内容及含义。打个简单比方,你可能是某位名人的粉丝,所以你很有可能会在社交媒体平台上发布有你偶像的视频片段。由搜狐人工开发声调识别和图像鉴别功能将视频转化为文本,接下来的工作就由机器全权操作,现在的智能机器非常强大,你只需要把整个参数放进一个大锅里,让这个大锅自然煮沸,你就可以获得最想要的最优匹配。
在1对N的模式下,人们的信息来源主要有两种:社交媒体和新闻APP。这两种不同形式的信息服务方式相互竞争,争抢用户资源。你可以选择留在你的社交网络平台上,等待别人来分享文章和资讯,也可以不停地刷新在你的Facebook和选择你想要关注的公共主页,让人群过滤内容最后呈现给你, 或者你可以选择使用新闻APP,让机器为你选择你下拉的内容。在这两种信息源的形式中,人们要么选择留在社交网络中,要么选择使用新闻APP。 如果你让我说,从2005-2007年Facebook的发展趋势来看,似乎社交网络正在胜出,我只想到我的社交网络,我不关心任何新闻出口。人性本是如此,人总是对其他人充满着好奇与沟通的欲望,人们互相传达信息与故事,建立信任和感情,但是与此同时人们是被动地获得信息。但是现在有了这些APPs和机器学习能力,阅读可以变得如此有趣,与你的生活息息相关,因为机器会给你所有的内容。你可能会把时间均分在在新闻应用和社交网络上。我知道你有很多事情要做,看视频等等,而如今所有的互联网资源都集中到了你手中手机的小小屏幕上。
关于广告呢?广告商的黄金时代即将来临。早期广告是出现在报纸或者大横幅上,任何用户都会得到广告信息,然而他们不可能全是你的目标用户。搜索引擎的到来,让锁定目标用户变得更加简单和理想化,因为当广告商明确了目标用户,并且可以通过目标用户输入的关键词立刻得到他们的关注时,广告商会知道该搜索者此时此刻对其输入的关键词一定有兴趣。根据这个目的可以计算出,搜索引擎了解文章或者论文甚至任何信息,这就是为什么一些小的媒体公司会花钱去购买一些关键字。这也是为什么搜索引擎如谷歌,在2005-2006年中能够谋得巨大的利润。这就是为什么情景目标锁定,一直比关键词目标锁定低效的原因,让我们来比较一下Google的两个项目: AD Word和AbSense。 AD Word要比AbSense高效有用得多,而这正是因为AbSense太过依赖于情景设定,浪费太多时间在揣摩用户的心理上,而AD Word简单直接,只关注用户搜索的关键词,所以关键词才是信息来源之动脉。随着移动apps的应用,用户的信息配置也越发丰富。你也许不能确切的知道此时的用户正在思考什么,但是根据你所拥有用户大量的历史搜索记录,你也可以对用户的需求提供恰当的匹配。如果你有个搜索app,用户搜索关键字的同时,搜索引擎也在了解用户想要了解的信息,因为做同一个关键词的搜索,不同的人可能会想要搜到不同的东西,因此,我们需要有另一个维度来进一步明确目标,提供给用户真正想要的信息,并为他们提供最适合的广告。
每当用户使用搜狐新闻APP,我们的推荐引擎将决定给他提供什么内容。而我们的广告机器人也会通过计算,从数以万计的广告客户中选择最符合用户所浏览新闻的广告,从而提高点击率与品牌曝光率。为广告商和客户提供精准定位为搜狐首创。从前只有搜索引擎才能享受这样的竞价过程。可是通过手机app、机器学习、计算等一切技术手段,你不用考虑情景型新闻,你只需要关心这个用户是谁。他可以随心所欲,点开和他完全无关的内容,但是因为你了解这个人的搜索记录,你就能选出合适的广告客户。我们将在广告服务器中使用这项新技术,广告服务器能够计算用户正在阅读什么样的文章或新闻,及他感兴趣的类似主题内容,从而在广告投放计算中加入新维度的参数,使其投放更精准。
广告客户的春天来了!尤其是在中国,无论经济状况好坏,中国始终是第一人口大国,拥有最多的小型媒体。我们有这么多的城镇,每个城市都有很多小型流行商店和英语学校,各种培训机构和各种花卉商店,人们要生活对吗?中国有14亿人,有数以万计的小企业。他们没法花一百万做广告,每个月他们在这上面只能花一点点钱。比方说,如果你在成都有一所英语学校,在搜狐做广告时你并不指望让北京及其他地方的用户到你学校。你只想针对自己所在的地区,提高本地服务的可能性。而我们掌握用户的定位信息及什么样的用户最有可能喜欢英语。这样一来小型英语培训机构,就可以花非常少的钱却找到该地区周围最精准的客户群。
中国有数以百万计的中小企业,而这技术对于这类企业的拓展非常重要。我们提供最好的技术服务、视频、新闻等等,所以我们拥有最大的用户群和最好的机器学习能力,为广告客户服务,为之匹配用户。而这项业务可以衍生出巨大的商业回报。
这就是中国互联网行业的现状,与美国情况相类似。对于搜狐而言,我们有自己的新闻APP并在其中建立了我们自己的社交网络,我们同时在做这两件事,因为我们认为上网获取信息进行阅读和学习;了解朋友在做什么并互发感兴趣的内容是用户上网的两种最为主要的方式。在未来,社交网络通过视频和直播的方式构建。如果讨论2005年的社交网络,你关注的仅仅是PC端上的信息。而在2017年,你不仅通过手机你甚至通过穿戴设备看视频,看直播等富媒体。从中我们可以发现一条重要的时间轴。我刚谈到从博客到微博的发展是两页,一页是你自己的个人主页,另一页则是时间轴,即你的工作页面。你所关注的朋友都在直播他们的烹饪,跑步,游泳。你在开车时只要通过声控说声“朋友们好”,你们朋友们都会通过直播方式出现!
这就像一个24小时不间断的大派对,不管你在哪里,我在这里,我们已经在戛纳,而我的朋友在中国,只有时区不同。首先是网络,然后是时间轴,不仅是推送或标签,还包括直播,人机智能语音交流,机器精准理解我们所说的内容。我们会有一个盛大的派对,无论你在哪里,这将是一个联系紧密且高频的社交网络。从2005年Facebook和twitter先后出现,到12年后的今天,还有更多值得我们去探索。