腾讯toB,穿越风暴的十年

新莓daybreak 2020-11-11 23:10:05

撰文|翟文婷

“云服务收入”这几个字第一次出现在腾讯集团的财报,腾讯云团队形容那种感觉是,“几年默默无闻,快毕业的时候女神终于看了你一眼,并且叫出了你的名字。”

这是个信息量很大的比喻,背后的故事像松散的电线在黑暗中嗡嗡作响,火花四溅。一言难尽的部分,总能引起人们更大的兴趣。

今年是腾讯云整十年。对它的描述可以是,全球云厂商排名第五,年收入超数百亿,服务超百万付费客户,腾讯to B战略的核心抓手。

但2018年930变革之前,腾讯云对外的轮廓并不清晰。至于团队成员,他们知道自己从哪里来,却不知道要到哪里去。

腾讯云总裁邱跃鹏告诉「新芒daybreak」,“如果回到十年前重新看云业务,无论是我们,其他云厂商,还是客户,云给自己带来的价值和我们能输出怎样的价值,都存在未知和不确定性。”

他带领的团队,曾在巨大的不确定中行走着,就这么一直走到现在。支持他们走过艰难岁月的动力是什么,很多人也说不出口。总觉得云有很多事情要做,还有些人是从工程师的角度,单纯觉得这事能成,那去做就是了。

腾讯930变革两周年、腾讯云十周年之际,我们采访了邱跃鹏和腾讯云团队的几位早期核心成员,还有TEG支持云业务的负责人,请他们讲述腾讯云命运关键时刻的核心事件。

他们中有人负责腾讯云这列火车的动力,有人的使命是铺设铁轨,还有人保证火车不脱轨。他们讲述的往事很多是首次对外披露,而那些最困难的事情往往最容易被轻描淡写地说出。

01

错失国际大客户

2015年,一个国际大公司的云服务打算落户中国。寻找潜在合作对象时,他们找到腾讯云。

假如这笔单子成功拿下,他们所需要的存储量将超过当时腾讯集团的全部用量。这个订单太诱人,也是提升腾讯云的名誉和声量的绝佳机会。

为这笔大单,腾讯云团队不遗余力,就差把家底掏空。

几次沟通下来,客户反馈很积极。腾讯云泛互联网行业产品方案总经理黄炳琪和团队每次介绍完腾讯云的情况,对方都喜笑颜开地回应:Perfect!Awesome!

虽然还没有签约,但甲方如此满意,是时候拿出乙方精神了。于是腾讯提前在多个地方新建了一批机房资源。毕竟这个客户胃口太大,现在的储备不足以应对。

一切进展顺利。2015年底,潜在大客户的技术团队远赴重洋,亲临中国现场考察。这是决定胜负的关键时刻。

然而,腾讯自建的示范机房在天津,受到当年8月滨海大爆炸的波及,机房外围设施已面目全非,墙皮接二连三地脱落。庆幸的是,机房内部完好无损。

腾讯紧急采取补救措施。重新粉刷外墙,尽最大程度修补破损的地方。短期内无法复原的地方,影响美观,只好放一盆绿植代替。一群写代码的工程师,撸起袖子当起维修工人。

黄炳琪带队在天津接待了贵宾。这场会面至关重要,相当于腾讯要做一场技术答辩。专业问题难不倒腾讯,他们准备充分。唯一的瑕疵在于,当时腾讯云没有国际化团队,技术人员英文还不过关。

那天会面的屋子很宽敞,甚至显得有些空荡。客户坐一排,腾讯的人跟他们对称,对方发问,腾讯的工程师接招。中英文切换,信息损耗太大。没办法,既懂技术又会英文的汤道生现场充当起翻译。

回想起那一幕,黄炳琪至今觉得一股心酸,“我们就是一帮草台班子。”

已经走到这一步,汤道生本应该是临门一脚射球的那个人,那种情况下,他却还在详细解释各种细节问题,包括商务层面的疑问。团队的人私下嘀咕,这好像不应该是大老板做的事。

幸而结果是乐观的,产品测试也顺利通过,团队做好准备,只等着切量。等待尘埃落定的那一刻。

结果是,因为一些非商业因素,最后这家国际大公司最终没有选择腾讯。

但此前过于乐观的反馈,导致团队做出误判。还没正式签订合约,他们就投入重金新建机房资源,更是错误的决定。

这件事情发生四年后的2019年,腾讯云在全球市场份额已经排名第五,不再是之前一穷二白的境地。在全球TOP5云计算厂商中,腾讯云增速最快。这一年,腾讯云全年收入超过170亿元,付费客户数突破100万。

这两个特殊意义的双百数字,腾讯云的团队都会记得。但他们对这个翻车事件记忆更为深刻,每个细节似乎都刻在脑海。不光是因为踩坑,还有为此付出的代价。

如果一定要问腾讯云走到今天最重要的一个原因,黄炳琪想说,“平台容忍我们犯错。犯错后,不断迭代,不放弃努力,我们还能够获得乐观的结果。”

02

曾经设想过很多种“死法”

930变革后,CSIG是集团内部活水净流入最多的事业群,尤其很多人争相加入腾讯云。

几年前是另外一幅景象。有一次总监会上,邱跃鹏听到最多的诉苦是,有Headcount,但招不来人。别人听说你是做腾讯云的,笑笑走开。

那也是腾讯业务战略频繁变化的一个时期。战略投资搜狗,腾讯的搜搜业务交给对方,团队自然也跟了过去。战略投资京东,电商业务拍拍网也不再属于腾讯。曾经给予厚望的腾讯微博,也没了声量。

这跟腾讯云没什么关系,但偏隅SNG的角落,他们感受着集团的风云变化。搜索、电商、微博,曾经比云的战略意义更强,更受集团重视。这些浓眉大眼的项目,走着走着都倒下了。孱弱的腾讯云是否也难逃厄运?

当时他们设想了很多种死法,被裁撤、被卖掉。公司内部流传着很多段子,出去团建一趟,回来发现业务没了,所以轻易不要团建。虽然是一些玩笑话,但他们内心的忐忑是真实存在的,这个事情盘旋在脑子里,不定期出现。

对腾讯云团队来说,不怕客户抱怨,有问题改就是了。最怕的是,感觉不太好,但不知道如何改进。

腾讯云脱胎于腾讯开放平台时代,930变革之前与QQ团队隶属于SNG。从开放云到移动时代的公有云,失去过往的优势积累,腾讯一度很难找到自己的方向。

腾讯云副总裁答治茜从QQ转入云业务时,人不多,只有一层楼,都是以前SNG的老熟人。在制定KPI时,他们商量出一个结果,全年销售额达3.6亿元。

这个数字就写在黑板上,他们却没有行动指南。所有人围在一个屋子里,从早到晚脑暴,如何实现3.6亿。在当时这简直就是天文数字。

最后他们决定还是从比较熟悉的企业下手。乐元素等游戏公司,是腾讯公有云最早的一批客户。单子体量不大,有就是好事。答治茜每天不是在见客户,就是在去见客户的路上。最多的时候,一天在北京被安排了5个客户。

那时候第一次见客户,通常对方第一反应都是,腾讯还做云?腾讯为什么要做云?在展示产品和方案之前的半个小时内,他们一遍又一遍地重复自证,腾讯真的在做云。

大家热情充沛,往前冲,抢客户,行业归属不清晰。邱跃鹏经常断案,这个客户该放在哪个行业。后来,腾讯云进行了FT(feature team)制度改革,包产到户,行业梳理更明确,流程机制更完善。

游戏类公司对腾讯云后发优势起到很大作用。

在腾讯开放云阶段,主要服务的就是QQ空间平台的游戏公司。移动时代的公有云阶段,APP各自成孤岛,腾讯没有这样的开放平台,还是依靠原来的亲密关系,以及对游戏业务的深刻理解,捕获到最初的一批客户。

决定深挖CDN这座金矿让腾讯云站稳脚跟,后来成为腾讯云收入中一个非常重要的组成部分。

背后的原因是,直播和短视频风口兴起之后,腾讯云很敏感捕捉到这一需求,自下而上创新产品,基础是原来QQ音视频的架构,支持了很多公司的发展。CDN业务也顺势爆发。这才有了腾讯云后来的全面开花。

几大国际云厂商里,腾讯云连续多年都是增速最快的。根据Gartner报告,2019年,腾讯云全球市场份额超过IBM,在全球云厂商里排名第五。

在国内,腾讯云服务了国内最多的主流电商平台;服务了国内超过70%的游戏公司;在视频行业的渗透率超过90%。此外,在政务、金融、工业等领域,腾讯云都是云服务重要提供商。

邱跃鹏说,他们对云的理解,也经历了从基础设施虚拟化能力、企业IT设施重构到数字化助手的进化。现在,云服务如同我们熟悉的消费互联网,越来越容易被获取,就像随时随地打开的APP,可以灵活组装,像菜单式的工具箱。

现在腾讯云团队的烦恼不是招不来人,而是争相跟老板多要几个Headcount。选择权也被反转,用他们的话说,“即便是内部活水,必须严格筛选,业绩好的才能进来。”

03

腾讯云的队友

腾讯云从边缘到中心的全部过程,TEG都没错过。准确地说,他们是陪伴者,更是亲历者。

TEG负责底层技术,腾讯云将其产品化服务化,最终卖给客户。不论是在SNG,还是当下的CSIG,腾讯云都跟TEG紧密相关。

相当于TEG的支持对象有两个:腾讯集团的自研业务,以及海量的外部客户群。早期他们就是把腾讯自研的能力开放给外部客户。共用一套底层逻辑,TEG像马戏团里的艺术大师,需要时刻平衡跷跷板的两端。

道理很简单,TEG的首要使命是确保腾讯自研业务,如果外部客户正好可以复用这套能力,再好不过,但有时候两者并不能像想象中这么完美统一。

腾讯云刚开始做CDN业务,就遇到这个问题。短时间内补齐能力,势必要动全集团的盘子。TEG不敢冒进,势必要谨慎应对。

黄炳琪跟TEG的同事不断推演可能的路径。有天晚上,他们一起吃了个烧烤,喝了顿小酒,酒杯重重的撞在桌子上,TEG的运维同事提高音量,“我们一把就干了吧。”事后他们开玩笑,这个操作是“酒后运维”。

结果证明这个冒险值得。整个过程没出什么问题,客户满意,集团业务平稳过渡。黄炳琪直说,运气比较好。

感动之余,他决定重谢战友,买了120斤西瓜。扛不动,找同事一起运到TEG所在的朗科。想到办公区域没有开瓜工具,黄炳琪自带一把利刀送上门。

几个程序员小哥,肩扛西瓜,手拎菜刀,涌进写字楼。这种场面可不常见。瞬间引来不少吃瓜群众的围观。

这件往事,黄炳琪记得,谢明同样印象深刻。那时候,集团没有明确的政策指引或是命令驱动,全靠自发主动,互帮互助。

“酒后运维”有点类似游击队式打法和亮剑精神,可以克服局部困难,却不能打赢一场现代化战争。全面战役的胜利,需要正规部队的全套方案。

To B成为集团的核心战略业务之前,腾讯云蜗居SNG的偏僻角落时,不同的人所处角度不同,想法也千差万别,这种声音最后都到了TEG总裁卢山的耳朵里,他说,(对腾讯云)要往死里帮,各种争议和讨论戛然而止。930变革后,TEG成立云架构平台部,专门支持云业务。

腾讯云副总裁、云架构平台部负责人谢明坦诚,这个角色让他感受到的压力最大。

自研业务也让他们有抓耳挠腮的时候,救火的事件经常发生。但这种高压是短期行为,不是长期状态。何况,自家兄弟,有什么问题都好商量。

腾讯内部也会遇到资源瓶颈,坐拥中国互联网用户量最多的微信和QQ,旗下很多产品DAU以亿计算。高峰期海量并发问题,同样令他们苦恼。腾讯联合创始人张志东采取的应对措施是柔性政策,这套被总结为“海量之道“的技术宝典,也一度成为腾讯从一个高峰走向下一个高峰的”屠龙刀“。比如,峰值压缩大图,模糊画质,用户体验有一定的损失,但能避免对底层技术强硬冲击。峰值过去,再恢复正常。

但,这套原则面对外部客户时就失灵,站在客户的角度,他们不一定能接受这样的措施。谢明的感受是,云服务本身竞争激烈,除去价格因素,技术横向对比同样关键。

比如,客户很在意各项技术指标。技术能力越强的客户,指标要求越明确。你的CDN延时是快还是慢?如果快就能快几毫秒?

有的公司对技术不苛求,但可能希望你的产品方案更完备。他们没有容灾能力,一旦你的产品出问题,对客户就是致命的。

压力大归大,但随着团队搞定越来越多客户的技术问题,双方的合作也越发紧密和融洽。

谢明说,“以前你做得好,内部很难体会深刻。现在有了一个证明渠道,我们可以在外面打标。技术指标得分高,更容易被看得到。”

04

七天七夜的一场战斗

2014年春节刚过,谢明还在外地出差,就接到紧急电话,他得立刻马上去趟北京。滴滴出问题了,需要技术支援。腾讯的几路人马,从全国不同城市飞到北京,直奔滴滴办公室。

当时滴滴和快的还没合并,两家公司正打得不可开交。因为双方的补贴政策,用户数飞涨。一到早晚通勤高峰期,订单急剧上升,两家公司的系统就交替崩溃。

滴滴当时的办公室在中关村e世界,坐满了人,过道异常狭窄。技术没有独立区域,他们就挪到旁边的3W咖啡馆集中开发,但是网络环境不理想,干脆换去腾讯在北京的办公室银科大厦,找了两个独立会议室。

跟大部分早期互联网公司一样,滴滴租用了第三方机房托管服务,在排查系列问题后,他们以为资源瓶颈在前端,计划扩容运维力量。当时还出现一个插曲,托管的机房受到攻击,波及滴滴。

腾讯从天津紧急调用了几台服务器送到北京,发现还是不能解决问题。在现有基础设施条件下,即便服务器扩容,扩容的速度、底层系统安装都是很麻烦的事情。

最后,腾讯技术团队跟滴滴商量出一个方案,把滴滴的服务器移到腾讯的机房,由腾讯云提供服务,那里有更好的基础设施条件保障。

这对滴滴而言不是件容易的事。因为他们最初设计的软件架构,从来没想过要迁移,几天时间内,不影响一个高速发展中APP的正常运行,把它的底层架构全部换个地方,不敢想象中间可能发生什么问题。

外部形势刻不容缓,崩停的问题再不解决,用户不保。最后滴滴接受腾讯的建议:上云。7天7夜,腾讯帮滴滴重构底层架构,扩容了近千台服务器。

那时,还没有人能意识到,这是大战前夜的基础建设和防御工事。他们是重要参与者、见证者。一年后,经历血流成河的战争之后,滴滴快的宣布合并。如今,滴滴的架构经过多轮演进和迭代,已经成为这个领域技术最领先的企业。

今年疫情期间,因为腾讯会议的需求暴增,腾讯云也为其做了一次服务器扩容。8天时间,100万核,而当年支持滴滴,还没有这样的能力。五年时间,可以说腾讯云的底层基础设施的资源调度能力,突飞猛进,已经不可同日而语。

另一个侧面印证的注脚是,去年双十一,腾讯云提前45天准备服务器资源,交付的数量跟过去几年的体量相当。身处其中的每个人都肉眼可见这种变化。

2020年春节,快手K3战役(冲击3亿DAU),腾讯云也是技术服务商。有过太多经验之后,这次更从容。

去年11月,腾讯就着手准备,为快手协调服务器和带宽资源。腾讯视频云总经理李郁韬参与了全程。他们甚至在年底之前,进行了几次大规模压测,模拟突发峰值,推演问题,应急处理。

春节非常特殊。不止快手,包括腾讯在内的所有的互联网公司都在抢资源,就怕海量峰值爆发接不住。除夕夜,看不见的网络管道异常繁忙,这是一场没有硝烟的战争。

腾讯把资源协调的单位压缩在以小时计。比如,快手估算除夕夜峰值可能在几点,之后再把资源快速切换给腾讯的产品。这时候考验的就是全网的调度能力和运营水平。

结果是,腾讯云平台亿级DAU产品一天跑下来,全部平稳错峰度过。没有一次事故。要知道,微信这样的产品是以10亿级别运载的。

零故障平安度过除夕夜,这在以前也是不敢想象的。

05

从百亿到千亿

支持快手K3战役,服务电商平台,快速扩容腾讯会议。放在腾讯930变革的背景下解读,这些战绩会有新的意义。

关于930变革,外界感知最强烈的是腾讯明确to B战略,这是腾讯集团新的课题。

但对腾讯云而言,他们只是延续过去的使命和目标,真正发生变化的是分工更明确,业务结构更清晰。用答治茜的话说,拉开了要进攻的行业阵势,配齐资源,责权明晰。剩下的就是大规模的正面战役。

多年前,他们还在为如何完成3.6亿元的年度KPI愁苦。930变革后,腾讯年收入过百亿元,基础规模也过百亿。这是几十倍数量级的变化。

身处其中的人,已经很难感知到每次重要节点带来的内心冲击。但答治茜说,Coby(邱跃鹏)的头发白了很多。

从百亿到千亿,这是他们接下来的目标。光靠腾讯云不可能完成,他们需要队友。

2019年三四月份,答治茜跟邱跃鹏聊起,越深入产业互联网,越发现很多东西是非常专业的。腾讯不可能布局产业链上的所有环节,“我们得打群架。”当时答治茜在美国出差,俩人在时差转换中,对这个话题交流了很久也很多。当年10月份,腾讯启动千帆计划,与合作伙伴共建生态。

一个亘古不变的问题是,哪些腾讯自己做,哪些交给合作伙伴。界限在哪里。他们的回答是,要看各自的优势,以及谁的投入产出比更高。

腾讯擅长基础设施建设,且在to B方向有个核武器,那就是C2B。马化腾曾列举小程序、公众号、支付等七大工具帮助B端企业增值。

但C2B并不是一蹴而就的。对于云服务而言,更希望给C端提供价值,又能联动B端,这样的产品形态才具备长跑的可能性。否则就是左手倒右手,不健康。

比如在短视频领域,可以将腾讯在C端沉淀的正版图库、曲库直通车给到B端。具体的落地产品,他们也在思考和摸索。

从百亿到千亿只是结果,数字的简单叠加不是他们的最终目的。腾讯云对产业的反向助推作用,以及真正底层的创新才是核心命题。

2017年以前,直播公司的服务器、CDN开销要占到运营总成本的一半以上,想做一家直播平台不是一般的烧钱。

腾讯云等几家公有云参与基础设施建设后,直播平台的技术门槛和成本消耗被大幅压缩降低。从数字来看,现在的IT成本不及原先的1/3。这样,直播平台可以释放更多资源发展内容,给用户提供更好的服务。

也就是说,他们是网红经济繁茂的间接推动者。如果腾讯云在更多产业贡献类似的技术能力,才是真正的创新。比如零售业的数字化转型、金融业的虚拟营业厅建设等等。

这也是腾讯自己面临的问题。930变革不止是对外B端业务的梳理,也是自研上云的催化剂。三年时间,腾讯所有新增业务必须完成上云。

张志东退休之前,经常拉TEG的同事聊云业务。他很在意,什么时候腾讯的一个业务从零开始就部署在云开发的环境。

他还曾语重心长地跟大家分享,自己对技术趋势的分析,不管是阿里腾讯还是AWS,都是基于云做的技术开发,如果你还是沿用原来的方式,很可能将来会找不到工作。

930变革之后,腾讯集团成立技术委员会,开源协同顺利落地。第一批自研上云的项目中,QQ系所有的产品,已经全部跑在云端。

邱跃鹏说,自研上云相当于一个超大型客户在使用云产品,在这个过程中,腾讯也会为开源社区回哺,这样当客户再使用腾讯云的时候,相当于我们已经完成趟坑的过程。

耐克早期曾有句著名的广告语,正是腾讯云团队此刻的真实状态。“赢得比赛相对比较简单,而战胜自己却需要不断努力”。

0 阅读:3

新莓daybreak

简介:理解人,发现变化