Qcon上海2014

腾讯SNG织云自动化运维体系

讲师: 
所属专题: 

解放运维双手,提高运维效率,是海量运维团队都热切期盼的目标。工欲善其事必先利其器,腾讯织云提供的标准化运营体系,结合虚拟化和自动流程管理,将自动调度的变更能力普及到腾讯各大线上产品。

本次分享的题目是《腾讯SNG织云自动化运维体系》,主要围绕着织云平台的架构、自动调度的实现原理与DevOps模式的运作方式来展开。分享将从海量运维的减法引出运营平台的设计思路,在成本与性能博弈中抉择虚拟化方案的选型,从D/O分离的体力活转变为DevOps的协作模式。以织云平台的孕育-诞生-成长为主线,阐述腾讯运维团队深耕细作的迈入自动化运维时代的故事。

腾讯社交平台业务运维组组长

梁定安,具有丰富的自动化运维和运维平台项目开发经验,擅长海量服务架构设计、运维体系建设、自动化运维管理,2009年加入腾讯运营部,先后从事系统运维、业务运维、运维规划和运营开发的工作,现任社交平台业务运维组leader,主要负责Qzone、相册、开放平台等产品的运维工作,熟悉十万台量级服务器的运维体系管理,在Qzone、相册等海量服务的业务运维中提炼出互联网运维的标准,并推进运维标准化建设,提出SET容错、一致性管理、自动调度等运维理念,有效解决了海量运维效率与质量的难题。2012年开始探索虚拟化和自动化运维能力的结合,随后主导织云平台项目的设计与开发,已经成为腾讯SNG自动化运维的标准,目前织云已经发展成为全国最大规模的LXC虚拟化运维平台,结合DevOps模式将运维工作服务化,打造腾讯的敏捷运维能力。

梁定安热衷于开源运维技术与运维大数据的研究,近年一直致力于推动腾讯内部优秀系统开源和引入优秀的开源软件,提倡利用大数据的分析方法,扫除传统运维的监控盲区,探索更智能的监控解决方案。