前往顾页
以后地位: 主页 > 精通Office > 其他教程 >

这是有赞的毛病办理经历

时候:2018-11-22 21:25来源:知行网www.zhixing123.cn 编辑:麦田守望者

线上毛病是指供应给客户利用的IT办事全数或部分不成用,包含办事机能的降落,如:办事延迟致利用户体验变差。

在创业后期,为了抢占市场先机,产品新服从的公布速率寻求常常优先于其质量,埋下了很多技术债务,部分离艺债务的发作会引发线上毛病,造成客户的体验降落或经济丧失。

毛病办理的目标是“尽快规复办事到一般运行,并且最小化对业务运营的倒霉影响,从而尽可能地包管办事质量和可用性的程度”。

在毛病产生后,毛病告急措置小组会定位、阐发和规复毛病,并在毛病规复后对毛病进行Review和总结,制定出可履行的Actions,以进步毛病措置效力和避免近似毛病再次产生。

下面将为年夜家简朴介绍有赞的毛病办理实际。

毛病措置流程介绍

有赞利用JIRA作为跨部分合作东西,线上毛病办理也借助于JIRA。我们制定了下面的毛病措置流程,毛病JIRA工单遵守该事情流,而毛病Action(s)会被建立在对应的毛病JIRA工票据任务中,子任务的事情流为JIRA默许事情流。

确认毛病与告诉调和人

当收到客户、外部员工或监控上报的潜伏毛病时,陈述人会尽快确认毛病的有效性。

当肯定是个毛病后,会提交一个毛病JIRA工单,并告诉毛病调和人(来自研发效力团队,首要卖力业务与技术部分之间的信息同步和调和)。

调和人确保公司内业务部分、技术和产品部分原告诉到位,同时将毛病上报到“可用性保证微信群”里,毛病启事排查和会商会在该群里或拉伶仃的毛病措置群进行。

定位/措置毛病

为避免无关动静滋扰,毛病措置人组建毛病告急措置小组(在微信群里或坐在一路),以进步毛病措置效力。

毛病措置人在定位到问题后需将毛病启事和估计多久修复同步给调和人。对措置时候比较长的毛病,告急措置小组会每隔半小时对相关业务部分同步一次毛病措置停顿。

毛病规复

如肯定是公布引发的毛病,需将代码回滚到毛病前的某个不变版本。

毛病规复后,毛病措置人需跟业务影响方确认是不是有数据需求修复。如有,需将影响环境反应给调和人,并共同业务方尽快修双数据。

构造毛病Review

毛病Review一般摆设在毛病措置结束后24小时内,包含毛病过程回顾、毛病启事阐发、改进防备办法制定、毛病定级等,其产出物为:

毛病阐发陈述。毛病定级分为P1、P2、P3和P4四个品级(顺次降落),每个业务组都有特定的品级定义,首要从业务影响面和影响时候来肯定。目前利用的毛病陈述模板以下:

同步毛病陈述

毛病Review参与人通常为毛病措置人、调和人、任务人及任务方组长,毛病陈述人视环境志愿参与。

为了让所有技术小火伴都能体味到毛病信息,毛病任务人需将终究版的毛病陈述同步到产品技术群。

建立每个Action JIRA子任务

毛病任务人在JIRA毛病单下建立子任务,每个子任务对应一个毛病Action,子任务的“到期日”字段需被更新成:Action的Deadline,并将其分派给Action履行人。

毛病与毛病Actions跟进

JIRA看板是个很直观的东西,支撑在规定的事情流之间挪动任务板。我们利用JIRA的kanban board来跟进毛病及其Actions(以下图),顶部疾速过滤器可以疾速拜候各技术业务组不合状况下的毛病或Actions信息,横向上拆分成3个泳道:

毛病、过期毛病Actions和待措置毛病Actions。

如果某个Action的到期日已到了,该Action任务板会显现在“过期毛病Actions”泳道中,不然会显现在“待措置毛病Actions”泳道中,毛病调和人会按期跟进下过期毛病Actions的履行,并将过期的毛病Actions同步到产品技术群里,以提示Action履行人及时措置JIRA。

毛病数据阐发

经由过程阐发毛病数据,我们可以发明问题在那里,并进行改进。目前毛病数据首要记其实JIRA和Confluence上,我们会将其按特定格局备份到Numbers中,从不合角度阐发这些毛病数据,如:

每个月毛病数对比、每个月毛病措置时候对比、近两月毛病品级占比漫衍、近两月毛病类别占比漫衍、近两月毛病来源对比和近两月各业务组毛病数对比等。

连络每个月公布数据和线上问题数据的综合数据阐发,我们得出了“公布次数很多的月份,其线上问题和毛病数也相对较多”的结论。为了减少毛病产生率,我们需求减少公布频次和标准公布流程。

小结

按照以后存在的问题制定出一套流程不难,难在对流程履行的跟踪和监督。有赞线上毛病措置流程由研发效力团队卖力跟踪和监督,确保了每个毛病都能颠末Review,并构成完整的毛病阐发陈述,同步给所有技术小火伴。同时,每个毛病Action都是可履行的,且有明白的履行人和Deadline。

颠末一年多的毛病办理,我们不但沉淀了贵重的毛病数据,为改进标的目标供应了参考,也加强了小火伴的毛病意识,对线上环境的畏敬之心和对毛病的告急措置意识。

关于“毛病办理”,我们只迈出了一小步,另有诸多待改进的处所。比方,我们目前首要办理了线上的毛病,对公司外部体系毛病并没有办理起来;目前年夜家体味毛病信息的路子是:

JIRA、Confluence和技术报表,贫乏一个大众的毛病检索和主动天生毛病报表平台;我们的事件办理(Event Management)程度还很低,很多毛病是由客户上报,而不是由监控体系先发明。

------分开线----------------------------
标签(Tag):毛病办理经历
------分开线----------------------------
保举内容
猜你感兴趣