协同软件confluence及jira服务软件的供应商atlassian网站,自4月初断线到本周超过7天还未完全恢复,两软件用户迄今还无法使用云计算服务。该公司估计还要2周才能恢复服务。
atlassian上周4月5日早上公告,多个云计算执行实例断线显示维修状态,影响jira work management、jira service management、jira software、confluence、atlassian access cloud用户,该公司着手调查两个小时后表示已经找出根本原因,正在规划缓解措施。当天晚上,该公司说已在规划解决问题的流程。
atlassian解释,该公司执行维护的script时“一小部分”网站被意外关闭。
直到本周一下午,问题并未完全获得解决。atlassian公告,经过工程小组24×7的抢修后,受影响用户中35%的功能已经重建,且没有资料损失。该公司说明,由于网站和资料的验证需要多个步骤,使重建阶段格外复杂,并指出,重建步骤攸关网站重建完整性,需花相当多的时间。
根据atlassian的网站状态页显示,仅jira product discovery、jira align、trello、bitbucket 4项服务恢复正常运营,而主要服务包括jira software、jira work management、confluence等仍显示“active incident”(发生问题)状态。
atlassian对用户及媒体表示,估计重建作业还要再2周。
大批用户抱怨不已。一名用户表示atlassian已断线6天,该公司项目经理已经跳脚,公司slack也挤满了服务呼救工单,没了云计算平台,项目管理只能用一名成员刚好备份到计算机的word文件勉强作业。
有用户表示,情况十分严重,至少400个网站受到影响。另有人抱怨,atlassian写坏的script删光客户资料,估计一周生产力停摆造成20万美元的损失。
已经用户开始实验其他类似方案如redmine。用户称atlassian这次事件应该是saas服务断线最久的案例了。