由于维护
当W&M信息技术公司计划中断某种服务时,通常会发布“(IT系统)将因维护而不可用”的消息。无论消息是指横幅,黑板,myWM等,它很少是一个受欢迎的事件。但这种情况确实发生了,而且相当频繁。那么这些维护到底是为了什么呢?
维护,什么?
Unix工程师Dan Ewart是一个很好的人选。他经常对像Banner这样的unix运行系统进行维护。1971年,Ewart从W&M大学毕业,获得化学学位,自1973年以来一直在该学院工作。他在学院的第一个大型计算机系统上工作,并从那时起帮助校园开发越来越复杂的计算机系统。
Ewart解释说,基本上有四种类型的维护:
- 数据库应用程序维护。这通常是代码的升级,其中新的编码脚本应用于数据库。
- 操作系统维护。在计算机操作系统上执行的过程。
- 硬件维护。某些物理设备正在维修和/或更换。
- 补丁和次要更新。通常,这些更新只是保持系统正常运行,或者是为了避免漏洞。更改通常只在应用它的系统后端被注意到。
还有每天和/或每周的系统刷新,只是保持一切正常运行。这有点像重启你的电脑。对于每天需要刷新的系统,大多数刷新是在凌晨进行的,而对于每周需要刷新的系统,则是在周末进行的。埃沃特通常在周一早上5点到办公室,以确保所有Banner系统在周末刷新后正常运行。
冰山一角
维护并不像看起来那么简单。在发布公告之前,有一个严格的开发过程。以需要应用于数据库系统的安全补丁为例。首先,将补丁放入一个测试数据库(称为test),在该数据库中执行初始测试。如果一切顺利,那么它将通过预生产(缩写为PPRD或Pre-PROD)数据库运行。这是一个真正的试验场,因为系统被IT工程师和程序员打上了补丁。
当所有的皱纹都被抚平后,这个贴片仍然存在于预生产数据库中,在校园周围的选定人群中进行测试和审查。例如,如果补丁影响到Banner,它将通过高度依赖Banner的部门(如注册办公室)进行审查。这个测试和审查过程可能需要几周到几个月的时间才能完成。
一旦一切准备就绪,最后一步是将补丁放入生产(又名PROD)数据库,使其“运行”。
但别那么快!
将东西放入生产系统总是高风险的。事情总是有可能没有按计划进行(尽管之前进行了测试),所有用户都可能受到影响。此外,为了安装,系统将不得不离线一段时间。随着系统变得更加丰富和相互依赖,在不破坏技术生态系统的情况下执行维护变得越来越困难。IT尽其所能,正如Ewart所说,“最小化影响”。这意味着,除了严格的测试之外,仔细的计划也是必须的。
尽量减少影响
那么,什么时候是让一个系统(或技术生态系统)离线的最佳时机呢?许多人会回答“从不”,特别是当涉及到像Banner和Blackboard这样的重量级系统时。不幸的是,这不是一个可行的选择。
因此,IT试图在流量最少的情况下进行维护。对于像Banner Admin这样在工作日大量使用的系统,维护工作通常在凌晨4点到8点之间(工作日开始之前)进行。如果维护预计需要几个小时,那么就安排在周末进行。像注册、添加/删除、时间表截止日期和财务报告等大量使用的时间段都要一起避免。
IT还与部门协商建议的停机日期。根据各部门的需要,选择一个日期。不可避免地,某些人或某些团体会在选择的时间内感到不便,但IT会尝试权衡部门的需求,并尽最大努力将影响降到最低。
在这一点上,您将最终看到臭名昭著的消息:“由于维护,[It系统]将不可用”,通常至少提前一周通知。
因维护而可用
试图保持校园系统全天候运行是一项相当大的努力。如果没有持续的维护和保养,系统将无法正常工作。通过严格的测试和仔细的计划,IT正在尽最大努力将维护和系统中断的影响降至最低。
虽然只有在系统预计将关闭时才会发布公告,但欢迎您在系统启动时对公告进行自己的积极解读。我们的建议吗?“(IT系统)由于维护而可用。耶!”