感谢网友 sam.ren 的线索投递!
12 月 29 日消息,日本京都大学发布公报称,2021 年 12 月 14 日 17 时 32 分至 2021 年 12 月 16 日 12 时 43 分,由于备份超级计算机系统(日本惠普公司制造)的程序存在缺陷,超级计算机系统出现了意外,其中存储(/ LARGE0)中的某些数据被误删除。
京都大学表示,该错误使得 /LARGE0 目录下的约 77TB 文件被误删,约 3400 万个文件丢失。
了解到,日本惠普公司在备份程序的功能修复中,由于程序的粗心修改及其应用程序的问题,在删除旧的日志文件时,误删除了 /LARGE0 目录下的文件。
备份脚本包含使用 find 命令查找删除超过 10 天的日志文件。随着脚本功能的改进,传递给 find 命令的删除过程的变量名也有所改变,以提高可见性和可读性。
但修改后的脚本出现纰漏,bash 在 shell 脚本运行时通过覆盖脚本来释放脚本,从中间重新加载修改后的 shell 脚本执行了包含未定义变量的 find 命令。因此误删除了 / LARGE0 中的文件,而不是删除了原日志目录中保存的文件。
京都大学表示,备份过程目前已停止,预计 1 月底恢复备份。不过,在备份之前消失的文件已经无法恢复了,今后将保留增量备份等功能,还将改进操作管理,以防止再次发生。
日本惠普公司表示,对此次事件负全部责任,并承诺进行赔偿和善后。