从0到1搭建预测性维护系统：完整踩坑记录

去年带团队做了一个预测性维护项目，从立项到上线花了 8 个月。记录完整的踩坑过程。

最初的设想

“ 用 AI 预测设备故障，提前维修，减少停机损失。”

听起来很美好。但具体怎么做，没人说得清。

踩坑一：没有量化目标

客户说 ” 减少停机 ”，但没有具体数字。是减少 50% 还是 5%？是预测所有故障还是关键故障？

结果：验收时双方标准不一致，扯皮 3 个月。

正确做法

立项时必须量化：

传感器部署

在 47 台设备上装了振动、温度传感器。采样频率 1kHz，一天产生 4TB 数据。

踩坑二：数据标注困难

需要标注 ” 正常 ” 和 ” 故障 ” 数据。但：

结果：标注数据质量差，模型训练效果不理想。

正确做法

最初的方案

用 LSTM 做时序预测，预测未来 7 天的设备状态。

踩坑三：模型和业务场景不匹配

LSTM 预测的是 ” 未来状态 ”，但维修需要 ” 具体故障类型 ” 和 ” 剩余寿命 ”。

结果：模型准确率 92%，但无法指导维修决策。

正确做法

需要对接的系统

踩坑四：接口文档不全

对方系统接口文档过时，实际接口和文档不一致。调试花了 2 个月。

正确做法

系统功能

踩坑五：用户不会用

结果：系统上线 3 个月，实际使用率不到 10%。

正确做法

总预算 ：100 万 / 6 个月
实际支出 ：180 万 / 8 个月

预测性维护不是技术问题，是工程问题。

技术只占 30%，剩下 70% 是需求梳理、数据治理、系统集成、用户培训。

关于作者： 做 AIoT 技术咨询，帮企业避开预测性维护的坑。如果你正在规划类似项目，欢迎聊聊——有些坑，你不用自己踩。

近期文章