加载中...

在人工智能训练中踩过的一些坑

发布: 21 Oct, 2025

字数:

180

阅读时长：

1 分钟

正文

我来氵一篇文章（作业没写完，但是一点也不想写了…）

我踩的坑

没有配置类似 Tensorflow 的 AI 训练进度监视
没有开启类似 Screen 的 Linux 终端窗口管理工具，导致 SSH 关闭后训练任务直接终结（还烧了我一晚上的费用…）
开始训练时没有配置好训练参数，导致训练的效果十分微妙…

一些建议

不要使用你的物理机去跑模型，去花点钱租一个服务器吧
训练时使用 conda 这样的 python 环境管理工具会比较方便
先跑一些简单的模型练练手，然后再跑大一点的模型吧

在以下平台分享这篇帖子：

如何贡献你喜欢的开源项目