在人工智能训练中踩过的一些坑
发布:
字数:
180
阅读时长:
1 分钟
正文
我来氵一篇文章(作业没写完,但是一点也不想写了…)
我踩的坑
- 没有配置类似 Tensorflow 的 AI 训练进度监视
- 没有开启类似 Screen 的 Linux 终端窗口管理工具,导致 SSH 关闭后训练任务直接终结(还烧了我一晚上的费用…)
- 开始训练时没有配置好训练参数,导致训练的效果十分微妙…
一些建议
- 不要使用你的物理机去跑模型,去花点钱租一个服务器吧
- 训练时使用 conda 这样的 python 环境管理工具会比较方便
- 先跑一些简单的模型练练手,然后再跑大一点的模型吧
在以下平台分享这篇帖子: