最近不少朋友问我,岳云鲲二次进化到底难在哪?上周我也被这问题卡住了,刷到几个教学视频愣是学不会。今天索性把实验台擦干净,从头折腾一遍给你们看。
开头就栽跟头
那天半夜两点打开训练平台,直接导入上周存的老素材库。结果刚跑第一轮就出幺蛾子——生成的脸要么糊成马赛克,要么五官错位得跟毕加索画似的。连着删了三十多张带水印的素材,重新打包压缩完再喂进去,进度条爬到87%又报内存错误,气得我猛捶键盘。
- 别偷懒用截图!我把官方高清海报全扒下来
- 人脸占比必须超60%,拿尺子量着裁剪
- 背景纯色优先,那张火锅店合影害我白练三小时
参数差点逼疯我
参考某大佬分享的配置文件,结果loss值死活压不下去。前四次生成的不是三只眼就是嘴长额头上,有张成品像惊悚片海报。把学习率从0.0001调到0.0003那天,机房空调还坏了,汗珠子滴进键盘短路了俩按键。
技巧二:炼丹要控火候- 批量测试时关掉所有微信钉钉(消息弹窗毁过我一炉)
- 每20分钟截图备份,有张崩图居然当遗像挺合适
- 分辨率别贪高,512x512比1024稳定三倍不止
撞上鬼打墙
好不容易出张能看的,放大细瞅发现耳廓多了道褶子。拿着原图比对三小时,发现是训练集里某张侧面照光影有问题。硬是现拍五十张自己耳朵当补充数据,现在左耳冻得通红还没消肿。
- 颌骨阴影用蒙版单独强化
- 后脑勺发旋儿要补三十度角素材
- 笑容弧度拿PS事先校准(缺颗牙害我重练两轮)
今早验收时手都在抖,生成图刚加载出来,隔壁工位同事突然嗷一嗓子:“这不大号煎饼果子精吗!” 低头看显示器——岳云鲲穿着大褂捧哏的样子活灵活现,连双下巴那道褶都完美复刻。老板路过瞅了眼说“这图能当招商海报”,抽屉里作废的十六版训练日志突然就不烫手了。