1.准备lmdb数据库就要了10几个小时! 2.预训练vq-vae后,生成similarity的文件居然是用的cpu跑的,加了个tqdm的进度条显示要365小时?后面我改成放到gpu跑变成2.5小时了... 3.正式训练的时候,查看gpu的利用率居然只有10%左右?  给程序加了个tqdm的进度条,居然显示要1000多个小时才能跑完?  是读取数据的地方出问题了吗?