想问问如何使用imagenet数据集进行训练(可以出一个教程吗)


遇到没有办法在解压后放到文件夹中,查阅后已经有了解压版本但是目前还是比较疑惑,这类问题要如何解决

你可以参考一下官方的 ResNet 源码:

https://github.com/MegEngine/Models/tree/master/official/vision/classification/resnet

例如,可以通过以下命令在2块GPU上以64的batch大小训练一个 resnet50 的模型:

python3 train.py --data /path/to/imagenet \
                 --arch resnet50 \
                --batch-size 64 \
                --learning-rate 0.025 \
                --ngpus 2 \
                --save /path/to/save_dir

您好,非常感谢您的解答,但是我是想尝试在megstudio上尝使用imagenet数据集进行训练的,但是https://studio.brainpp.com/dataset/2540?name=ImageNet上的数据集好像没有被解压到,


与github上的格式不一致,我想请教一下怎么做才能顺利的在megstudio上把imagenet数据跑起来,谢谢

你可以解压到 workspace 目录,dataset 目录是只能读不能写的,另外可以尝试使用 python 工具直接读压缩包内的文件~

感觉 @matrix 说的挺有道理的,我们应该提供一个完整的 imagenet 训练的样例,便于参考

可是workspace目录最大只能容纳100gb,但数据集本身是超过100gb的,这就导致不太可能在notebook下完成训练呀。请问该怎么处理呢 :sob:

可以尝试使用 python 工具直接读压缩包内的文件~

最近提供了 imagenet 读取的能力哦~

1赞