MegStudio 使用指南
MegStudio 有效整合了旷视开源的深度学习框架 天元 (MegEngine),并为用户提供免费的计算资源,包括 多卡GPU、高级 CPU、以及 免费 CPU。我们提供了多种版本的天元框架以及学习教程,帮助你更便捷的在线学习和使用天元。
阅读更详细的使用说明,请前往 MegStudio 帮助文档。
MegStudio 项目
在 MegStudio 中,你可以看到 公开项目 以及 Mystudio 项目。
- 公开项目: 我们提供了很多官方或其他用户发布的公开项目供大家借鉴参考。你可以 一键运行 感兴趣的公开项目,或者 fork 公开项目来学习这些项目内容。
- MyStudio 项目: 你可以在自己的工作台中 创建项目,这些项目在未公开时都是私有的,仅自己可以操作与管理。你可以在项目内进入 Notebook 开发环境,去完成模型代码编译任务,也可以 预览 项目下所有版本的内容。
当然,我们欢迎你将自己的项目公开,贡献自己的 AI 学习心得。更多项目说明可见 公开项目指南 与 MyStudio项目指南 。
MegStudio 数据集
在 MegStudio 中,你可以看到 公开数据集 以及 MyStudio 数据集。
- 公开数据集: 平台汇集了许多热门、主流的公开数据集以供大家直接用于项目内的模型训练任务。你可以查看数据集详情并 直接引用 此数据集创建模型训练项目,或者在创建项目的时候进行 添加数据集,每一个项目均可关联 2 个数据集。
- MyStudio 数据集: 你可以在自己的工作台中 创建数据集,同理这些私有数据集在设为公开前都仅自己可以操作。我们为每一个用户提供免费的 50 GB 数据集存储空间,供您上传自定义的数据。我们支持你上传自己所需的数据集,对此我们提供了多种上传方式,包括 本地上传、从 OSS 导入、通过 HTTP 导入、以及直接 从 workspace 下选择已有的文件导入。
同样,我们欢迎你将自己的数据集公开,共享给其他开发者。更多数据集说明可见 公开数据集指南 与 MyStudio数据集指南 。
MegStudio Jupyter Notebook
MegStudio 提供直接基于开源项目 JupyterLab 的用户服务。使用过 JupyterLab 的用户可以继续保留使用 JupyterLab 的时候的习惯,没有接触过的用户也可以参考 JupyterLab 官方文档。
- 工作文件: 我们会在每一个项目的 Notebook 环境中为你提供一个 work.ipynb 文件,用于做代码调试,所有的输入输出也会被自动保存为草稿。你可以使用 发布版本 功能,将当前的草稿保存为一个稳定的、不可变动的版本;另外我们在 Notebook 中也提供 版本管理 功能,方便你查看或加载历史版本。
![](upload://g7a8ll13mWwz5bhG5CtOIbiYeNr.png)
-
工作空间: 每一个用户将享有一个独立的 100 GB 内存的持久化存储空间——workspace,更好的存储模型训练的产物或依赖文件,请注意您所有的项目将共同享有同一个空间,若空间不足请及时清理。
-
访问数据集: 用户在创建项目的时候选择的数据集,将以 只读 的形式挂载在 /home/megstudio/dataset 下,请不要试图往这个目录下执行写入操作。
-
**模型库加载:**在环境中你可以一键导入天元预置的模型库代码,只需要点击一下,就可以把加载模型的代码片段放到 Cell 中。
![](upload://enEmrFInrdTMRxz1CEdZzcICJer.png)
-
远程 Kernel: 我们在环境中提供远程 Kernel ,方便你在 CPU 环境下开启 Tesla V100 GPU 资源来运行代码块,以减少算力损耗。你可在python3 kernel 处进行远程 GPU kernel 配置。
更多 Notebook 说明可见 MegStudio 定制的 使用指南。