真能实操「动手学深度学习」案例?|QbitAI论AI圈活菩萨

韩志变策源于奥飞寺

量子位报告 | 公众号QbitAI

说起AI圈活菩萨,莫过于李牧先生。

此前,他撰写了《Hands-on Deep Learning》,成为圈内经典。后来,他在B站免费给斯坦福上了一堂AI课。一场高难度的硬核讲座视频36万,研究组从导师到实习本科生不等。生活在追逐。

这么给力的分享,难怪很多人都自豪地自称“拜师门下”——

最近,我发现有些平台做得更好。

本平台免费提供算力,还将入门经典“动手深度学习”免费放入平台供大家学习和实践。名称是:Amazon SageMaker Studio Lab。

据介绍,该平台基于JupyterLab,提供免费的GPU和CPU算力+15G永久存储功能。还链接GitHub,支持使用主流机器学习工具组件和开源资源包。开发者可以结合《动手深度学习》教材自己训练模型,看看效果。

此外,他们还声称该应用程序只需要一个电子邮件地址,不需要公众号,也不需要信用卡。

有这么好的事情吗?

今天就带大家来测试一下。

真能实践“动手学习深度学习”的案例吗?

通过链接到 studiolab.sagemaker.aws,我们可以登录网络平台并探索现实。

从界面可以看出,平台提供GPU/CPU算力选项,无需付费即可直接使用。

在右下角,我们可以看到Dive into Deep Learning(简称D2L)这本书。

点击 Open D2L notebooks 直接打开:

打开项目后,系统会自动加载D2L资源并存放在我们的云文件夹中。

自述文件也被打开。里面系统环境配置、书籍概要、受众、目录框架等一应俱全。文末还有各章节的链接,可以直接进入。

至此,您就可以通过课程内容与实际操作相结合的平台学习深度学习了——

那么它在实践中是如何工作的呢?

以经典中的经典AlexNet部分为例,感受一下。

在平台上展示了​​AlexNet的血统开发和基本原理的讲解,可以运行模型的定义和构建代码。

为了保证初学者更好的理解,我们还可以构建一个单通道数据示例未转变者怎么打代码,观察AlexNet内部8层的输出。目的是帮助我们直观地理解不同层的作用:

最重要的是训练模型也开放实操,代码部分可以选择运行。

但是,这个过程允许很长时间。我们在 GPU 选项下使用大约 7 分钟进行训练,请稍候!

△看到曲线画的很慢很慢

值得一提的是,由于整个界面可以当做Notebook来添加代码,记录学习和思考——

因此,即使我们的课程完成了,我们也可以在课文末尾添加一个代码栏,根据本章末尾的习题编写作业。

上面的介绍只是一个小节。其实从全连接层、卷积、池化等概念的介绍,到对ResNet和DenseNet的讲解……在Amazon SageMaker Studio Lab的免费环境中,都有演示和实际操作,而且他们安排得很清楚。

平台还考虑到我们高阶线性代数基础不一样,不是每个人都过90分,还给出了单变量微积分、最大似然等数学基础的介绍和代码实现,还附上了环境配置方法一个非常可靠的姿势。

经过以上验证,这家 Amazon SageMaker Studio Lab 确实可以免费完整地练习大师的“动手深度学习”——

对于想要入门甚至深入掌握AI/ML技术的人来说,这种理论+实践的学习方式自然效率更高,未来向实际工作或科研甚至创业的过渡会更加无缝。

其实它的能力还不止这个级别。

为开发人员提供的免费平台

从名字就可以看出,Amazon SageMaker Studio Lab 推出背后的公司是 Amazon Cloud Technology。

这家前沿科技公司此次推出免费平台,不仅让“动手深度学习”成为一个理论+实践的实践领域,还面向数据科学家、企业开发者、高校师生——

提供免费且低门槛的机器学习包容性机会。

事实上,在亚马逊云技术之前,业界已经有好几个开放的机器学习平台——

那么,此次 Amazon SageMaker Studio Lab 又有哪些新亮点呢?

让我们先从配置开始。

该平台提供15G以上永久存储、16G内存、4个CPU,GPU为NVIDIA Tesla T4,略高于目前其他主流平台。

由于采用了更新架构的NVIDIA Tesla T4,其混合精度计算速度指标也相应更高。另外,免费版采用与SageMaker Studio相同的架构,相当于叠加了一层企业级Buff,稳定性更有保障。

值得注意的是,该平台标榜4小时GPU+12小时CPU,但实际上时间到了我们仍然可以再次打开Runtime,原始文件依然存在。

但如果你想挖硬币,算了……

平台明文禁止使用SageMaker Studio Lab进行生产,挖矿加密货币时发现直接禁止。

说完配置,再来看看实际操作。

在操作上,Amazon SageMaker Studio Lab 比其他平台更简单、更直观。

该界面不仅可以创建 Jupyter Notebook 文件,还支持我们直接创建 Terminal 选项卡和 Markdown 格式文件。

另外,这个平台配置了 Conda 和 Pip 资源包管理器,让我们不用重复安装开源包。

拉取 GitHub 项目甚至不需要使用命令行,只需点击左侧的按钮即可。

如果克隆的项目中有 yml 环境配置文件,那么在项目构建时,Conda 环境也会同步建立。

该平台还与 Github 相关联。

在我们自己的 Github 项目 README 文档中包含以下内容:

图片[1]-真能实操「动手学深度学习」案例?|QbitAI论AI圈活菩萨-老王博客

[![在工作室实验室中打开]()]()

您可以添加“在 Studio Lab 中打开”按钮 –

其他人可以一键访问 Amazon SageMaker Studio Lab 平台。

当然,我们也可以通过手动上传或者复制的方式新建一个ipynb。

以经典的图像分类算法为例。

从其他平台复制一个ipynb文件后,无需修改即可使用,最多手动安装依赖即可。

训练模型的实际速度与其他平台基本相同,有时甚至会稍快一些。

最后,我们还要看看很多人关心的数据安全问题。

我们在做机器学习的时候,往往会持有大量的私人人脸信息,甚至是未经脱敏的医院病人信息。为了保护他人的隐私和数据安全,我们不得不看看这种情况。

Amazon SageMaker Studio Lab 脱胎于企业级应用,承诺每个人的数据都受到加密保护,如果账户被删除,所有相关数据都会被相应删除。该平台承诺不会保留它。

目前,许多知名学校和企业已经使用了 Amazon SageMaker Studio Lab 并为其平台背书。

其中,有ENIAC发源地宾夕法尼亚大学工程学院、加州大学圣克拉拉分校金融系、拥抱脸。

国内的追随者也不少。

南方某985理工学院机器学习领域的一名博士生表示,虽然他们课题组的方向是传统机器学习,但仍然需要深度学习来辅助验证。

由于实验室的计算设备是几年前购买的,随着人员和研究方向的增加,特别是在投稿前夕,计算资源的竞争是很普遍的。Amazon SageMaker Studio Lab 对他们来说真的很有吸引力。

说完这个免费平台的优势,接下来的问题是:如何申请?

在这里谈论它。

无需亚马逊云技术账户,只需登录官方链接 studiolab.sagemaker.aws/requestAccount 并填写邮箱地址及相关信息即可。

不过为了保证大家能尽快通过应用程序使用,这里有一些Tips,希望大家注意:

建议语言为英文,相关机构名称填写清楚,留邮箱后缀与申请所在机构英文名称一致。这样的应用程序更加可信和可靠。

如果满足以上条件,可以在亲测24小时内收到邀请,注意查收邮件。

无缝迁移的高级版本

如前所述,Amazon SageMaker Studio Lab 与 Amazon SageMaker Studio 专业版基于相同的架构,所以如果你想从初学者免费版迁移到专业版,绝对不是什么大问题。

对于专业的开发者来说,这当然为先进的科研和创业提供了更多的可能。

更具体地说,Amazon SageMaker Studio 专业版自始至终为开发者提供了一套相当全面的功能:

例如,它为我们高效的大型模型训练需求提供了大规模的分布式训练。使用分区算法自动拆分 GPU 实例中的大型模型和数据集,以提高并行度并加快训练速度。

比如数据标注功能Ground Truth Plus就已经吸引了人类专家未转变者怎么打代码,结合机器学习辅助预标注,大大减少标注错误,提高标注速度。

再比如Amazon SageMaker Data Wrangler,它面向机器学习中的数据准备阶段,可以通过可视化界面进行数据选择、清洗和探索。一键导入,无需代码即可快速标准化和转换各种结构的大量数据。“四大”之一的德勤就采用了这一功能。原本几个月完成的数据准备,现在压缩到了几天。

此外,Amazon SageMaker Studio 还包括访问控制管理、模型监控、无服务器推理功能、推理配置建议……以及全周期的工业 AI/ML 服务,应有尽有。

以上很多都是亚马逊云技术re:Invent 2021今年新推出的功能,很大程度上体现了公司对需求的理解和技术的前瞻性——

这些功能为专业开发人员、数据科学家提供了更多的可能性,无论是研究还是创业。

更有趣的是,亚马逊的云技术似乎并不专注于运营业务,有很多普惠活动对我们来说“不赚钱”。

机器学习马拉松项目就是一个例子。

该活动每年举办数次,平台将提出人工智能相关领域应用的测试题,涵盖人工智能自动化编程、防灾或损毁评估等。

本次活动将考验挑战者在CV、NLP等方面的技能,期间平台还将提供相关平台和资源。获胜者将获得高达 50,000 美元的奖金。

像这样的活动还有很多,都是面向实际需求,用技术造福开发者,每一个都有自己的乐趣或社会价值。

Amazon DeepRacer,一个零门槛进入机器学习的自动驾驶竞赛,拥有数百万粉丝和14万参与开发者;

还与非营利组织 Girls in Tech 合作开展活动,帮助更多女性了解和使用机器学习,消除科技界的性别差距;

还有最新推出的Amazon SageMaker Canvans,在圈内引起了高度关注。针对零代码经验的内部分析师和运营商,帮助他们将机器学习技术应用到实际业务中。

科技巨头退居二线

最后,您如何评价 Amazon Cloud Technology 的 SageMaker Studio Lab?

从运营的角度来看,这些做法当然有利于自身未来的生态建设,是龙头企业保住地位的必要举措。另外,大量公司以50万年薪招聘相关从业者,这对很多开发者来说也是一件好事。

毕竟,人工智能的不足是肉眼可见的。大多数开发人员具有丰富的编程经验和数学基础。唯一的障碍是:他们不熟悉机器学习。补这片喝汤,何乐而不为?

不过,从业界的角度来看,上述动作确实是在推动前沿技术的落地——

但是,这里的推动不是更快,而是更宽。

要知道,一百年前汽车才刚刚发明出来,只有机械专家才能成为车主,所以在当时的社会,司机是一个拥有尖端技术的职业。

你也要知道,三十年前,PC和互联网只是少数开发者的玩具,开发网站可以让人们快速致富,积累高达万丈高楼的资产。

因此,一百年前的人们无法理解一个人人都能开车的社会,30年前的人们很难想象用手指就能拥有自己的互联网平台。

今天的机器学习也是如此。即使是最前沿的技术高手,也只能瞥见 AI 版图的一小部分。只有反复降维,这项技术才能进入千行百业的场景,在不同背景、不同经历的人手中,会产生不同频率的回响——

这不仅是亚马逊云技术普惠布局价值的体现,也是李牧先生等人的公益心。

那么,未来人工智能技术能释放多少能量呢?

答案必须从每个单独的开发人员和每个场景破解中找到。

– 结束-

© 版权声明
THE END
喜欢就支持一下吧
点赞0
分享
评论 抢沙发

请登录后发表评论