MindSpore专题——第四章、数据集

发表于 2024-08-14 更新于 2024-08-16 分类于专题，机器学习， Mindspore ，基本概念 Waline：本文字数： 1.7k 阅读时长 ≈ 6 分钟

数据集

继续第二章中的Mnist数据库为例，介绍使用mindspore.dataset进行加载的方法。

详情请见MNIST数据官方网站：MNIST handwritten digit database, Yann LeCun, Corinna Cortes and Chris Burges

阅读全文 »

MindSpore专题

发表于 2024-08-14 更新于 2024-08-16 分类于专题，机器学习， Mindspore ，基本概念 Waline：本文字数： 3.7k 阅读时长 ≈ 13 分钟

MindSpore

阅读全文 »

MindSpore专题——第三章——张量

发表于 2024-08-14 更新于 2024-08-16 分类于专题，机器学习， Mindspore ，基本概念 Waline：本文字数： 2k 阅读时长 ≈ 7 分钟

张量 Tensor

张量（Tensor）是一个可用来表示在一些矢量、标量和其他张量之间的线性关系的多线性函数，这些线性关系的基本例子有内积、外积、线性映射以及笛卡儿积。其坐标在 \(n\) 维空间内，有 \(n^r\) 个分量的一种量，其中每个分量都是坐标的函数，而在坐标变换时，这些分量也依照某些规则作线性变换。\(r\) 称为该张量的秩或阶（与矩阵的秩和阶均无关系）。

阅读全文 »

MindSpore专题——番外、Trans Fore模型

发表于 2024-08-14 更新于 2024-08-16 分类于专题，机器学习， Mindspore ，基本概念 Waline：本文字数： 325 阅读时长 ≈ 1 分钟

Transformer

Transformer是一种神经网络结构，有Vaswani等人在2017年的论文“Attention Is All You Need”中提出，用于处理机器翻译、语言建模和文本生成登自然语言处理任务。

阅读全文 »

MindSpore专题——第五章、网络构建

发表于 2024-08-14 更新于 2024-08-16 分类于专题，机器学习， Mindspore ，基本概念 Waline：本文字数： 1.5k 阅读时长 ≈ 6 分钟

网格构建

神经网络模型是由神经网络层和Tensor操作构成的，mindspore.nn提供了常见神经网络层的实现，在MindSpore中，Cell类是构建所有网络的基类，也是网络的基本单元。一个神经网络模型表示为一个Cell，它由不同的子Cell构成。使用这样的嵌套结构，可以简单地使用面向对象编程的思维，对神经网络结构进行构建和管理。

下面我们将构建一个用于Mnist数据集分类的神经网络模型。

阅读全文 »

MindSpore专题——第七章、模型训练

发表于 2024-08-14 更新于 2024-08-16 分类于专题，机器学习， Mindspore ，基本概念 Waline：本文字数： 1.9k 阅读时长 ≈ 7 分钟

模型训练

本片涉及大量之前提到概念的定义以及大量引用MindSpore官方文档。原文传送门：

MindSpore

阅读全文 »

MindSpore专题——第六章——函数式微分

发表于 2024-08-14 更新于 2024-08-16 分类于专题，机器学习， Mindspore ，基本概念 Waline：本文字数： 8.4k 阅读时长 ≈ 30 分钟

函数式自动微分

神经网络的训练主要使用反向传播算法，模型预测值（logits）与正确标签（label）送入损失函数（loss function）获得loss，然后进行反向传播计算，求得梯度（gradients），最终更新至模型参数（parameters）。自动微分能够计算可导函数在某点处的导数值，是反向传播算法的一般化。自动微分主要解决的问题是将一个复杂的数学运算分解为一系列简单的基本运算，该功能对用户屏蔽了大量的求导细节和过程，大大降低了框架的使用门槛。

阅读全文 »