总览
- 学习如何使用PyTorch实现文本分类
- 理解文本分类中的关键点
- 学习使用压缩填充方法
介绍
在我的编程历程中,我总是求助于最先进的架构。现在得益于深度学习框架,比如说PyTorch,Keras和 TensorFlow,实现先进的架构已经变得更简单了。这些深度学习框架提供了一种实现复杂模型架构和算法的简单方式,不需要你掌握大量的专业知识和编程技能。总结来说,这是数据科学的金矿。
在本文中,我们将使用PyTorch框架,它以其快速的计算能力而闻名。因此,在本文中,我们将介绍解决文本分类问题的关键点。然后我们将在PyTorch框架实现我们的第一个文本分类器!
提示:在继续浏览前,我推荐先阅读这篇文章:
A Beginner-Friendly Guide to PyTorch and How it Works from Scratch:
https://www.analyticsvidhya.com/blog/2019/09/introduction-to-pytorch-from-scratch/?utm_source=blog&utm_medium=building-image-classification-models-cnn-pytorch
大纲
- 为什么用PyTorch来解决文本分类问题
- 解决Out of Vocabulary words
- 解决变长序列
- 包装器和预训练模型
- 了解问题的场景
- 实现文本分类
一、为什么用PyTorch来解决文本分类问题?
在我们深入专业概念前,我们先快速熟悉一下PyTorch这个框架。PyTorch的基本数据单元是Tensor,类似于python中的numpy数列。使用PyTorch的最重要的两个优点是:
- 动态的网络——训练过程中网络结构可以变化
- 多GPU分布式训练