0.概览
目前自己在深度学习这方面有一定的积累,一些代码流程都有一定的套路和相应的标准,这里自己简单梳理一下。
我们这里假设输入为已标注数据,输出为训练的模型,不考虑标注前数据处理部分已经代码上线部署环节。
大致的流程包括:
- 数据预处理
- 编写神经网络模型
- 编写数据加载部分代码
- 编写模型训练预测代码
本文章转自完整机器学习项目的工作流程 - 知乎。
明确问题是进行机器学习的第一步。机器学习的训练过程通常都是一件非常耗时的事情,胡乱尝试时间成本是非常高的。
这里的抽象成数学问题,指的我们明确我们可以获得什么样的数据,目标是一个分类还是回归或者是聚类的问题。即明确输入和输出以及任务类型。
之前自己也是懵懵懂懂的不太理解,经过一段时间的学习和思考,感觉自己有了新的认识,所以在这里分享一下,也算自己的总结了。
不谈数学原理,我认为理解Word Embedding可以从以下3个角度来理解。
使用如下命令安装torchtext
pip install https://github.com/pytorch/text/archive/master.zip