机器学习与深度强化学习论述

Rudy 2025-1-19 3 1/19

一、机器学习

1.基础

本质:让计算机从数据中自动学习规律,并用这个规律做预测或决策。

原因:为了解决规律复杂,人难以手写的场景(传统程序都是if else 条件全覆盖)

工作流程:收集数据-选择模型-训练模型-评估与验证-部署模型-持续改进

数据:结构化数据如学生信息表-姓名年龄成绩班级,非结构化数据需要特殊处理

特征:特征是数据的可观察属性,描述一个人的特征:身高、体重、性格;特征工程是从原始数据创建有用特征,如房龄=2026年 - 建造年份。

标签:想要预测的答案,如分类标签、回归标签。标签质量一定要高。

模型:机器学习算法从数据中学到的规律。

训练:模型学习的过程,在工程中,模型不断调整参数,使预测结果越来越接近真实标签。

推理:使用训练好的模型进行预测的过程。
指标:损失函数-损失值越小,模型性能越好;

2.应用

二、深度强化学习

1.强化学习

智能体通过与环境互动、根据获得的奖励或惩罚来学习如何做出一系列决策。

智能体+环境+状态+动作+奖励

2.深度学习

神经网络-利用激活函数多层-

3.深度强化学习

强化学习的决策框架+深度学习的感知与表示能力

三、数据处理

1.数据理解

利用pandas得到数据的整体信息如多少行多少列什么数据类型并且发现缺失与异常值;利用Matplotlib可视化分布图

2.数据清洗

处理缺失值,可以删除或者填充(利用中位数、众数);利用四分位距法识别异常值;删除重复值;映射统一值

3.特征工程

特征处理-特征构造-特征选择

4.可视化

 

 

- THE END -
最后修改:2026年6月19日
0

共有 0 条评论