时间:2024-05-20 11:30:16
什么是回归分类聚类
回归、分类和聚类都是机器学习中的基本概念,它们的主要区别在于问题的性质和解决方式:
1. 回归(regression):回归是针对连续变量的预测问题,即输入变量与输出变量均为连续变量。回归方法包括随机森林、bagging等。
2. 分类(classification):分类是针对离散变量的预测问题,即已知标签、输出变量为有限个离散变量。分类方法包括bagging、随机森林、adaboost等。分类模型可以将回归模型的输出离散化,回归模型也可以将分类模型的输出连续化。
3. 聚类(clustering):聚类是将数据或用户聚合成几个群体的问题,即你不知道数据会分为几类,通过聚类分析将数据聚合成几个群体。聚类方法包括K均值(K-means)、DBSCAN、DPEAK、Mediods、Canopy等。
举例来说,预测明天的气温是一个回归任务,因为它是一个定量输出;预测明天是阴、晴还是雨是一个分类任务,因为它是一个定性输出;给定一堆无标签的数据,通过聚类算法将数据分类是一个聚类任务。
科技之家 广州小漏斗信息技术有限公司 版权所有 佳绩网提供支持 粤ICP备20006251号