GBDT梯度提升决策树(Gradient Boosting Decision Tree),是一种集成学习的算法,它通过构建多个决策树来逐步修正之前模型的错误,从而提升模型整体的预测性能。GBDT属于Boosting方法的一种,这种方法会顺序构建一系列弱学习器(通常是决策树),每个后续模型都侧重于纠正前一个模型的错误。在GBDT中,这些弱学习器是回归决策树。G ......
204
0
0
2024-07-12
写在开头在机器学习中,我们除了关注模型的性能外,数据处理更是必不可少,本文将介绍一个重要的数据处理库numpy,将随着我的学习过程不断增加内容基本数据格式arrayarray矩阵是numpy中的数据格式,array格式有很多便捷的操作,如矩阵运算,广播等使用代码import numpy as np arr = np.array([1, 2, 3, ......
234
0
0
2024-04-15
写在开头在机器学习中,我们除了关注模型的性能外,数据处理更是必不可少,本文将介绍一个重要的数据处理库pandas,将随着我的学习过程不断增加内容基本数据格式pandas提供了两种数据类型:Series和DataFrame,在机器学习中主要使用DataFrame,我们也重点介绍这个DataFramedataframe是一个二维的数据结构,常用来处理表格数据使用 ......
212
0
0
2024-04-15
1 场景分析1.1 项目背景描述开发项目模型的一系列情境和因素,包括问题、需求、机会、市场环境、竞争情况等1.2. 解决问题传统机器学习在解决实际问题中主要分为两类:有监督学习:已知输入、输出之间的关系而进行的学习,从而产生一个能够对已知输入给出合适输出的模型。这些算法在图像分类、语音识别、自然语言处理、推荐系统等领域有着广泛的应用 无监督学习:已知输入,无 ......
177
0
0
2024-04-02
1. 优化算法概览‍‍梯度下降法;牛顿法;拟牛顿法;坐标下降法;梯度下降法的改进型如AdaDelta,AdaGrad,Adam,NAG等。2. 梯度下降法的关键点梯度下降法沿着梯度的反方向进行搜索,利用了函数的一阶导数信息。梯度下降法的迭代公式为:根据函数的一阶泰勒展开,在负梯度方向,函数值是下降的。只要学习率设置的足够小,并且没有到达梯度为0的点处,每次迭 ......
168
0
0
2024-03-14
尽管大模型非常强大, 但是解决实践的问题也可以不全部依赖于大模型。一个不太确切的类比,解释现实中的物理现象,未必要用到量子力学。有些相对简单的问题,或许一个统计分布就足够了。对机器学习而言, 也不用言必深度学习与神经网络,关键在于明确问题的边界。那么在使用ML解决相对简单问题的时候,如何评估一个机器学习模型的性能呢?这里给出了10个相对常用的评价指标,希望对 ......
245
0
0
2024-03-05
【导读】大家好,我是泳鱼。一个乐于探索和分享AI知识的码农!本文介绍通过机器学习的可视化技术以解释和理解模型这个"黑盒子"的开发与运作。机器学习的可视化(VIS4ML)是利用可视化技术来解释和理解机器学习模型的过程。由于数据质量极大地影响了机器模型的性能,如图1,本文从数据出发,介绍了机器学习模型输入常见的五种数据类型,并介绍了六个以数据为中心的任务应用于来 ......
206
0
0
2024-02-12
机器学习介绍Hnad-crafted rulesHand-crafted rules,叫做人设定的规则。那假设今天要设计一个机器人,可以帮忙打开或关掉音乐,那做法可能是这样:设立一条规则,就是写一段程序。如果输入的句子里面看到“turn off”这个词汇,那chat-bot要做的事情就是把音乐关掉。这个时候,之后对chat-bot说,Please turn ......
278
0
0
2024-02-02
公众号:尤而小屋 作者:Peter 编辑:Peter大家好,我是Peter~本文的主题:机器学习建模的超参数调优。开局一张图:文章很长,建议直接收藏~一、什么是机器学习超参数?机器学习超参数是在开始学习过程之前设置值的参数,而不是通过训练得到的参数数据。超参数是在模型训练之外设置的选项,不会在训练过程中被优化或更改。相反,需要在训练之前手动设置它们,并且对模 ......
209
0
0
2024-01-21
1机器学习有四种用途:分类、聚类、回归和降维。更严格一点,机器学习的目的只有三个:分类、聚类和回归,降维不过是达成目标的手段之一。2分类和聚类都是对个体样本归类,看起来很相似,实则相去甚远——前者属于有监督的学习,后者属于无监督的学习。分类是基于经验的,而经验来自过往的数据,这意味着分类需要训练;聚类则是基于当前全部样本的特征,不依赖经验,自然也就无需训练。 ......
186
0
0
2024-01-08
作为一款网红编程语言,Go语言还十分年轻,很多程序员无法及时了解到Go语言的框架、库和软件应用。近日,Github用户avelino分享了一张非常完整且庞大的表单,包括命令行、数据库、Web框架、机器学习、自然语言处理……以下是部分内容截取,感谢avelino的分享。标准CLI 用于构建标准或基本命令行应用程序的库。argv – 使用 bash 语法将库命令 ......
264
0
0
2023-08-15
十大 Java 机器学习工具和库对于Java机器学习的关注反映了Java语言的普及。由于其极端的稳定,领先的组织和企业已经采用Java几十年。它广泛应用于Android的移动应用开发,为全球数十亿用户提供服务。为了实现机器学习算法,Java开发人员可以使用各种工具和库。仅在上就列出了至少90个基于Java的ML项目。本文列出了10个最常用的库和平台:简要地描 ......
641
0
0
2023-07-15
1. 导读逻辑回归是在因变量为二元时进行的回归分析。它用于描述数据并解释一个因二元变量与一个或多个名义、有序、区间或比率水平变量之间的关系。二元或二项式 Logistic 回归可以理解为处理其中因变量的观察结果只能是二元的场景的 Logistic 回归类型,即它只能有两种可能的类型。多项 Logistic 回归适用于结果可能具有两种以上可能类型(A 型、B ......
355
0
0
2023-05-04
刚接触机器学习的同学可能会认为就是一个『data in,result out』的黑盒,但是深入了解之后会发现每一步骤都是门道。数据预处理数据的重要性就不用多说了,可不要『garbage in, garbage out』。数学基础机器学习是建立在数学基础之上的。概念模型尾巴路线图确实非常有帮助,入门的小白可以跟着有方向性系统性地学习;而对领相对比较熟悉的同学也 ......
429
0
0
2023-01-28
作者 | Nikola M. Zivkovic 译者 | 王强 策划 | 凌敏iIris 数据集的那些示例你是不是已经用腻了呢?不要误会我的意思,Iris 数据集作为入门用途来说是很不错的,但其实网络上还有很多有趣的公共数据集可以用来练习机器学习和深度学习。在这篇文章中,我会分享 23 个优秀的公共数据集,除了介绍数据集和数据示例外,我还会介绍这些数据集各自 ......
364
0
0
2023-01-25