一、安装sklearn先安装Python环境。可以使用pip来安装sklearn库:pip install scikit-learn 二、数据预处理在使用sklearn进行机器学习之前,需要对数据进行预处理。sklearn提供了一系列的数据预处理工具,如StandardScaler用于特征缩放,OneHotEncoder用于处理类别特征等。2.1 特征缩放 ......
44
0
0
2024-12-10
目录📚介绍ChatGPT1.1 什么是ChatGPT1.2 ChatGPT的应用场景💡基础概念1. 人工智能和机器学习1.1 人工智能(AI)简介1.2 机器学习(ML)简介2. 自然语言处理(NLP)2.1 NLP的定义与应用2.2 NLP在ChatGPT中的角色🔨ChatGPT的技术基础1. GPT模型介绍1.1 GPT(Generative Pre-t ......
63
0
0
2024-12-08
大家好,我是狂师!今天给大家推荐一款开源的Python库:Gradio!Gradio是一个开源的Python库,用于创建机器学习和数据科学的交互式应用和演示。项目地址:https://github.com/gradio-app/gradio 1、项目介绍Gradio旨在简化展示和测试机器学习模型的过程,它允许用户通过构建漂亮的界面来展示其模型,而无需编写复 ......
49
0
0
2024-11-29
一、scikit-learnscikit-learn 官方文档:https://scikit-learn.org/stable/#scikit-learn 的背景和创建者scikit-learn 是一个为 Python 编程语言设计的自由软件机器学习库。该项目最初由 David Cournapeau 在 Google Summer of Code 项目中启动 ......
98
0
0
2024-11-14
本博客旨在分享在实际开发过程中,开发者需要了解并熟练运用的 Linux 操作系统常用命令。Linux 作为一种操作系统,与 Windows 或 MacOS 并驾齐驱,尤其在服务器和开发环境中占据重要地位。Linux 命令,简而言之,就是指导计算机执行特定操作的指令。在 Linux 系统中,每个用户都会在 home 目录下拥有一个私人目录,用于存储个人文件和配 ......
57
0
0
2024-11-14
哈喽,我是Johngo~这几天,在社群发现很多同学都在讨论使用哪个框架的问题。当然,主要还是围绕TensorFlow和Pytorch展开。也毫无疑问,Pytorch的同学以压倒性的话语权霸屏。其实无论使用哪种框架,适合自己适合项目是最合适的。除此之外呢,还介绍了 sklearn、Keras、xgboost、LightGBM、NLTK、Gensim、Stats ......
59
0
0
2024-11-02
GBDT梯度提升决策树(Gradient Boosting Decision Tree),是一种集成学习的算法,它通过构建多个决策树来逐步修正之前模型的错误,从而提升模型整体的预测性能。GBDT属于Boosting方法的一种,这种方法会顺序构建一系列弱学习器(通常是决策树),每个后续模型都侧重于纠正前一个模型的错误。在GBDT中,这些弱学习器是回归决策树。G ......
264
0
0
2024-07-12
写在开头在机器学习中,我们除了关注模型的性能外,数据处理更是必不可少,本文将介绍一个重要的数据处理库numpy,将随着我的学习过程不断增加内容基本数据格式arrayarray矩阵是numpy中的数据格式,array格式有很多便捷的操作,如矩阵运算,广播等使用代码import numpy as np arr = np.array([1, 2, 3, ......
274
0
0
2024-04-15
写在开头在机器学习中,我们除了关注模型的性能外,数据处理更是必不可少,本文将介绍一个重要的数据处理库pandas,将随着我的学习过程不断增加内容基本数据格式pandas提供了两种数据类型:Series和DataFrame,在机器学习中主要使用DataFrame,我们也重点介绍这个DataFramedataframe是一个二维的数据结构,常用来处理表格数据使用 ......
249
0
0
2024-04-15
1 场景分析1.1 项目背景描述开发项目模型的一系列情境和因素,包括问题、需求、机会、市场环境、竞争情况等1.2. 解决问题传统机器学习在解决实际问题中主要分为两类:有监督学习:已知输入、输出之间的关系而进行的学习,从而产生一个能够对已知输入给出合适输出的模型。这些算法在图像分类、语音识别、自然语言处理、推荐系统等领域有着广泛的应用 无监督学习:已知输入,无 ......
230
0
0
2024-04-02
1. 优化算法概览‍‍梯度下降法;牛顿法;拟牛顿法;坐标下降法;梯度下降法的改进型如AdaDelta,AdaGrad,Adam,NAG等。2. 梯度下降法的关键点梯度下降法沿着梯度的反方向进行搜索,利用了函数的一阶导数信息。梯度下降法的迭代公式为:根据函数的一阶泰勒展开,在负梯度方向,函数值是下降的。只要学习率设置的足够小,并且没有到达梯度为0的点处,每次迭 ......
208
0
0
2024-03-14
尽管大模型非常强大, 但是解决实践的问题也可以不全部依赖于大模型。一个不太确切的类比,解释现实中的物理现象,未必要用到量子力学。有些相对简单的问题,或许一个统计分布就足够了。对机器学习而言, 也不用言必深度学习与神经网络,关键在于明确问题的边界。那么在使用ML解决相对简单问题的时候,如何评估一个机器学习模型的性能呢?这里给出了10个相对常用的评价指标,希望对 ......
309
0
0
2024-03-05
【导读】大家好,我是泳鱼。一个乐于探索和分享AI知识的码农!本文介绍通过机器学习的可视化技术以解释和理解模型这个"黑盒子"的开发与运作。机器学习的可视化(VIS4ML)是利用可视化技术来解释和理解机器学习模型的过程。由于数据质量极大地影响了机器模型的性能,如图1,本文从数据出发,介绍了机器学习模型输入常见的五种数据类型,并介绍了六个以数据为中心的任务应用于来 ......
260
0
0
2024-02-12
机器学习介绍Hnad-crafted rulesHand-crafted rules,叫做人设定的规则。那假设今天要设计一个机器人,可以帮忙打开或关掉音乐,那做法可能是这样:设立一条规则,就是写一段程序。如果输入的句子里面看到“turn off”这个词汇,那chat-bot要做的事情就是把音乐关掉。这个时候,之后对chat-bot说,Please turn ......
327
0
0
2024-02-02
公众号:尤而小屋 作者:Peter 编辑:Peter大家好,我是Peter~本文的主题:机器学习建模的超参数调优。开局一张图:文章很长,建议直接收藏~一、什么是机器学习超参数?机器学习超参数是在开始学习过程之前设置值的参数,而不是通过训练得到的参数数据。超参数是在模型训练之外设置的选项,不会在训练过程中被优化或更改。相反,需要在训练之前手动设置它们,并且对模 ......
249
0
0
2024-01-21