admin 管理员组

文章数量: 1087821


2024年4月15日发(作者:concatente函数的操作)

数据库技术

Data Base Technique

基于Lasso和模糊互信息多标记特征选择算法

文/孟金彪 钱萌 李存志 翟静波

空间的模糊互信息,根据模糊互信息的大小对

本文提出一种基于Lasso和

特征依次进行排序,得出最终特征子集。通过

模糊互信息多标记特征选择算法。

本文所提的算法在6个多标记数

实验结果表明本文算法是有效的。

据集上进行了测试,实验结果和

统计假设检验说明本文算法是有

1 模糊信息熵

效的。

定义1假设样本空间的描述记为论域U,

论域U可根据某种特征属性进行划分,假设

根据特征属性对论域U进行划

【关键词】多标记学习 模糊互信息 Lasso算

分记,则模糊信息熵定

法 特征选择

义如下:

多标记学习广泛应用于机器学习、人工

(1)

智能等方面。在多标记学习中,数据集往往具

有高维性和高冗余性等特点,从而导致维数灾

其中E(X)为模糊熵,公式(2)中表

难。特征选择作为一种有效的降维方式,其通

示在论域U中等价类X

i

的概率,

过删除冗余或不相关特征来提高分类模型精度

的目的。

表示在论域U中的X

i

的互补概率。

目前,众多学者已提出多种效果较优的

定义2类似的,模糊互信息定义为:

特征选择算法。例如Lee等提出了基于多变量

互信息的多标记特征选择算法(PMU)。Lin

(2)

等提出了基于邻域互信息的多标记特征选择算

2 结合Lasso与模糊互信息的特征选择算

法。

然而,上述特征选择算法在选择特征子

集时都有计算开销过大的问题。为解决该问

2.1 基于Lasso算法的特征降维

题,近年来,一种基于线性回归模型的降维方

法-Lasso算法,其因高效的性能在特征选择

Lasso算法是一种同时进行特征选择和正

领域得到了广泛的关注。Lasso通过对变量进

则化的线性回归分析方法,其基本思想是在回

行选择和压缩来降低原始特征空间的维度,该

归系数绝对值之和小于一个阈值的条件下,使

算法的基本思想是在构建线性回归模型时,其

残差平方和最小化,将相关性较低的变量的系

回归系数绝对值之和小于一个阈值的约束条件

数压缩为0,然后删除这些特征变量,从而达

下,使绝对值较小的回归系数自动压缩为0,

到降低特征空间维度的目的。另外,Lasso算

从而得到可解释的模型。另外,在常见的特征

法还能有效的防止过拟合问题。针对多标记学

选择算法中,主要利用传统熵方法来判断特征

习,Lasso构造的函数如下:

与标记空间之间的相关性。但传统信息熵不具

有补的性质,因此,用模糊信息替代传统信息

(3)

熵。在选择特征子集的过程中,为了提高分类

式(3)中,是控制稀疏矩阵

性能的同时并缩减算法计算开销过大的问题,

的参数,Lasso回归是一个

本文首先利用Lasso算法对特征空间降维,求

凸优化问题,但由于其是通过1范式构造的惩

解出每个特征在每个标记下的回归系数,系数

罚函数,因此稀疏矩阵不能直接求解。本论文

为0所对应的特征都视其为冗余特征并将其删

中,将用交替方向乘子法(ADMM)来将式(3)

除,得出新的特征空间。然后结合模糊信息熵

转换为2个子问题求解,式(3)可以利用拉

对新的特征空间中所有特征分别计算其与标记

格朗日形式重新构造为:

●基金项目:基于步态触觉特征的身份识别(2)资助。

186 •

电子技术与软件工程

本文标签: 特征 数据 算法 进行 实验室

更多相关文章

数据丢包怎么修复_网络丢包率高怎么办

4月前

展开全部 网络丢包率就是在我们数据包的数据传输过程中,因为中32313133353236313431303231363533e59b9ee7ad9431333365643661途的传输而导致部分数据包被丢失。 1、物理

银行家算法的思路银行家算法

4月前

算法思路 先对用户提出的请求进行合法性检查,即检查请求是否大于需要的,是否大 于可利用的。若请求合法,则进行预分配,对分配后的状态调用安全性算法进行 检

数据链路层和网络收尾

4月前

在ip层的知识中,有几个遗留问题没有解答,这些问题有助于我们理解整个网络体系。问题1.1 如何理解子网内主机可以直接通信,1.2数据链路层如何解决子网通信的问题。2.1 分片

搜索结果排序算法的研究

4月前

一、研究背景 1 、Internet与WWW发展现状 [5] (1)Internet 的发展历程 Internet 的前身是美国国防部高级研究计划署的研究试验性网络ARPANET。1983年TCPIP成为ARPANET上唯一的

【光通信】基于matlab可见光通信系统的RFID接口过程以及ALOHA防碰撞算法【含Matlab源码 M009期】

4月前

💥💥💥💥💥💥💞💞💞&am

重拾希望:hopeData数据恢复软件——您的数据救援专家

4月前

重拾希望:hopeData数据恢复软件——您的数据救援专家 【下载地址】hopeData数据恢复软件分享 hopeData数据恢复软件.zip 是一款功能强大的数据恢复工具,专为从各种存储设备中恢

u盘文件出现乱码怎么办?数据怎么找回

4月前

u盘文件出现乱码怎么办?u盘是我们常用的一个存储设备,但在使用过程中难免会遇到各种各样的问题,其中u盘文件乱码就是常见的一个,这是什么原因导致的呢&am

Oracle数据库分别在WindowsLinux环境下普通数据泵方式导入导出示例

4月前

1 Linux普通导出入1.1 终端下导出 exp userpwd192.168.100.100dbPro owner(mm_app,mm_sys) fileorabackupdb_201408131200.dmp log or

【任务协同】基于matlab合同网算法无人机任务重规划【含Matlab源码 13064期】

4月前

💥💥💥💥💥💥💞💞💞&am

使用Charles抓包Android App数据

4月前

版权归作者所有,如有转发,请注明文章出处:https:cyrus-studio.github.ioblog 抓包环境准备 1. 下载安装charles charl

数据分析师必看,盘点最常用的四种数据统计分析方法

4月前

在当今数据驱动的商业环境中,数据分析已成为企业获取竞争优势的关键工具。随着数据量的不断增加,企业面临着前所未有的机遇与挑战。通过有效的数据分析,企业可以优化运营效率、提高客户

计算机毕业设计SpringBoot+Vue.js协同过滤算法东北特产销售系统(源码+文档+PPT+讲解)

4月前

温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 温馨提示&#xf

卷王指南,大学计算机专业,面临分专业,计科,软工,大数据,物联网,网络工程,该选什么?

4月前

同学们好,我是王老师——二哥呀!(笑喷) 好巧!前几天有同学私信问过我这个问题:大学计算机专业&#

《CWAP-404》,第7章:MAC操作(7.1,分析数据帧交换)

3月前

数据帧交换是驱动用户使用WLAN的核心操作。用户通常不太关注信标帧(Beacon frames)、探测请求帧(Probe Request frames)

操作系统:银行家算法避免死锁

3月前

银行家算法是用来避免死锁的,该方法将系统的状态分为安全和不安全,只要系统处于安全状态,便可避免死锁的发生。之所以成为银行家算法,是由于该算法能用于银行系

推荐系统之基于用户的协同过滤算法(UserCF)

3月前

从寒假开始接触推荐系统,前期也花了一定的时间去学习了一下python,推荐系统的书籍看的是比较出名的《推荐系统实践》项亮编著。写篇博客,以供日后的学习或使用。 转载请注明出

U盘插入遭遇格式化提示?别急,数据还能救!

3月前

现象描述 当U盘插入电脑,满怀期待地点开却遭遇格式化提示,这一幕想必让不少用户心头一紧。U盘作为便携存储设备,承载着大量重要数据,突如其来的格式化要求

U盘提示格式化后的数据拯救之路

3月前

U盘提示格式化现象解读 在日常使用U盘的过程中,我们有时会遇到一个令人头疼的问题:插入U盘后,系统突然提示需要格式化才能使用。这个提示往往让人措手不及&#xff0c

一键Wipe工具:数据清理与隐私保护指南

2月前

本文还有配套的精品资源,点击获取简介:一键Wipe工具是IT领域中用于彻底清除设备数据、保护隐私和信息安全的重要工具。本文介绍了一键Wipe的功能、工作原理、应用场景、用户界面设计、使用风

【干货教程】在Windows计算机部署DeepSeek大模型,给在实验室无外网的同事们用(基于Ollama和OpenWebUI)

1月前

文章目录 一、前言二、计算机准备三、安装Ollama3.1 访问Ollama官方网站3.2 下载适用于Windows的安装包3.3 安装Ollama安装包3.4 指定Ollama安装目录3.5 指定Ollama的大模型的存储目录 四、Dee

发表评论

全部评论 0
暂无评论