admin 管理员组文章数量: 1087821
2024年4月15日发(作者:concatente函数的操作)
数据库技术
•
Data Base Technique
基于Lasso和模糊互信息多标记特征选择算法
文/孟金彪 钱萌 李存志 翟静波
空间的模糊互信息,根据模糊互信息的大小对
本文提出一种基于Lasso和
摘
特征依次进行排序,得出最终特征子集。通过
模糊互信息多标记特征选择算法。
要
本文所提的算法在6个多标记数
实验结果表明本文算法是有效的。
据集上进行了测试,实验结果和
统计假设检验说明本文算法是有
1 模糊信息熵
效的。
定义1假设样本空间的描述记为论域U,
论域U可根据某种特征属性进行划分,假设
根据特征属性对论域U进行划
【关键词】多标记学习 模糊互信息 Lasso算
分记,则模糊信息熵定
法 特征选择
义如下:
多标记学习广泛应用于机器学习、人工
(1)
智能等方面。在多标记学习中,数据集往往具
有高维性和高冗余性等特点,从而导致维数灾
其中E(X)为模糊熵,公式(2)中表
难。特征选择作为一种有效的降维方式,其通
示在论域U中等价类X
i
的概率,
过删除冗余或不相关特征来提高分类模型精度
的目的。
表示在论域U中的X
i
的互补概率。
目前,众多学者已提出多种效果较优的
定义2类似的,模糊互信息定义为:
特征选择算法。例如Lee等提出了基于多变量
互信息的多标记特征选择算法(PMU)。Lin
(2)
等提出了基于邻域互信息的多标记特征选择算
2 结合Lasso与模糊互信息的特征选择算
法。
法
然而,上述特征选择算法在选择特征子
集时都有计算开销过大的问题。为解决该问
2.1 基于Lasso算法的特征降维
题,近年来,一种基于线性回归模型的降维方
法-Lasso算法,其因高效的性能在特征选择
Lasso算法是一种同时进行特征选择和正
领域得到了广泛的关注。Lasso通过对变量进
则化的线性回归分析方法,其基本思想是在回
行选择和压缩来降低原始特征空间的维度,该
归系数绝对值之和小于一个阈值的条件下,使
算法的基本思想是在构建线性回归模型时,其
残差平方和最小化,将相关性较低的变量的系
回归系数绝对值之和小于一个阈值的约束条件
数压缩为0,然后删除这些特征变量,从而达
下,使绝对值较小的回归系数自动压缩为0,
到降低特征空间维度的目的。另外,Lasso算
从而得到可解释的模型。另外,在常见的特征
法还能有效的防止过拟合问题。针对多标记学
选择算法中,主要利用传统熵方法来判断特征
习,Lasso构造的函数如下:
与标记空间之间的相关性。但传统信息熵不具
有补的性质,因此,用模糊信息替代传统信息
(3)
熵。在选择特征子集的过程中,为了提高分类
式(3)中,是控制稀疏矩阵
性能的同时并缩减算法计算开销过大的问题,
的参数,Lasso回归是一个
本文首先利用Lasso算法对特征空间降维,求
凸优化问题,但由于其是通过1范式构造的惩
解出每个特征在每个标记下的回归系数,系数
罚函数,因此稀疏矩阵不能直接求解。本论文
为0所对应的特征都视其为冗余特征并将其删
中,将用交替方向乘子法(ADMM)来将式(3)
除,得出新的特征空间。然后结合模糊信息熵
转换为2个子问题求解,式(3)可以利用拉
对新的特征空间中所有特征分别计算其与标记
格朗日形式重新构造为:
●基金项目:基于步态触觉特征的身份识别(2)资助。
186 •
电子技术与软件工程
版权声明:本文标题:基于Lasso和模糊互信息多标记特征选择算法 内容由网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://www.roclinux.cn/p/1713179562a622737.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
更多相关文章
数据丢包怎么修复_网络丢包率高怎么办
展开全部 网络丢包率就是在我们数据包的数据传输过程中,因为中32313133353236313431303231363533e59b9ee7ad9431333365643661途的传输而导致部分数据包被丢失。 1、物理
银行家算法的思路银行家算法
算法思路 先对用户提出的请求进行合法性检查,即检查请求是否大于需要的,是否大 于可利用的。若请求合法,则进行预分配,对分配后的状态调用安全性算法进行 检
数据链路层和网络收尾
在ip层的知识中,有几个遗留问题没有解答,这些问题有助于我们理解整个网络体系。问题1.1 如何理解子网内主机可以直接通信,1.2数据链路层如何解决子网通信的问题。2.1 分片
搜索结果排序算法的研究
一、研究背景 1 、Internet与WWW发展现状 [5] (1)Internet 的发展历程 Internet 的前身是美国国防部高级研究计划署的研究试验性网络ARPANET。1983年TCPIP成为ARPANET上唯一的
【光通信】基于matlab可见光通信系统的RFID接口过程以及ALOHA防碰撞算法【含Matlab源码 M009期】
💥💥💥💥💥💥💞💞💞&am
重拾希望:hopeData数据恢复软件——您的数据救援专家
重拾希望:hopeData数据恢复软件——您的数据救援专家 【下载地址】hopeData数据恢复软件分享 hopeData数据恢复软件.zip 是一款功能强大的数据恢复工具,专为从各种存储设备中恢
u盘文件出现乱码怎么办?数据怎么找回
u盘文件出现乱码怎么办?u盘是我们常用的一个存储设备,但在使用过程中难免会遇到各种各样的问题,其中u盘文件乱码就是常见的一个,这是什么原因导致的呢&am
Oracle数据库分别在WindowsLinux环境下普通数据泵方式导入导出示例
1 Linux普通导出入1.1 终端下导出 exp userpwd192.168.100.100dbPro owner(mm_app,mm_sys) fileorabackupdb_201408131200.dmp log or
【任务协同】基于matlab合同网算法无人机任务重规划【含Matlab源码 13064期】
💥💥💥💥💥💥💞💞💞&am
使用Charles抓包Android App数据
版权归作者所有,如有转发,请注明文章出处:https:cyrus-studio.github.ioblog 抓包环境准备 1. 下载安装charles charl
数据分析师必看,盘点最常用的四种数据统计分析方法
在当今数据驱动的商业环境中,数据分析已成为企业获取竞争优势的关键工具。随着数据量的不断增加,企业面临着前所未有的机遇与挑战。通过有效的数据分析,企业可以优化运营效率、提高客户
计算机毕业设计SpringBoot+Vue.js协同过滤算法东北特产销售系统(源码+文档+PPT+讲解)
温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 温馨提示
卷王指南,大学计算机专业,面临分专业,计科,软工,大数据,物联网,网络工程,该选什么?
同学们好,我是王老师——二哥呀!(笑喷) 好巧!前几天有同学私信问过我这个问题:大学计算机专业&#
《CWAP-404》,第7章:MAC操作(7.1,分析数据帧交换)
数据帧交换是驱动用户使用WLAN的核心操作。用户通常不太关注信标帧(Beacon frames)、探测请求帧(Probe Request frames)
操作系统:银行家算法避免死锁
银行家算法是用来避免死锁的,该方法将系统的状态分为安全和不安全,只要系统处于安全状态,便可避免死锁的发生。之所以成为银行家算法,是由于该算法能用于银行系
推荐系统之基于用户的协同过滤算法(UserCF)
从寒假开始接触推荐系统,前期也花了一定的时间去学习了一下python,推荐系统的书籍看的是比较出名的《推荐系统实践》项亮编著。写篇博客,以供日后的学习或使用。 转载请注明出
U盘插入遭遇格式化提示?别急,数据还能救!
现象描述 当U盘插入电脑,满怀期待地点开却遭遇格式化提示,这一幕想必让不少用户心头一紧。U盘作为便携存储设备,承载着大量重要数据,突如其来的格式化要求
U盘提示格式化后的数据拯救之路
U盘提示格式化现象解读 在日常使用U盘的过程中,我们有时会遇到一个令人头疼的问题:插入U盘后,系统突然提示需要格式化才能使用。这个提示往往让人措手不及,
一键Wipe工具:数据清理与隐私保护指南
本文还有配套的精品资源,点击获取简介:一键Wipe工具是IT领域中用于彻底清除设备数据、保护隐私和信息安全的重要工具。本文介绍了一键Wipe的功能、工作原理、应用场景、用户界面设计、使用风
【干货教程】在Windows计算机部署DeepSeek大模型,给在实验室无外网的同事们用(基于Ollama和OpenWebUI)
文章目录 一、前言二、计算机准备三、安装Ollama3.1 访问Ollama官方网站3.2 下载适用于Windows的安装包3.3 安装Ollama安装包3.4 指定Ollama安装目录3.5 指定Ollama的大模型的存储目录 四、Dee
发表评论