admin 管理员组文章数量: 1184232
2024年4月15日发(作者:concatente函数的操作)
数据库技术
•
Data Base Technique
基于Lasso和模糊互信息多标记特征选择算法
文/孟金彪 钱萌 李存志 翟静波
空间的模糊互信息,根据模糊互信息的大小对
本文提出一种基于Lasso和
摘
特征依次进行排序,得出最终特征子集。通过
模糊互信息多标记特征选择算法。
要
本文所提的算法在6个多标记数
实验结果表明本文算法是有效的。
据集上进行了测试,实验结果和
统计假设检验说明本文算法是有
1 模糊信息熵
效的。
定义1假设样本空间的描述记为论域U,
论域U可根据某种特征属性进行划分,假设
根据特征属性对论域U进行划
【关键词】多标记学习 模糊互信息 Lasso算
分记,则模糊信息熵定
法 特征选择
义如下:
多标记学习广泛应用于机器学习、人工
(1)
智能等方面。在多标记学习中,数据集往往具
有高维性和高冗余性等特点,从而导致维数灾
其中E(X)为模糊熵,公式(2)中表
难。特征选择作为一种有效的降维方式,其通
示在论域U中等价类X
i
的概率,
过删除冗余或不相关特征来提高分类模型精度
的目的。
表示在论域U中的X
i
的互补概率。
目前,众多学者已提出多种效果较优的
定义2类似的,模糊互信息定义为:
特征选择算法。例如Lee等提出了基于多变量
互信息的多标记特征选择算法(PMU)。Lin
(2)
等提出了基于邻域互信息的多标记特征选择算
2 结合Lasso与模糊互信息的特征选择算
法。
法
然而,上述特征选择算法在选择特征子
集时都有计算开销过大的问题。为解决该问
2.1 基于Lasso算法的特征降维
题,近年来,一种基于线性回归模型的降维方
法-Lasso算法,其因高效的性能在特征选择
Lasso算法是一种同时进行特征选择和正
领域得到了广泛的关注。Lasso通过对变量进
则化的线性回归分析方法,其基本思想是在回
行选择和压缩来降低原始特征空间的维度,该
归系数绝对值之和小于一个阈值的条件下,使
算法的基本思想是在构建线性回归模型时,其
残差平方和最小化,将相关性较低的变量的系
回归系数绝对值之和小于一个阈值的约束条件
数压缩为0,然后删除这些特征变量,从而达
下,使绝对值较小的回归系数自动压缩为0,
到降低特征空间维度的目的。另外,Lasso算
从而得到可解释的模型。另外,在常见的特征
法还能有效的防止过拟合问题。针对多标记学
选择算法中,主要利用传统熵方法来判断特征
习,Lasso构造的函数如下:
与标记空间之间的相关性。但传统信息熵不具
有补的性质,因此,用模糊信息替代传统信息
(3)
熵。在选择特征子集的过程中,为了提高分类
式(3)中,是控制稀疏矩阵
性能的同时并缩减算法计算开销过大的问题,
的参数,Lasso回归是一个
本文首先利用Lasso算法对特征空间降维,求
凸优化问题,但由于其是通过1范式构造的惩
解出每个特征在每个标记下的回归系数,系数
罚函数,因此稀疏矩阵不能直接求解。本论文
为0所对应的特征都视其为冗余特征并将其删
中,将用交替方向乘子法(ADMM)来将式(3)
除,得出新的特征空间。然后结合模糊信息熵
转换为2个子问题求解,式(3)可以利用拉
对新的特征空间中所有特征分别计算其与标记
格朗日形式重新构造为:
●基金项目:基于步态触觉特征的身份识别(2)资助。
186 •
电子技术与软件工程
版权声明:本文标题:基于Lasso和模糊互信息多标记特征选择算法 内容由网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://www.roclinux.cn/p/1713179562a622737.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
更多相关文章
简单实用的文件夹防护技巧:用加密为数据上一道“保险锁”
在使用电脑的过程中,我们会使用文件夹来管理各种文件,避免电脑数据混乱。而为了保护文件夹的数据安全,我们需要加密保护文件夹。下面我们就来了解一下文件夹加密的方法。电脑文件夹加密方法EFS是微软提供的数据加密方式,
文件夹不安全?试试这个简单的加密方法保护你的隐私
在使用电脑的过程中,我们会使用文件夹来管理各种文件,避免电脑数据混乱。而为了保护文件夹的数据安全,我们需要加密保护文件夹。下面我们就来了解一下文件夹加密的方法。电脑文件夹加密方法EFS是微软提供的数据加密方式,
小技巧大用处:一招搞定Vista OEM系统免激活,避开内存和BIOS误区
顶一下,贴上我最近在看雪写的文章 标 题: 【原创】不修改Bios完成OEM版Vista系统免激活作 者: 火翼[CCG] 时 间:
嵌入式系统通讯指南:从IIC到SPI,一文带你领略数据传输的魅力
本文简单的描述了在实际应用中会碰到的一些总线协议,让各位读者对实际系统中的总线有个概念上的理解。 一、I2C I2C(Inter - Integrated Circuit)
小白也能懂!iPad mini2回滚至10.3.3版的操作流程详解
一、爱思刷机后有开屏密码嚒 使用爱思助手进行刷机操作后,设备上的锁屏密码将会被清除。这是因为刷机过程中会重新安装操作系统,从而移除所有之前设置的密码和用户数据。但是,如果在刷机过程中勾选了“保留用户资料刷机”的选项,那么刷机完
iPad mini2降级教程:从头学起,轻松搞定至10.3.3系统版!
一、爱思刷机后有开屏密码嚒 使用爱思助手进行刷机操作后,设备上的锁屏密码将会被清除。这是因为刷机过程中会重新安装操作系统,从而移除所有之前设置的密码和用户数据。但是,如果在刷机过程中勾选了“保留用户资料刷机”的选项,那么刷机完
面对Linux分区崩溃?TestDisk助你稳住局面,找回数据安全
简介:Linux分区表是存储磁盘分区信息的关键部分,一旦损坏会导致数据丢失。本文介绍testdisk这一开源工具,它支持MBR和GPT等多种分区格式,适用于恢复丢失分区、重建启动扇区,甚至挽救数据。文中详细说明了如何安装和使用test
从繁复到简单——使用Leaf快速完成Flash资源自动化备份与恢复
Leaf备份系统:自动备份与恢复
解密嵌入式领域:Bin、Hex与Axf三种格式的核心区别与使用场景
嵌入式开发必懂:bin、hex、axf格式的核心区别与应用场景 你有没有想过,当你把程序下载到单片机时,那些后缀名不同的文件(.bin、.hex、.axf)到底藏着什么秘密?为什么同样的代码会生成不同格式的文件?今天就来扒开这
GIS新知:快速上手指南带你玩转空间数据处理
1. 从零开始:GIS文件格式到底是什么? 如果你刚接触GIS(地理信息系统),可能会被一堆文件格式搞得晕头转向。别担心,这很正常。简单来说,GIS文件格式就是用来存储地理空间数据的“容器”,就像我们平时用的Word文档存文字
探索GIS文件的秘密武器,解析技巧与应用秘籍
1. 从零开始:GIS文件格式到底是什么? 如果你刚接触GIS(地理信息系统),可能会被一堆文件格式搞得晕头转向。别担心,这很正常。简单来说,GIS文件格式就是用来存储地理空间数据的“容器”,就像我们平时用的Word文档存文字
Web应用中剪贴板交互的秘密武器:深入解析Document.execCommand与Clipboard API的使用
在操作系统级别,剪贴板允许应用程序之间传输数据。 在现代web应用中,提供 复制、 剪切、 粘贴等与剪贴板交互的功能已成为标配,极大的提高了用户的便利性。
一文掌握:利用Windows剪贴板与clipbrd工具提升工作生产力的实战指南
简介:Windows剪贴板是操作系统中用于不同程序间传递信息的核心组件。本文将介绍其基本概念、格式多样性、clipbrd工具的功能及使用方法,以及HTML FORMAT与剪贴板的交互。剪贴板工具对于开发者、故障排查和用户体验研究等场景
解析Canon CR2文件:揭秘cr2 ifd0的关键
首先是8个字节的文件头。 CR2的前2个字节是"II",代表INTEL格式的存储顺序,即低字节在前,高字节在后。 接下来是固定的2个字节:0x2a00。 最后的4个字节的整数是指向第一个IFD(I
硬盘坏了,数据要凉凉了吗?——硬盘坏道数据恢复,找回丢失数据的希望!
电脑硬盘坏了数据可以恢复吗?对于这种问题,还需要具体问题具体分析的,一般是可以恢复。 硬盘损坏可以分为物理损坏和逻辑损坏两种情况: 1.逻辑损坏 这通常是由于软件问题,如文件系统错误、病毒攻击、误删除、格式化等
Adobe Flash Player与SWF:一段从技术到应用的旅程
一、Application Data简介Applicaion Data相当于桌面应用的注册表,存储一些用户配置信息,如运行时状态,用户喜好等,需要注意的时, 当卸载应用时,这些数据会被删除,所以不要存储重要数
深入I.MX6U:Linux启动方式的实战指南
第九章I.MX6U启动方式详解 I.MX6U支持多种启动方式以及启动设备,比如可以从SDEMMC、NAND Flash、QSPI Flash等启动。用户可以根据实际情况,选择合适的启动设备。不同的启动方式其启动方式和启动要求
Go与Linux通信基础:strace与read操作的深入解读
大家好,我是码农先森。 前言 各种编程语言百花齐放、百家争鸣,但是 “万变不离其中”。对于网络通信而言,每一种编程语言的实现方式都不一样;但其实,调用的底层逻辑都是一样的。linux 系统底层向上提供了统一的 Sock
redis 的内存清理_redis清理100g的数据要多久
一个示例 ❓ redis中,set一个值,有效期为 3600 秒,这个值会什么时候释放? 常规理解为,在 3600 秒到期后,redis服务会自动清除, 也就意味着,redis需要有一个机制,每隔一个时间极短的
有关webscraper的问题,看这个就够了_web scraper
视频教程: 可能有朋友不知道webscraper,我再介绍一下: webscraper 一一款谷歌插件,可以方便的抓取网页上的内容:文字、链接、图片、表格等,而无需写一行代码。 webscrap
发表评论