admin 管理员组

文章数量: 1184232


2024年4月15日发(作者:concatente函数的操作)

数据库技术

Data Base Technique

基于Lasso和模糊互信息多标记特征选择算法

文/孟金彪 钱萌 李存志 翟静波

空间的模糊互信息,根据模糊互信息的大小对

本文提出一种基于Lasso和

特征依次进行排序,得出最终特征子集。通过

模糊互信息多标记特征选择算法。

本文所提的算法在6个多标记数

实验结果表明本文算法是有效的。

据集上进行了测试,实验结果和

统计假设检验说明本文算法是有

1 模糊信息熵

效的。

定义1假设样本空间的描述记为论域U,

论域U可根据某种特征属性进行划分,假设

根据特征属性对论域U进行划

【关键词】多标记学习 模糊互信息 Lasso算

分记,则模糊信息熵定

法 特征选择

义如下:

多标记学习广泛应用于机器学习、人工

(1)

智能等方面。在多标记学习中,数据集往往具

有高维性和高冗余性等特点,从而导致维数灾

其中E(X)为模糊熵,公式(2)中表

难。特征选择作为一种有效的降维方式,其通

示在论域U中等价类X

i

的概率,

过删除冗余或不相关特征来提高分类模型精度

的目的。

表示在论域U中的X

i

的互补概率。

目前,众多学者已提出多种效果较优的

定义2类似的,模糊互信息定义为:

特征选择算法。例如Lee等提出了基于多变量

互信息的多标记特征选择算法(PMU)。Lin

(2)

等提出了基于邻域互信息的多标记特征选择算

2 结合Lasso与模糊互信息的特征选择算

法。

然而,上述特征选择算法在选择特征子

集时都有计算开销过大的问题。为解决该问

2.1 基于Lasso算法的特征降维

题,近年来,一种基于线性回归模型的降维方

法-Lasso算法,其因高效的性能在特征选择

Lasso算法是一种同时进行特征选择和正

领域得到了广泛的关注。Lasso通过对变量进

则化的线性回归分析方法,其基本思想是在回

行选择和压缩来降低原始特征空间的维度,该

归系数绝对值之和小于一个阈值的条件下,使

算法的基本思想是在构建线性回归模型时,其

残差平方和最小化,将相关性较低的变量的系

回归系数绝对值之和小于一个阈值的约束条件

数压缩为0,然后删除这些特征变量,从而达

下,使绝对值较小的回归系数自动压缩为0,

到降低特征空间维度的目的。另外,Lasso算

从而得到可解释的模型。另外,在常见的特征

法还能有效的防止过拟合问题。针对多标记学

选择算法中,主要利用传统熵方法来判断特征

习,Lasso构造的函数如下:

与标记空间之间的相关性。但传统信息熵不具

有补的性质,因此,用模糊信息替代传统信息

(3)

熵。在选择特征子集的过程中,为了提高分类

式(3)中,是控制稀疏矩阵

性能的同时并缩减算法计算开销过大的问题,

的参数,Lasso回归是一个

本文首先利用Lasso算法对特征空间降维,求

凸优化问题,但由于其是通过1范式构造的惩

解出每个特征在每个标记下的回归系数,系数

罚函数,因此稀疏矩阵不能直接求解。本论文

为0所对应的特征都视其为冗余特征并将其删

中,将用交替方向乘子法(ADMM)来将式(3)

除,得出新的特征空间。然后结合模糊信息熵

转换为2个子问题求解,式(3)可以利用拉

对新的特征空间中所有特征分别计算其与标记

格朗日形式重新构造为:

●基金项目:基于步态触觉特征的身份识别(2)资助。

186 •

电子技术与软件工程

本文标签: 特征 数据 算法 进行 实验室

更多相关文章

简单实用的文件夹防护技巧:用加密为数据上一道“保险锁”

1月前

在使用电脑的过程中,我们会使用文件夹来管理各种文件,避免电脑数据混乱。而为了保护文件夹的数据安全,我们需要加密保护文件夹。下面我们就来了解一下文件夹加密的方法。电脑文件夹加密方法EFS是微软提供的数据加密方式,

文件夹不安全?试试这个简单的加密方法保护你的隐私

1月前

在使用电脑的过程中,我们会使用文件夹来管理各种文件,避免电脑数据混乱。而为了保护文件夹的数据安全,我们需要加密保护文件夹。下面我们就来了解一下文件夹加密的方法。电脑文件夹加密方法EFS是微软提供的数据加密方式,

小技巧大用处:一招搞定Vista OEM系统免激活,避开内存和BIOS误区

1月前

顶一下,贴上我最近在看雪写的文章 标 题: 【原创】不修改Bios完成OEM版Vista系统免激活作 者: 火翼[CCG] 时 间:

嵌入式系统通讯指南:从IIC到SPI,一文带你领略数据传输的魅力

1月前

本文简单的描述了在实际应用中会碰到的一些总线协议,让各位读者对实际系统中的总线有个概念上的理解。 一、I2C I2C(Inter - Integrated Circuit)

小白也能懂!iPad mini2回滚至10.3.3版的操作流程详解

1月前

一、爱思刷机后有开屏密码嚒 使用爱思助手进行刷机操作后,设备上的锁屏密码将会被清除。这是因为刷机过程中会重新安装操作系统,从而移除所有之前设置的密码和用户数据。但是,如果在刷机过程中勾选了“保留用户资料刷机”的选项,那么刷机完

iPad mini2降级教程:从头学起,轻松搞定至10.3.3系统版!

1月前

一、爱思刷机后有开屏密码嚒 使用爱思助手进行刷机操作后,设备上的锁屏密码将会被清除。这是因为刷机过程中会重新安装操作系统,从而移除所有之前设置的密码和用户数据。但是,如果在刷机过程中勾选了“保留用户资料刷机”的选项,那么刷机完

面对Linux分区崩溃?TestDisk助你稳住局面,找回数据安全

1月前

简介:Linux分区表是存储磁盘分区信息的关键部分,一旦损坏会导致数据丢失。本文介绍testdisk这一开源工具,它支持MBR和GPT等多种分区格式,适用于恢复丢失分区、重建启动扇区,甚至挽救数据。文中详细说明了如何安装和使用test

从繁复到简单——使用Leaf快速完成Flash资源自动化备份与恢复

1月前

Leaf备份系统:自动备份与恢复

解密嵌入式领域:Bin、Hex与Axf三种格式的核心区别与使用场景

1月前

嵌入式开发必懂:bin、hex、axf格式的核心区别与应用场景 你有没有想过,当你把程序下载到单片机时,那些后缀名不同的文件(.bin、.hex、.axf)到底藏着什么秘密?为什么同样的代码会生成不同格式的文件?今天就来扒开这

GIS新知:快速上手指南带你玩转空间数据处理

1月前

1. 从零开始:GIS文件格式到底是什么? 如果你刚接触GIS(地理信息系统),可能会被一堆文件格式搞得晕头转向。别担心,这很正常。简单来说,GIS文件格式就是用来存储地理空间数据的“容器”,就像我们平时用的Word文档存文字

探索GIS文件的秘密武器,解析技巧与应用秘籍

1月前

1. 从零开始:GIS文件格式到底是什么? 如果你刚接触GIS(地理信息系统),可能会被一堆文件格式搞得晕头转向。别担心,这很正常。简单来说,GIS文件格式就是用来存储地理空间数据的“容器”,就像我们平时用的Word文档存文字

Web应用中剪贴板交互的秘密武器:深入解析Document.execCommand与Clipboard API的使用

1月前

在操作系统级别,剪贴板允许应用程序之间传输数据。 在现代web应用中,提供 复制、 剪切、 粘贴等与剪贴板交互的功能已成为标配,极大的提高了用户的便利性。

一文掌握:利用Windows剪贴板与clipbrd工具提升工作生产力的实战指南

1月前

简介:Windows剪贴板是操作系统中用于不同程序间传递信息的核心组件。本文将介绍其基本概念、格式多样性、clipbrd工具的功能及使用方法,以及HTML FORMAT与剪贴板的交互。剪贴板工具对于开发者、故障排查和用户体验研究等场景

解析Canon CR2文件:揭秘cr2 ifd0的关键

18天前

首先是8个字节的文件头。 CR2的前2个字节是"II",代表INTEL格式的存储顺序,即低字节在前,高字节在后。 接下来是固定的2个字节:0x2a00。 最后的4个字节的整数是指向第一个IFD(I

硬盘坏了,数据要凉凉了吗?——硬盘坏道数据恢复,找回丢失数据的希望!

18天前

电脑硬盘坏了数据可以恢复吗?对于这种问题,还需要具体问题具体分析的,一般是可以恢复。 硬盘损坏可以分为物理损坏和逻辑损坏两种情况: 1.逻辑损坏 这通常是由于软件问题,如文件系统错误、病毒攻击、误删除、格式化等

Adobe Flash Player与SWF:一段从技术到应用的旅程

17天前

一、Application Data简介Applicaion Data相当于桌面应用的注册表,存储一些用户配置信息,如运行时状态,用户喜好等,需要注意的时, 当卸载应用时,这些数据会被删除,所以不要存储重要数

深入I.MX6U:Linux启动方式的实战指南

17天前

第九章I.MX6U启动方式详解 I.MX6U支持多种启动方式以及启动设备,比如可以从SDEMMC、NAND Flash、QSPI Flash等启动。用户可以根据实际情况,选择合适的启动设备。不同的启动方式其启动方式和启动要求

Go与Linux通信基础:strace与read操作的深入解读

17天前

大家好,我是码农先森。 前言 各种编程语言百花齐放、百家争鸣,但是 “万变不离其中”。对于网络通信而言,每一种编程语言的实现方式都不一样;但其实,调用的底层逻辑都是一样的。linux 系统底层向上提供了统一的 Sock

redis 的内存清理_redis清理100g的数据要多久

10天前

一个示例 ❓ redis中,set一个值,有效期为 3600 秒,这个值会什么时候释放? 常规理解为,在 3600 秒到期后,redis服务会自动清除, 也就意味着,redis需要有一个机制,每隔一个时间极短的

有关webscraper的问题,看这个就够了_web scraper

9天前

视频教程: 可能有朋友不知道webscraper,我再介绍一下: webscraper 一一款谷歌插件,可以方便的抓取网页上的内容:文字、链接、图片、表格等,而无需写一行代码。 webscrap

发表评论

全部评论 0
暂无评论