特征选择（区别于特征提取）

特征选择和特征提取的异同

先来看一张特征工程的图。

特征选择和特征提取都是特征工程下，对于多特征的预处理。

其共同的目的是：

特征提取和特征选择统称为降维。（）（针对于the curse of (维度灾难)，都可以达到降维的目的。）

看一下，以下的图片：

用数学的话来解释：

特征选择后的特征是原来特征的一个子集。

特征提取后的新特征是原来特征的一个映射。

用通俗的话来解释他们的不同：

打比方来说：

有长、宽两个特征，特征选择是根据模型的目标来选择长这个特征或者选择宽这个特征，而特征提取是把长和宽两个特征提取成面积这个“新特征”。

接下来回归主题，讲讲特征选择。

参考文献：[Peng, H.Long, F.Ding, C. for .1997]

特征选择

产生过程（搜索过程）

（或可理解为搜索特征子集的过程）。

完全式/穷举式：根据评价函数从2^n个候选子集中选出最优的。能够找到最优解，但其缺点是它会带来巨大的计算开销，尤其当特征数比较大的时候，计算时间很长。

序列式：它避免了简单的穷举式的搜索，在搜索过程中依据某种次序（比如向前、向后）向当前特征子集中添加或删除特征，从而获得优化过的特征子集。典型的算法有：向前向后搜索、浮动搜索、双向搜索等。算法的优点是比较容易实现，计算的负责度相对较小（时间复杂度为O（2^n）），但容易局部最优。

随机式：从某个候选特征子集开始，依照一定的启发式信息和规则逼近全局最优解（注意不是最优解，而是逼近最优）。例如：遗传算法、模拟退火算法、粒子群算法和免疫算法等。

评价函数距离度量（欧氏距离等）信息度量（信息增熵）依赖性度量（相关性）——特征K与C类的相关性大于特征Y与C的相关性，则特征K优先于特征Y。举例子来说，喉结这个特征与男性类的相关性大于身高这个特征，则喉结特征优先于特征Y。一致性度量（没搞明白，待续）分类错误率

生成过程（搜索过程）+不同的评价函数=特征选择方法

停止准则

产生过程（搜索过程）对于停止准则：

评价函数对于停止准则：

问题和思考

坐标横竖轴表示不同的特征，条形图的高度为统计不同样本的数量，散点图的点和小圆圈表示样本，以下问题皆如此

结论一：通过添加可能冗余的变量，可以降低噪声，从而实现更好的类分离。

结论二：

完全相关的变量确实是冗余的；非常高的变量相关性(或反相关性)并不意味着没有变量互补性。2. 非常高的变量相关性(或反相关性)并不意味着没有变量互补性。

结论三：

当与其他变量一起使用时，完全无用的变量本身可以提供显著的性能改进；无用的变量+无用的变量=有用的变量。

你可能想看：

特征选择与特征提取

对特性进行归一化，确保所有特性都在相同范围内。选择K个最佳特性。在这个例子中，我们选择了10个最好的特征。最后，打印所选特征。请注意，这只是一个简单的样例代码，实际上有时需要根据数据集的特征进行调整。

霹雳舞到底是一个怎样的舞种？其区别于其它舞种的特征是什么？

街舞包括很多舞种，如hiphop、Poppin、jazz、urban、locking、breaking等等。Locking（锁舞）起源于60年代，由Don Cambell领衔的The Lockers团...

如何提取背景音乐？背景音乐提取工具推荐！

Background Music Abstractor 是一款简单好用的背景音乐提取工具，使用非常方便，通过Ai算法从mp3文件中提取obbligato。选择保存背景音乐的目标文件夹和文件名，点击“保...

15网盘提取码:如何使用115网盘提取码下载应用攻略？

通过115提取码下载的方式有很多，点击文件页面的优蛋下载选框，就会直接弹出优蛋下载器，直接进行下载。直接输入提取码或文件页面网址，否则下载无法进行。点击普通下载选项就可以进行最原始的浏览器下载，必须等...

腾讯-微博地址提取QQ程序--1秒钟快速从微薄地址中提取出QQ号码

QQ号码腾讯微博看到个美女，不知道QQ号码怎么办？用子寒微博提取QQ软件，能快速通过软件把微博地址提取出QQ号码，让你顺利的认识美女！QQ”的软件，但真正下载下来却发现基本都不管用，剩下的就是没有教程...

提取罐河北公积金怎么提取

文章目录：怎么提取图片上的文字河北公积金怎么提取一、怎么提取图片上的文字若是使用的vivo手机，可以参考以下提取图片中的文字的方法：智慧视觉：进入相册打开图片--更多--识图--调节识别区域--提取文...

重金悬赏：行为意思、表示意思、效果意思三者之间的区别于联系

（一）行为意思：是指明法律行为具体内容的意思要素，如买卖合同中买卖标的物就是目的意思。（三）表示行为：当事人要将目的意思、效果意思以一定的方式表示于外，如买卖合同中发出要约、承诺的行为。前二者为主观要...

2023年6月21日—2023年6月21日征选类型

在北京的单读编辑部今年春天吃了一些土，但今年已经公开的数据证实冰面正以更快的速度融化，能源结构转型在这一过程中起着重要作用“可再生能源的使用是应对气候变化的重要途径。呼吁用创作和行动，关注和探讨如何通...

你觉得邓丽君除了声音美，外貌是不是也属于特别美的那种？

邓丽君是老一代的歌手传承，老上海的歌曲风格，为什么当初说是靡靡之音？就是夜总会的歌曲，听听陈歌辛的词曲或周旋，都能听出影子。罗大佑都坦言陈歌辛对他音乐上影响巨大。邓丽君是集大成者，唱功了得...

棉纺行业内的细纱保全工是否应属于特殊工种？

纺织行业目前来说除了一些有毒有害的特殊工种外，并没有特别繁重的特殊工种。据我所知，除了当时广东向国家劳动总局，打过报告，请示将挡车工列入特别繁重劳动工种之外，并没有其他的特别繁重工作工种。通过观察文件...

人脸识别属于特异大脑功能

人具有根据他人的面部特征来区分不同人的能力，但这种识别人脸的能力和识别其他类似物体的能力是否来自同一大脑功能，人类识别人面的能力和识别非人脸目标不是同样的大脑功能。那就是人面识别和物体识别属于同一大脑...

关于特发性血小板减少性紫癜的问题

刚发现这个IBP6网站就用她的号码浏览了很多帖子，很高兴看到这么多姐姐的热心帖子。我也想告诉大家，请耐心地看病例。谢谢。无痛无痒，第二天晚上手臂和腿上有10多个红点，采血检查两次血小板只有7个(700...

民调：拜登在五个关键州的支持率落后于特朗普

据美国“纽约时报”11月6日报道，该报近日与锡耶纳学院进行的民意调查显示，美国民主党籍总统拜登在六个关键州中有五个州的支持率落后于竞争对手、共和党籍前总统特朗普。中新网11月6日电(信莲)两人此前已宣...

热带季风气候特征热带季风气候特征是什么

　　导读：本文将对热带季风气候的特征进行详细介绍，包括其定义、形成原因、典型特征以及其他相关内容。　　一、定义　　热带季风气候又称为亚热带季风气候，是位于赤道附近的一种气候类型。它的特征是季节性的降雨...

女性消费有哪些女性消费心理特征 [现代女性的十大消费心理特征]

女性无论是个人消费还是家庭消费都表现出“冲动”和非理性，也就是说，女性的购买意愿在很大程度上受到直觉感觉的影响，容易因商品名称、设计、价格、广告宣传、促销活动、环境因素、服务因素等而产生购买行为。很常...

在将ajax与Django形式一起使用时，出现错误“选择一个有效的选择。那不是可用的选择之一。”

semester = forms.ChoiceField(sem_choices;widget=forms.Select());c_id);current_course = feedback_form...

驾照选择题里应该怎么选择科目一选择题答题技巧？

科目选择解答技巧？1、选择题、判断题上附有这些文字都是正确的：不可、不可、不准确、无用、停车避让、减速让行，依次排队等候，系好安全带，及时、保护现场，间歇性轻踩、右行驶，轮流。这些文字装的都是错的。立...

如何提取迅雷看看缓存中的视频？

尊敬的迅雷用户，您好：迅雷看看目前设置会在您观看影片时缓存下载到电脑中，确保不让网速的快慢影响到观看时的流畅感，为确保影片的完整请不要加速快进。您可以在打开迅雷看看播放器界面后，点击左上角的标志——设...

如何从一篇文章中提取出关键词，有哪些经验分享吗？

提取文章关键词，主要是提炼文章问题的主要内容。比如叙事类主要关键词是表述事件的，基本是发生了什么事，最显著的特征是什么？说明性的文章,主要关键词就是一解释说明为主。议论性的文章主要关键词就是议论的观点...

如何从赤铁矿中提取铁

赤铁矿是一种弱磁性铁矿石，比磁铁矿具有更好的可浮性和广泛的分布。是提炼铁的重要原料之一。除了含有少量磁铁矿外，赤铁矿的杂质嵌入粒度不均匀，细粒含量高，因此从赤铁矿中提取铁需要一些选矿方法。赤铁矿提铁的...

标签: 特征变量提取算法准则

分享给朋友：

问答百科

特征选择（区别于特征提取）

Copyright © 2024 问答百科网 All Rights Reserved.
蜀ICP备11000655号-9