迁移学习基本知识_过拟合和负迁移-程序员宅基地

技术标签: 迁移学习  

本文用于了解迁移学习的基本知识!!!

1. 什么是迁移学习?

迁移学习也称为归纳迁移、领域适配,其目标是将某个领域或任务上学习到的知识或模式应用到不同的但相关的领域或问题中。例如学习走路的技能可以用来学习跑步、学习识别轿车的经验可以用来识别卡车等。

2. 迁移学习的主要思想?

从相关的辅助领域中迁移标注数据或知识结构、完成或改进目标领域或任务的学习效果。

3. 迁移学习研究的意义?

在很多工程实践中,为每个应用领域收集标注数据代价十分昂贵、甚至是不可能的,因此从辅助领域或任务中迁移现有的知识结构从而完成或改进目标领域任务是十分必要的、是源于实践需求的重要研究问题。

4. 迁移学习与传统机器学习相比的特点?

迁移学习放宽了传统机器学习训练数据和测试数据服从独立同分布这一假设,从而使得参与学习的领域或任务可以服从不同的边缘概率分布或条件概率分布。

5. 迁移学习与半监督学习的比较?

虽然传统半监督学习可以解决数据稀疏性,但其要求目标领域存在相当程度的标注数据;当标注数据十分稀缺且获取代价太大时,仍然需要从辅助领域迁移知识来提高目标领域的学习效果。

6. 迁移学习问题的描述?

迁移学习设计领域和任务两个重要概念。

领域D定义为由d维特征空间X和边缘概率分布P(x)组成;

任务T定义为有类别空间Y和预测模型f(x)(条件概率分布)组成

7. 查看领域间概率分布的差异性?

使用PCA方法将两个领域的数据降为二维后进行可视化。

8. 输入空间与特征空间的关系?

所有特征向量存在的空间称为特征空间。特征空间的每一维对应于一个特征,有时假设输入空间与特征空间为相同的空间;有时假设输入空间与特征空间为不同的空间,将实例从输入空间映射到特征空间。

9. 迁移学习的分类?

按照特征空间、类别空间、边缘概率分布、条件概率分布进行分类

分为两大类:异构迁移学习(源领域和目标领域特征空间不同或类别空间不同)、同构迁移学习(源领域和目标领域特征空间相同且类别空间相同)

10. 无监督迁移学习的特征表示法?

无监督迁移学习即目标领域没有标注数据的迁移学习任务。

通过学习新的特征表示Φ(x),使得领域间共享特性增强而独享特性减弱。

其是基于假设:特征空间中的部分特征是领域独享的,而另一部分特征是领域共享的且可泛化的;或者存在一个领域间共享的且可泛化的隐含特征空间,该空间可以由特征学习算法在减小领域间概率分布差异的准则下抽取得到。

特征表示法可分为两个子类:隐含表征学习法和概率分布适配法。

a.隐含特征表示法:通过分析辅助领域和目标领域的大量无标注样例来构建抽象特征表示,从而隐式地缩小领域间的分布差异;

b.概率分布适配法:通过惩罚或移除在领域间统计可变的特征、或通过学习子空间嵌入表示来最小化特定距离函数,从而显式地提升辅助领域和目标领域的样本分布相似度。

11. 迁移学习问题的主要问题挑战?

包括经典机器学习的过拟合、欠拟合问题,以及迁移学习特有的欠适配、负迁移问题;

a.负迁移:辅助领域任务对目标领域任务有负面效果,目前从算法设计角度对负迁移问题研究的主要思想是减少在领域间迁移的知识结构,例如仅在领域间共享模型的先验概率、而不共享模型参数或似然函数。

b.欠适配:跨领域的概率分布适配问题未能充分修正。

c.欠拟合:学习模型未能充分刻划概率分布的重要结构。

d.过拟合:学习模型过度拟合样本分布的无关信息。

总而言之:过拟合和欠拟合针对的是某个领域的学习模型性能好坏,欠适配和负迁移针对的是辅助领域知识结构或模式对目标领域学习模型性能的影响。

12. 现有的概率分布相似性度量函数有哪些?

最大均值差异、布雷格曼散度等。

13. 迁移学习与机器学习的关系?

迁移学习强调的是在不同但是相似的领域、任务和分布之间进行知识的迁移。从本质上讲,迁移学习就是将已有领域的信息和知识运用于不同但相关领域中去的一种新的机器学习方法。迁移学习不要求相似领域服从相同的概率分布,其目标是将源领域里面已有的知识和信息,通过一定的技术手段将这部分知识迁移到新领域中,进而解决目标领域标签样本数据较少甚至没有标签的学习问题。

14. 根据迁移场景将迁移学习分类

归纳迁移学习:源和目标学习任务不同。

直推式迁移学习:源和目标学习任务相同。

无监督迁移学习:目标领域和源领域数据都没有标签。

15. 根据迁移方法将迁移学习分类?

基于模型的迁移学习:通过共享源领域和目标领参数实现迁移。

基于实例的迁移学习:假设源领域的部分数据可通过更新权重,在目标领域得到再利用。

基于特征表示的迁移学习:试图找到原始数据的新特征表示,减小领域间分布差异。

基于相关性知识的迁移学习:把数据间关系从源领域迁移到目标领域。

16. 域适应(域适配)?

属于迁移学习中的同构迁移,即源域和目标域的特征空间和类别空间相同,但数据分布不同。

域适应根据目标领域是否有标签,分为无监督(目标域无标签)和半监督(目标域有少量标签)。

17. 深度迁移学习方法(BA, DDC, DAN)比传统迁移学习方法(TCK, GFK)精度高:

18. 深度学习的可迁移性?

前面几层学习到的是通用的特征(general feature);随着网络层次的加深,后面的网络更偏重于学习任务特定的特征(specifc feature),所以可将通用特征迁移到其它领域。

19. 最简单的深度网络迁移:Finetune(Finetuning,微调)

finetune 就是利用别人已经训练好的网络,固定前面若干层的参数,只针对我们的任务,微调后面若干层。因为在实际的应用中,我们通常不会针对一个新任务,就去从头开始训练一个神经网络。这样的操作显然是非常耗时的。尤其是,我们的训练数据不可能像 ImageNet 那么大,可以训练出泛化能力足够强的深度神经网络。即使有如此之多的训练数据,我们从头开始训练,其代价也是不可承受的。

20. 基于CNN的迁移学习?

在当前计算机视觉领域的任务中,所提出的的方法已普遍使用深度迁移的策略进行预训练。使用大规模图像数据集对深度CNN模型进行训练,比如ImageNet,由于样本和参数的数量都十分庞大,即使使用GPU加速也会花费较长的训练时间。但深度CNN体系结构的另一个优势便是经过预训练的网络模型可以实现网络结构与参数信息的分离,所以只要网络结构一致,便可以利用已经训练好的权重参数构建并初始化网络,极大的节省了网络的训练时间。

步骤:首先在大规模数据集上训练深度CNN模型学习数据集的通用特征,之后通过在新任务的小样本数据集上的网络微调,即保留训练好模型中所有卷积层的参数,只是替换最后一层全连接层。从而可以使网络模型进一步学习到新任务数据集中新的深度卷积特征,最后增加 softmax层可实现分类。

20.Finetune的优点:

a.不需要针对新任务从头开始训练网络,节省了时间成本

b.预训练好的模型通常都是在大数据集上进行的,无形中扩充了我们的训练数据,使得模型更鲁棒、泛化能力更好,提升了训练精度

Finetune的缺点:

a.无法处理训练数据和测试数据分布不同的情况,因为Finetune的基本假设是训练数据和测试数据服从相同的数据分布

21.深度网络自适应迁移:

增加自适应层,然后在这些层加入自适应度量,最后对网络进行Finetune。

参考资料:

 

1. 龙明盛 博士论文《迁移学习问题与方法研究》

2. 张景祥 博士论文《迁移学习技术及其应用研究》

3. 王晋东 《迁移学习简明手册》

 

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/attitude_yu/article/details/79990361

智能推荐

2023.8DataWhale_cv夏令营第三期笔记_逻辑回归需要训练很多轮么-程序员宅基地

文章浏览阅读257次。使用官方提供的脑PET数据集,构建逻辑回归模型来进行脑PET图像的疾病预测,数据集被分为两类,分别为轻度认知障碍(MCI)患者的脑部影像数据和健康人(NC)的脑部影像数据,图像数据格式为nii,因此本赛题可抽象为一个二分类问题。nii是一种常用的医学图像数据格式,主要用于存储和交换神经影像数据。以下是一些主要特点:1.主要用于存储3D(三维)医学图像数据,如MRI(磁共振成像)和CT(计算机断层扫描)图像。2.支持多种数据类型,使得其可以支持不同类型的数据处理和分析。_逻辑回归需要训练很多轮么

通用指南-营销和设计中的增强现实(AR)-程序员宅基地

文章浏览阅读1.2k次,点赞31次,收藏26次。增强现实通常被视为一个利基领域。然而,在过去的两年里,它已经到了一个成熟的阶段,应该在一般的营销堆栈中进行考虑。正如我们所看到的,这个市场是巨大的,而且随着主要参与者向这项技术投入大量投资,它只会继续增长。从苹果到Meta,大公司都相信身临其境的未来,而想要获得成功的营销人员和创意人员也加入了进来。本文第三章,最佳设计实践除了深入讨论AR设计的原则外,还全面推荐了AI设计工具。旨在帮助读者的AI作品脱颖而出。

linux c 网络编程_usage: ./tcp_client hostname-程序员宅基地

文章浏览阅读473次。OSI七层网络模型由下至上为1至7层,分别为:物理层(Physical layer),数据链路层(Data link layer),网络层(Network layer),传输层(Transport layer),会话层(Session layer),表示层(Presentation layer),应用层(Application layer)。1.1 应用层,很简单,就是应用程序。这一层负责_usage: ./tcp_client hostname

Nexus3配置yum代理 pypi代理和npm代理(三合一)_maximum component age-程序员宅基地

文章浏览阅读2.8k次。环境准备安装 maven 安装 java 环境[root@cicd-nexus ~]# wget http://mirrors.tuna.tsinghua.edu.cn/apache/maven/maven-3/3.6.3/binaries/apache-maven-3.6.3-bin.tar.gz[root@cicd-nexus ~]# tar xf apache-maven-3.6.3-bin.tar.gz -C /usr/local/[root@cicd-nexus ~]# tar xf _maximum component age

使用js-xlsx handsontable 分批次导入Excel数据(兼容ie9)_js 导excel 分批写入-程序员宅基地

文章浏览阅读1.6k次。使用js-xlsx handsontable 可以把本地excel 解析到网页上,然后分批次传入后台。在chrome 下 可以参考 https://github.com/SheetJS/js-xlsx 【Browser file upload form element】但需要使用FileReader api 这个只有ie10 才开始支持。兼容ie9 ,ie9需要通过flash 来支持..._js 导excel 分批写入

wxWidgets 自绘按钮(图片+文字)_wxwidgets 中文按钮-程序员宅基地

文章浏览阅读2.5k次。在wxWidgets中,想要通过其本身的控件来实现图片+文件的按钮,貌似不太容易做到。但是可以通过重载wxControl来自绘图片+文件按钮。下面给出的是已经封装好的按钮类:wxBitmapButtonEx.h#ifndef _BITMAP_BUTTON_EX_H#define _BITMAP_BUTTON_EX_H#include "wx/wx.h"enum eBitm_wxwidgets 中文按钮

随便推点

invalidate()和postInvalidate()的区别_postinvalidate和invalidate的区别-程序员宅基地

文章浏览阅读847次。invalidate()与postInvalidate()都用于刷新View,主要区别是invalidate()在主线程中调用,若在子线程中使用需要配合handler;而postInvalidate()可在子线程中直接调用。postInvalidate它是向主线程发送个Message,然后handleMessage时,调用了invalidate()函数。(系统帮我们 写好了 Handle..._postinvalidate和invalidate的区别

计算机表格 求差,Excel表格中求差函数公式怎么用-程序员宅基地

文章浏览阅读9.1k次。excel数据进行分类汇总的步骤在做分类汇总前,我们需要对数据先进行排序,否则分类汇总无法进行。得到排序后的表格。点击上方工具栏中的“数据”→“分类汇总”。在弹出的对话框中选择“分类字段”→“汇总方式”→“决定汇总项”。点击确定出现数据汇总结果。Excel表格中求差函数公式使用的方法第一步:打开Excel表格,单击第一排,第三个“单元格”,也就是C1,在C1中输入“=A1-B1”;第二步:这个公式..._表格求差公式

Linux下OpenCV的安装与测试成功教程(解决E: 无法定位软件包 libjasper-dev、无法找到directory `opencv.pc‘、fatal error:“highgui.h“)_无法定位软件包 libgazebo-dev-程序员宅基地

文章浏览阅读1.5w次,点赞49次,收藏169次。前言好激动,断断续续装了两三天才装上,踩了好多坑。这里把成功安装的步骤详细写下来,如果有小伙伴需要,可以尝试一下,但我不能保证你也可以装好。首先说一下我的各个版本(不谈版本的安装教程都是耍流氓!)是用虚拟机软件:VirtualBOX6.1.30系统版本:ubuntu-20.04.3-desktop-amd64(最小安装模式,中文)OpenCV版本:4.5.5安装时间:2022.2.11下面是步骤1、进入OpenCV的官方下载地址Releases - OpenCV,下载So_无法定位软件包 libgazebo-dev

红帽子粉帽子绿帽子II(递归,递推)-程序员宅基地

文章浏览阅读320次,点赞6次,收藏10次。/是上一个的进化版,相邻的可以一样但是不能都是绿色,注意条件;~~~//仅当笔者个人备忘录使用。

解决Install Intel x86 Emulator Accelerator (HAXM installer) (revision: 7.6.5)“ failed问题-程序员宅基地

文章浏览阅读6.7k次。由于Install Intel x86 Emulator Accelerator (HAXM installer) (revision: 7.6.5)安装失败,导致我的安卓虚拟机无法启动。解决办法有一下几种:1.开机进入BIOS打开Virtual虚拟化功能,然后进入Androidstudio 的SDK manager里面安装HAXM2.关闭系统中的Hyper-v,进入控制面板的程序和功能,将Hyper-v去选即可。3.如果前面的方法都不行,那么建议你重新下载AndroidStudio最新版进行安装_intel x86 emulator

PowerBuilder的语言基础-程序员宅基地

文章浏览阅读1.1w次,点赞2次,收藏15次。 每一种语言都有一组基本的语法约定,POWERBUILDER也不例外。 (1)断行、续行与多条语句 通常情况下,powerbuilder的一条语句是写到一行上的,该条语句在书写完毕之后,按键转到下一行,开始写下一句的内容。也就是说,在PowerBuilder中,使用键作为一行的结束。在PowerBuilder语句比较长的情况下,为了方便阅读,可以使用续行符号把一条语句写到几_powerbuilder