看懂 Java NIO 底层原理
|
〄 自编码器示例。 网络经过训练可以产生与输入相同的输出(从无监督的数据人为创建监督任务)。由于中间有一个故意放置的瓶颈,因此网络无法直接保持原样地传递信息。相反,它必须找到最佳方法来将输入内容保存到一个较小的单元中,以便解码器可以对其进行合理地解码。 经过训练后,编码器和解码器被拆开,可用于解码数据,或者以极小的形式压缩数据。它们也可以用于数据降维。 再举一个例子,考虑大量文本(比如来自数字平台的评论)。通过一些聚类或流形学习方法,我们可以为文本集生成聚类标记,然后将它们视为标记。 在解释了每个聚类之后(例如,聚类 A 代表抱怨产品的评论,聚类 B 代表积极的反馈等),然后可以使用像 BERT 这样的深度自然语言处理(NLP)架构将新文本分类到这些聚类中,所有这些都是在没有标记的数据以及较少人员参与的情况下进行。
这又是将无监督任务转换为监督任务的一种精彩应用。在一个绝大多数数据都是无监督数据的时代,通过混合学习,在监督学习和无监督学习之间建立创造性的联接,具有巨大的潜力和应用价值。 半监督的 GAN(缩写为 SGAN)是对标准对抗网络模型的改进。鉴别器既输出 0/1以判断是否为生成图像,又输出类别信息(multi-output learning)。 基于这样的思想,即通过鉴别器的学习来区分真实图像和生成图像,它能够在没有具体标记的情况下学习数据背后的结构。通过来自少量标记数据的额外增强,半监督模型可以用少量的监督数据来达到最佳性能。 可以在此处阅读有关 SGAN 和半监督学习的更多信息[2]。 GAN 还参与了混合学习的另一个领域 — 自监督学习,其中无监督问题被明确地定义为监督问题。GAN 通过生成器的引入来人为创建监督数据;创建标记以标识真实的/生成的图像。在无人监督的前提下,实施了监督任务。
或者,考虑使用编码器 - 解码器模型进行压缩。形式最简单的一种,就是中间有少量节点的神经网络,表示以某种瓶颈方式的压缩。两侧分别对应编码器和解码器。 引 言 机器学习/深度学习是一个广阔的研究领域,说来并不年轻,但又朝气蓬勃,似乎每天都在涌现大量的新方法和新技术。 一般来说,传统的机器学习可以分为三个基本学习范式,即监督学习、无监督学习以及强化学习。 但在本篇中,我们将现代机器学习根据模型的形式分为新的三个学习范式,即混合学习、复合学习以及简化学习。在每个范式中都包含一种学习方式和理念,它为拓展当前机器学习的能力和研究范围提供了巨大的潜力。
机器学习的未来或许在于这三种学习范式,而每一种都是紧密相关的。 2混合 学习 这种范式试图跨越监督学习和无监督学习之间的界限。由于标签数据缺乏且成本高,因此常常在业务上下文中使用这类方法。从本质上说,混合学习就是下面这个问题的答案, + 如何使用监督方法来解决或结合无监督问题? 首先,半监督学习在机器学习社区中获得了发展,因为它能够以较少的标记数据在监督问题上表现出色。例如,经过精心设计的半监督 GAN(Generative Adversarial Network)在仅查看 25 个训练示例[1]后,在 MNIST 数据集上实现了 90% 以上的准确率。
半监督学习是针对存在大量无监督数据而少量监督数据的数据集而设计的。传统上,将在数据的一部分上训练带监督的学习模型,而在另一部分上训练无监督的模型,而半监督的模型则可以将标记数据与未标记数据中提取的见解(insights)相结合。 (编辑:阜阳站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |


