- 深度 | David Silver 全面解读深度强化学习:从基础概念到 AlphaGo
- 深度 | 深度学习漫游指南:强化学习概览
- 重磅 | 详解深度强化学习,搭建DQN详细指南(附论文)
- 独家 | 吴恩达NIPS 2016演讲现场直击:如何使用深度学习开发人工智能应用?
- 深度 | 迁移学习全面概述:从基本概念到相关研究
- 深度 | 理解深度学习中的卷积
- 专访 | 东南大学漆桂林教授:知识图谱不仅是一项技术,更是一项工程
- 综述 | 知识图谱研究进展
- 盘点 | 机器学习入门算法:从线性模型到神经网络
- 深度神经网络全面概述:从基本概念到实际模型和硬件基础
- 想了解概率图模型?你要先理解图论的基本定义与形式
- 机器理解大数据的秘密:聚类算法深度详解
- 图灵测试通过事件的噱头以及沉思
- 重磅 | DeepMind 最新生成模型 WaveNet,将机器合成语音水平与人类差距缩小 50%(附论文)
- 谷歌最新的全端到端语音合成系统
- 人工智能能骗过人类吗?愚人节特写:这不是玩笑
- 三张图读懂机器学习:基本概念、五大流派与九种常见算法
- LSTM 入门必读:从基础知识到工作方式详解
- 从语言学到深度学习 NLP 一文概述自然语言处理
- 最全的 DNN 概述论文:详解前馈、卷积和循环神经网络技术
- 从贝叶斯定理到概率分布:综述概率论基本定义
- 追根溯源!一图看尽深度学习架构谱系
- 徒手实现 CNN:综述论文详解卷积网络的数学本质
- 读懂概率图模型:你需要从基本概念和参数估计开始
- 从零开始:教你如何训练神经网络
- 开发者必读:计算机科学中的线性代数
- 学界 | 定量研究:当前机器学习领域十大研究主题
- 机器学习和深度学习引用量最高的 20 篇论文(2014-2017)
- 从贝叶斯角度,看深度学习的属性和改进方法
- 良心 GitHub 项目:各种机器学习任务的顶级结果(论文)汇总
- 深度 | 从朴素贝叶斯到维特比算法:详解隐马尔科夫模型
- 揭秘深度学习成功的数学原因:从全局最优性到学习表征不变性
- 深度 | 从 AlexNet 到残差网络,理解卷积神经网络的不同架构
- 从 Pix2Code 到 CycleGAN:2017 年深度学习重大研究进展全解读
- OpenAI 详解进化策略方法:可替代强化学习
- 从自编码器到生成对抗网络:一文纵览无监督学习研究现状
- 资源 | 从文本到视觉:各领域最前沿的论文集合
- 从决策树到随机森林:树型算法的原理与实现
- 从概率论到多分类问题:综述贝叶斯统计分类
- 从遗传算法到 OpenAI 新方向:进化策略工作机制全解
- 综述 | 一文帮你发现各种出色的 GAN 变体
- 资源 | 生成对抗网络及其变体的论文汇总
- 生成对抗网络综述:从架构到训练技巧,看这篇论文就够了
- 干货 | 物体检测算法全概述:从传统检测方法到深度神经网络框架
- 重磅 | 自动驾驶计算机视觉研究综述:难题、数据集与前沿成果(附 67 页论文下载)
- 神经风格迁移研究概述:从当前研究到未来方向(附论文和代码)
- 深度学习目标检测模型全面综述:Faster R-CNN、R-FCN 和 SSD
- 计算机视觉这一年:这是最全的一份 CV 技术报告
- 计算机视觉这一年:2017 CV 技术报告 Plus 之卷积架构、数据集与新趋势
- 深度 | 2017 CV 技术报告之图像分割、超分辨率和动作识别
- 深度 | 2017CV 技术报告:从 3D 物体重建到人体姿态估计
- 语音合成到了跳变点?深度神经网络变革 TTS 最新研究汇总
- 资源 | 从全连接层到大型卷积核:深度学习语义分割全指南
- 学界 | 词嵌入 2017 年进展全面梳理:趋势和未来方向
- 深度 | 一文概述 2017 年深度学习 NLP 重大进展与趋势
- 学界 | 一文综述所有用于推荐系统的深度学习方法
- 使用深度学习构建先进推荐系统:近期 33 篇重要研究概述
- 业界|谷歌 TensorFlow 的一份全面评估报告:好的坏的及令人讨厌的
- 初学者怎么选择神经网络环境?对比 MATLAB、Torch 和 TensorFlow
- 业界 | 剖析用于深度学习的硬件:GPU、FPGA、ASIC 和 DSP
- 神经形态计算与神经网络硬件最全调查:从研究全貌到未来前景
- 从 GPU、TPU 到 FPGA 及其它:一文读懂神经网络硬件平台战局
- 从浅层模型到深度模型:概览机器学习优化算法
- 综述论文:当前深度神经网络模型压缩和加速方法速览
- 深度 | 从修正 Adam 到理解泛化:概览 2017 年深度学习优化算法的最新研究进展
- 一文概览深度学习中的五大正则化方法和七大优化策略
- 从强化学习基本概念到 Q 学习的实现,打造自己的迷宫智能体
- 回归、分类与聚类:三大方向剖解机器学习算法的优缺点(附 Python 和 R 实现)
- 基于 TensorFlow 理解三大降维技术:PCA、t-SNE 和自编码器
- 一文读懂遗传算法工作原理(附 Python 实现)
- 10 大深度学习架构:计算机视觉优秀从业者必备(附代码实现)
- 从算法到训练,综述强化学习实现技巧与调试经验
- 2017 年度盘点:15 个最流行的 GitHub 机器学习项目
学界 | 定量研究:当前机器学习领域十大研究主题
论文地址:https://arxiv.org/abs/1703.10121
机器学习研究中常探索哪些话题?这个问题曾于 2007 年通过在杰出的研究者中做定性调查第一次得出过答案。在本文的研究中,我们从定量的角度回答这个问题。具体来说,我们收集了 54,000 篇论文的摘要,它们都是在 2007 至 2016 年间于重要的机器学习期刊和会议上发表的文章。随后,我们用机器学习算法确定了机器学习领域中排名前十的研究主题。不局限于模型,我们提供了涵盖优化、数据、特征等方面的整体视角。这种定量方法减少了调查偏差。关于什么是机器学习领域最流行的前十个主题,该方法提供了全新的以及与时俱进的观察视角。我们的方法可以找到这一领域最流行的话题,为研究者们选定方向提供帮助。
前言
2007 年,一篇名为《数据挖掘排名前十的算法(Top 10 algorithms in data mining)》的论文指出并介绍了在数据科学领域中排名前十的最有影响力的数据挖掘算法。它通过整合获奖研究者的提名、研究社区的观点以及谷歌学术的被引量来计算权重。在这项工作中,排名前十的算法为:C4.5, K-均值(k-means),支持向量机(SVM),Apriori,EM,PageRank,AdaBoost,KNN,朴素贝叶斯(naive Bayes)以及 CART。
在接下来的十年中,与计算机硬件能力的发展以及商业应用问题的大量增长同步,机器学习技术得到发展。源于对主要期刊及会议的定量分析,本文研究回顾了机器学习研究领域内排名前十的流行研究方向。本研究涵盖了一些更广泛范围内的研究主题,不仅包括模型,还包括像数据集,特征,优化技术以及评价矩阵这样的概念。
由于文献多关注模型,这种在整个机器学习领域内更广阔的视野在文献中大部分都被忽略了。在这项研究中,我们主要的贡献在于通过定量方法提供了一种关于机器学习活跃的研究领域的清晰观点,其中并不掺杂个人观点。这种尝试旨在减少偏差并寻找研究社区真正的关注焦点。这项研究的结果让我们可以把自己的研究放在机器学习的全局范围内重新审视。这为研究者提供了研究流行课题以及辨识那些在最近的研究中没有获得充分关注的课题的机会。

表 1:参考期刊

表 2:参考会议
结果
采用以二元语法和三元语法作为提取策略的方法 1,我们仅得到了很普遍的研究主题。具体来说,排名前五的研究主题为「网络预处理」,「监督分类部分」,「学习二值表达」,「非监督和监督学习」以及「从输入中预测标签」。作为对比,施行采用 RAKE 进行基于机器学习的关键词提取的方法 2,我们得到了如图 1 所描绘的排名前 10 的研究主题。
我们注意到在排名前三的研究主题,即「支持向量机」,「神经网络」,以及「数据集」之后,研究主题的流行度发生了急剧下跌。我们注意到在「目标函数」之后有另一次下跌。接下来的 7 个话题在流行度方面非常接近。「隐马尔科夫模型」在流行度上仅略低于「主成分分析法」。

图 1:黑色标记的为排名前 10 的研究主题,灰色标记出的为排名 11-20 的研究主题
结论
在此文的研究中,我们使用机器学习方法从将近 54,000 篇于 2007 至 2016 年间发表在主要机器学习期刊和会议的文章摘要中找到了机器学习研究领域中排名前 10 的研究主题。具体说来,我们发现支持向量机,神经网络,数据集,目标函数,马尔科夫随机场,特征空间,生成模型,线性矩阵不等式,高斯混合模型以及主成分分析为排名前十的主题。
对比于 2007 年完成的类似的工作,支持向量机是整个排名前十的列表中唯一相同的主题。这一现象可以归为如下原因:首先,我们不只考虑模型,而将考察范围扩展到包含特征,数据以及优化的整个机器学习领域。其次,不同于对领域内专家的看法进行调查,我们采用定量研究以减小偏差。第三,在过去十年中,学界对模型的兴趣发生了巨大变化,最显著的标志是在深度学习术语下神经网络的回归。总体上,本次定量研究为目前的机器学习研究兴趣提供了广泛的视野,对未来的研究活动具有指导意义。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论