-----头部结束------------------

博天堂918网站多少CV十年发展之观察:15万篇论文透视“业界”与“学界”到底谁更胜一筹?

2024-01-02 23:27:51

  博天堂918网站多少CV十年发展之观察:15万篇论文透视“业界”与“学界”到底谁更胜一筹?此外必要注意,正在援用汇集中,学界论文占比 73%,仅有 4% 的论文是由业界孝敬的□□,23% 由学界 / 业界孝敬。于是□□,4% 的业界论文占了全数援用的 8%。

  为了确定这些论文的重心演化趋向,研商者运用始末熬炼的 LDA 模子来寻得每篇文档的热门重心,然后每年分辨针对学界和业界对每个重心实行汇总统计。

  原题目:《CV十年生长之伺探:1.5万篇论文透视「业界」与「学界」,结果谁更胜一筹?》

  正在许众范围,由业界赞助的科学研商与学界研商平淡共存并彼此影响,从研商方法上看□,二者存正在着明显区别。企业发展的研商往往受到与自己营业需乞降特定产物功用相相仿的短期主意驱动,而非纯粹的学术探究。别的,任务流程也不相仿:好比正在机械进修研商中,学界研商者旨正在斥地新模子或修正现有模子以设置新的 SOTA,业界研商者正好相反□□,他们有着固定的职能需求,思要的只是或许知足本人而且简单扩展的特定模子或办法。

  如下图 8 所示□□,供给代码的论文的比例稳步增添,而且无论是否涉及业界作家,公斥地布代码的比例和供给代码论文的增加率大致相仿。于是,研商者不将该要素行动业界论文均匀高援用的原由。

  2012 年,Kryzhevsky 等人提出了 AlexNet,显现出了卷积神经汇集(CNN)正在大界限图像分类职分上相较于其他机械进修办法的上风。以后不久,CNN 和深度进修扩展至了预备机视觉的许众其他范围以及预备机视觉以外的范围。

  最首要的是该范围有影响力研商职员的作为□,他们被界说为正在作家配合汇集中具有最高 PageRan 分数的 top-100 作家□□。结果显示,属于业界的顶级研商职员的占比由 2010 年的 20% 上升至 2019 年的近 60%。

  隐含狄利克雷分散( Latent Dirichlet Allocation□,LDA)是文本数据中常用的重心浮现办法□□。本研商中的文本语料库包罗 14686 篇论文的题目和摘要。

  因为研商主意差异□□,极少业界人士招认,下一个伟大的 idea 更有能够出自学界。但是也要招认□,业界具有较学界众得众的可用资源和数据□□。

  即使业界研商不休增加的近况很难鄙视,但因为缺乏联系数据和正式研商,其对预备机视觉研商的影响正在很大水准上照样未知的。于是,本文首要有两个宗旨,一是量化业界赞助的研商正在预备机视觉范围的比重,二是探究业界的加入是否对该范围的生长方法具有可胸襟的影响□。

  下外 1 是简直的统计数据□,包罗学界、业界以及既属于学界也属于业界的论文、作家、论文援用以及代码链接的数目。

  为了进一步探究业界论文的援用偏倚(citation bias),研商者研商了与论文联系的代码 / 数据的可用性□□,这是由于该要素已被注明正在其他科学范围显现出了明显的援用上风□。

  其次是论文作家所属机构的蜕变。如下图 3 所示,过去十年,业界作家的数目同样闪现稳步地增加□。简直来说,仅属于业界的作家占比从 2010 年的 7% 增添至了 2019 年的 17%□□。同属于业界和学界的作家的数目也从 2017 年的不到 1% 增添至了 2019 年的 9%。

  因为 LDA 模子天生的重心是词集□,于是研商者特别运用范围学问(domain knowledge□,DK)对重心实行符号。下外 2 映现了最终的 20 个重心和对应的 top-5 枢纽词:

  别的,如下图 4 所示□□,学界和业界所属的合系也闪现出了区域形式□□。好比,来自 Google 和 Facebook 的研商职员比拟众地与 CMU 和加州大学等美邦顶尖大学配合。

  研商者思要探究业界论文是否对社区出现更大的影响,即正在有好似作品时,业界论文是否更有能够被援用?研商者为此创修的援用汇集(citation network)是一个具有 14686 个节点和 161514 个边的有向图□。简直地,正在从论文参考文献中解析出来的 60 万个援用中,他们仅思考 top-5 聚会上的论文。结果显示,逾越 95% 的汇集节点包罗正在广大的连绵分支中□,而且近 25% 的论文未被援用□。

  正在本文中□□,为了逮捕到引入这种机械进修范式以后的趋向,研商者从 2010 至 2019 年首要预备机视觉聚会吸取的论文中开采数据。挑选的预备机视觉聚会包罗 CVPR、ICCV、ECCV、ACCV 和 BMVC,一共抽取了 14686 篇论文。

  下图 7 映现了最高 PageRank 的 top-100 论文中,能够看到,自 2015 年以后,业界所属论文的影响力大要呈增添趋向,2018 年业界论文更是一度逾越学界论文□,2019 年二者险些持平。别的□□,过去十年中 100 篇 top 论文中,有 67 篇是学界论文。

  本文为滂湃号作家或机构正在滂湃音信上传并发外,仅代外该作家或机构见识,不代外滂湃音信的见识或态度,滂湃音信仅供给讯息发外平台。申请滂湃号请用电脑访谒□。

  即日,加拿大约克大学的博士生 Iuliia Kotseruba 对 2010 至 2019 年预备机视觉正在业界和学界的起色实行了注意的调研□。这十年来,该范围的研商行为平昔正在增加。预备机视觉研商不休增加很大水准上要归功于深度进修技艺的胜利□□,而深度进修技艺又得益于巨量可用的预备资源和数据。思考到预备机视觉行使的广大价钱,许众企业都向该范围的研发任务投资□。于是业界赞助的研商者成为预备机视觉社区的首要构成个人,并向该范围首要的学术聚会和期刊杂志踊跃投稿。别的,全数预备机视觉顶会具备了工业展览会的特色,供给了调换和任用时机。

  为了观察预备机视觉范围业界赞助的研商所占的比例,以及它们对该范围出现的影响,加拿大约克大学的一位博士生判辨了 2010 至 2019 十年间 Top-5 预备机视觉聚会上揭橥的近 15000 篇论文□,映现了业界研商的蜕变趋向以及这些研商对社区的影响。

  合于业界和学界的配合,从论文作家和所属联系来看□□,都闪现出了更众配合的趋向。每篇论文的作家数目逐步增添。正在学界,2010 年每篇论文均匀有 3 名作家,2019 年增至 4.5 名□□。别的,2019 年学界 / 业界配合的论文均匀有 6 名作家。单篇论文的最众作家从 2010 年的 15 名增至 2019 年的 28 名。如上图 2 所示□□,这些新的配合人人映现正在业界和学界作家之间□□。

  为了判辨业界正在预备机视觉社区的近况和影响,研商者对以下讯息伸开了判辨:论文作家及所属机构、机构类型(属于业界照样学界)、论文及揭橥年份、题目、摘要和重心等。

  为了确定业界对论文增加的孝敬,研商者起首统计了业界和学界作家正在预备机视觉顶会上揭橥论文的占比□,简直如下图 2 所示。过去十年□,全数或个人作家来自业界的论文总体占比呈增添趋向,仅由业界作家揭橥的论文正在全数论文中的比重正在 2% 到 6% 之间动摇□□,业界和学界作家联合加入论文的数目则增添了不止一倍,从 2010 年的 15% 增至 2019 年的 37%。总的来说,有业界作家加入的论文正在全数论文中的比重正在 2010 年低于 20%,到了 2019 年这一数字增添至了 40% 以上□。

  起首来看学界和业界研商的论文孝敬。总体来说,过去十年预备机视觉范围揭橥论文的数目有了明显的增加。比如,预备机视觉顶会上揭橥论文的数目平昔以 12% 驾驭的年均增加率稳步上升。如下图 1 所示,2010 年揭橥的论文 1000 众篇□,到了 2019 年则增添到了 2500 众篇。

  研商者浮现,业界正在以下两个方面出现了宏大影响:一是研商重心趋向的演化□,二是过去十年的援用偏好。

  遵照援用汇集的数据,研商者浮现业界论文被引加倍频仍。正在 top-10 被引论文中,2 篇出自业界作家,3 篇由业界和学界作家配合,5 篇出自学界作家。高被引论文首要先容了寻常运用的架构(如 ResNet)、常睹视觉职分(如主意检测)的算法和常用数据集(如主意检测和决裂数据集 COCO 和主动驾驶数据集 KITTI)□□。均匀来说□,业界论文被引 23 次□,学界 / 业界论文被引 11 次,学界论文被引 10 次。

if (window.jQuery) { (function($){ default_switch(); //简体繁体互换 function default_switch() { var home_lang = getCookie('home_lang'); if (home_lang == '') { home_lang = 'cn'; } if ($.inArray(home_lang, ['zh','cn'])) { var obj = $('#jquerys2t_1573822909'); var isSimplified = getCookie('jquerys2t_1573822909'); if ('cn' == isSimplified) { $('body').t2s(); $(obj).text('繁體'); } else if ('zh' == isSimplified) { $('body').s2t(); $(obj).text('简体'); } } } //简体繁体互换 $('#jquerys2t_1573822909').click(function(){ var obj = this; var isSimplified = getCookie('jquerys2t_1573822909'); if ('' == isSimplified || 'cn' == isSimplified) { $('body').s2t(); // 简体转繁体 setCookie('jquerys2t_1573822909', 'zh'); $(obj).text('简体'); } else { $('body').t2s(); // 繁体转简体 setCookie('jquerys2t_1573822909', 'cn'); $(obj).text('繁體'); } }); })(jQuery); }