白交 发自 凹非寺
量子位 报道 | 公众号 QbitAI
机器学习越来越火了,感觉不学习都赶不上时代的步伐了。
可是看论文又没有方向,费时费力,也许还要费钱。
而且机器学习的论文真不是一般的多。
Google AI大牛、谷歌大脑负责人Jeff Dean,就曾经过精密计算后得出了一个数据:平均每一天,全世界都会产生100篇机器学习新论文。
这还只是一年前的结果。

相信很多干货里都提到了这样一个网站,号称“AI所有领域最优资料查找神器”——Papers with Code。

现在网站上有超过2500多个排行榜和20,000多个论文结果。
此外,结果现在可以直接链接到arXiv中的表格,只需要轻轻一点result,就能够提取出论文结果来。

查论文神器大更新
此次更新,主要是由三个方面,一个新的result界面,自动化结果提取,大数据库更新。
首先是,一个新的result界面,该界面将结果直接链接到arXiv论文中的原始表格。
就比如,我们看到这个ImageNet排行榜,单击下面其中一行的result,就可以直接链接到论文中的表格,是不是更加直观清晰?

需要注意的是,这个界面目前仅适用于带有LaTex源的arXiv论文。
接着,就是自动化结果提取。
该公司在过去一年中就致力于研究从机器论文学习中自动提取结果。
现在就有了一个新的人机交互系统,用于生产中的结果提取。我们的模型可以为每一篇arXiv ML论文生成人类可以接受或拒绝的建议。通过显著提高性能,使这一系统在实际应用上比之前的最先进的系统更加可行。
目前已经在arXiv上发布了相关方法,并在GitHub上开源,还发布了一个结构化的注释数据集,用于训练模型的结果提取,以及评估模型在此任务上的性能的数据集,以期以后更好的优化。
此外,资源数据也得到了很大的扩展,截至目前,网站已经有了800多个新的排行榜以及5500多个新的结果。所有的数据都已经获得了免费的开放数据许可,并且也可以在此处下载JSON格式的数据。
关于Papers with Code
Papers with Code成立于2018年7月,初衷是希望能够帮助机器学习的爱好者跟踪最新发布的论文及源代码,快速了解最前沿的技术进展。
网站广泛涉及ML各个领域,包括CV、NLP、医疗、语音、游戏、时序、音频、机器人、音乐、推理、计算机代码等方面的内容。
网站所有内容都是可编辑和版本化的。
首页上就有直观的索引。

网站将 arXiv 上最新的机器学习论文与 GitHub 上的代码对应起来,让用户可以按标题关键词查询,或者按流行程度、GitHub 收藏数排列「热门研究」。
我们就以CV为例。

点击语义分割这一类,首先是对语义分割的一个简短介绍,接着就是论文排行榜。


Papers with Code 网站背后的公司名为 Atlas ML,位于英国伦敦,创始人为 Robert Stojnic 和 Ross Taylor。
创建者之一 Robert Stojnic 在 2012 年于剑桥大学取得计算生物学博士学位。2018 年 7 月创办 Atlas ML 及网站 Papers with Code,目前担任 Atlas ML 的 CEO 职位。


One more thing
介绍了这样一个优质的资源网站以后,也许你还想问,那如何看论文呢?
此前,我们发表了一篇由清华本科特奖学生高天宇的干货分享,其中他就有提到怎么查找论文,研究论文的小秘诀。
首先,对论文进行分类:

一方面,这些研究本身与你的研究非常相关;另一方面,在“撞题”的情况下,你正在做的项目可能已经被别人率先突破。
而别的子领域及其他领域论文,对于你当前的研究没有太大启发,可以略过。但如果有对整个研究领域存在指导意义或者取得重大突破和成果,那就需要认真研读和总结。
针对标题,高天宇还提出了水文第一定律。
标题越长,是水文的概率越大。标题越短,往往干货越多。
此外,还分享了文献管理工具,以及如何看论文等小技巧,想看的可以戳下方链接哦!
另外,如果你也有什么查看文献各类神器,也欢迎跟我们分享~
参考链接:
https://www.reddit.com/r/MachineLearning/comments/gfq9kp/pr_a_big_update_to_papers_with_code_now_with_2500/
https://paperswithcode.com/sota
https://medium.com/paperswithcode/a-home-for-results-in-ml-e25681c598dc
清华本科特奖高天宇干货分享:
— 完 —
本文系网易新闻•网易号特色内容激励计划签约账号【量子位】原创内容,未经账号授权,禁止随意转载。
原标题:《免费查找AI最优论文神器:一键出结果,分分钟提取论文表格、最新数据》