COS访谈第十八期:陈天奇


陈天奇:机器学习领域的创新者与实践者


华盛顿大学计算机系的博士,陈天奇在大规模机器学习领域有着深厚的积淀,他的学术成就和技术创新令人瞩目。他曾凭借SVDFeature在KDD CUP 2012 Track 1中摘得冠军,这标志着他对推荐系统模型定制的强大能力。SVDFeature的出现,源自他在本科时期对RBM项目的深入研究,为了解决外存计算的挑战,他创新性地开发了这个灵活的工具,它在研究中表现出色,特别是在KDD Cup竞赛中获得了优异的成绩。


当陈天奇加入GBDT的研究后,XGBoost的诞生可以说是SVDFeature理念的延续。在2012年的腾讯微博关注请求预测比赛中,他利用SVDFeature进行矩阵分解,但发现连续变量处理的不足,于是引入了树模型进行优化。他的首个ICML工作进一步扩展了这一模型,将矩阵分解和树模型完美结合,为机器学习领域带来了新的突破。


易用与效率的双重追求


陈天奇意识到,工具的价值在于其对研究的辅助作用。他在寒假期间开发出的XGBoost,最初因效率较低而诞生,但很快通过OpenMP技术发现C++的多线程优势,为GBDT模型的高效实现奠定了基础。最初的XGBoost没有Python接口,但随着项目的迭代和Kaggle竞赛的参与,他重构了代码,并增加了Python支持,将易用性作为重要的设计目标。


在XGBoost的发展过程中,陈天奇明确了他的分工,他专注于矩阵分解的研究,而将工具的开发和维护更多地交给了合作者,以确保工具的持续优化。他强调,平衡研究与开发是关键,如去年暑假前完成的mshadow和cxxnet,尤其是cxxnet在Kaggle图像识别比赛中取得了显著成果。


跨领域探索与工具的价值


陈天奇的dmlc库不仅为机器学习研究提供了通用组件,如高效的文件读写和调度,还旨在简化用户的使用体验,使之在系统优化和分布式支持上超越R和scikit-learn。他认为,dmlc不仅是学术研究的桥梁,也是连接工业界的重要工具。陈天奇强调,不断创新和尝试新领域是他的工作理念,他愿意跳出舒适区,推动技术边界。


在公司和学术界的角色转换中,陈天奇明确表示,XGBoost的发展超出了最初的预期。dmlc作为组件集合,它的目标是简化工作流程,而不是直接面向商业。与Graphlab不同,陈和他的团队将聚焦于他们擅长的工具,致力于优化核心组件并与其他平台进行整合。




  • COS璁胯皥绗崄鍏湡:闄堝ぉ濂
    绛旓細褰闄堝ぉ濂鍔犲叆GBDT鐨勭爺绌跺悗锛孹GBoost鐨勮癁鐢熷彲浠ヨ鏄疭VDFeature鐞嗗康鐨勫欢缁傚湪2012骞寸殑鑵捐寰崥鍏虫敞璇锋眰棰勬祴姣旇禌涓紝浠栧埄鐢⊿VDFeature杩涜鐭╅樀鍒嗚В锛屼絾鍙戠幇杩炵画鍙橀噺澶勭悊鐨勪笉瓒筹紝浜庢槸寮曞叆浜嗘爲妯″瀷杩涜浼樺寲銆備粬鐨勯涓狪CML宸ヤ綔杩涗竴姝ユ墿灞曚簡杩欎竴妯″瀷锛屽皢鐭╅樀鍒嗚В鍜屾爲妯″瀷瀹岀編缁撳悎锛屼负鏈哄櫒瀛︿範棰嗗煙甯︽潵浜嗘柊鐨勭獊鐮淬傛槗鐢ㄤ笌...
  • 扩展阅读:男科医生陈天奇周军 ... 天价前妻唐青陈天奇 ... 陈天奇医生和体育生 ... 《当我cos走错片场后》 ... 小浩奇遇记 ... 陈天奇叶倾城免费阅读 ... 陈天奇周军的幸福生活 ... 华夏第一战王陈天奇 ... 爱拍倒闭了后视频在哪 ...

    本站交流只代表网友个人观点,与本站立场无关
    欢迎反馈与建议,请联系电邮
    2024© 车视网