本篇文章2365字,读完约6分钟

它来自武侠小说。作为最高的武术研究机构,达摩学院代表着最高的修炼境界。同样,科学研究也需要勤奋、毅力和专注的精神。

或许是因为对武术的痴迷,阿里巴巴董事局主席马云在2017年10月将新成立的阿里研究院命名为“达摩研究院”,并宣布将在未来三年投资1000亿元人民币,研究自然语言处理、人机自然交互、量子计算、机器学习和基本算法等前沿科学领域。

如今,随着中国前所未有的对外开放和全球人才引进的加速,中国科技巨头已经成为国际人才的重要平台,也是这波人才红利的主要受益者。

在中国科技企业中,凭借前期的人才储备和后期达摩研究院的发展规划,阿里巴巴凭借其数据、场景和技术优势,在全球人才竞争中显示出强大的“磁场”。

事实上,这是阿里巴巴向“科技公司”转型的结晶。自九个月前成立以来,达摩学院一直被一层神秘的面纱所笼罩。这个机构有多少人,他们做了什么?他们如何让尖端技术从实验室走进公众的日常生活?

根据2018年归国留学生部际联席会议发布的数据,2017年,在华归国留学生总数达到48.09万人,创历史新高。

需要考虑的是,大量的海归“达娜”可以投身于达摩学院的“培育与进化”。在海归人数创新高的时刻,许多科技公司的核心海归和从国外引进的人才纷纷离开。

科技界一直在讨论,为什么这些顶尖人才来到中国后,会有“两淮柳橙之别”。答案在于技术和价值观的概念。

“皇冠”下的科学家

这个故事始于最近的一系列科技事件。

在刚刚结束的帕斯卡voc comp4目标检测比赛中,一个著名的计算机视觉比赛,获胜者来自中国达摩研究所。在此之前,达摩研究所自主开发的新一代语音识别模型DFSMN刚刚打破了语音识别准确率的全球纪录,并被谷歌等国外巨头在论文中引用。

在刚刚结束的国际顶级机器翻译大赛wmt中,达摩学院带领众多国外巨头和学术研究机构,在英汉翻译、英俄翻译和英土翻译中获得第一名。

此外,今年1月,阿里巴巴在美国斯坦福大学主办的顶级机器阅读理解比赛《小队》中以82.440的准确率打破了世界纪录,超越了人类。赛后,英国《每日邮报》的标题是:阿里巴巴的人工智能在世界上最难的阅读理解测试中首次击败了人类!

人们看到的是,在成立不到一年的时间里,达摩学院已经在国际顶级技术比赛中获得了近20项世界第一。但是很少有人知道达摩研究所也是顶尖科学家中的“星光熠熠”。

密歇根州立大学终身教授金伟是世界大数据和人工智能专家;华宪生,ieee研究员,视觉识别与搜索领域的国际权威学者;世界顶级量子科学家卫诗;任晓峰曾是中国级别最高的科学家,亚马逊最年轻的高级首席科学家之一,也是计算机视觉领域的世界级专家...

数以百计的科学家、专家和学者悄悄地活跃在达摩研究所。

在世界顶级机器翻译比赛wmt中,达摩研究所获得的五项第一是由思洛团队获得的。

罗斯是达摩研究所机器智能技术实验室自然语言处理的首席科学家。自然语言处理(NLP)是一种人工智能技术,使机器能够理解人类语言。自然语言处理广泛应用于搜索引擎、智能客户服务、商业智能和语音助理。

因为这项技术位于人工智能金字塔的顶端——认知智能,它也被称为人工智能的皇冠上的宝石。

罗斯和他的团队是制造这颗珍珠的人。

2006年从卡内基梅隆大学毕业后,思洛加入了普渡大学计算机科学系,专注于机器学习和自然语言处理。2012年,他发表了100多篇顶级学术论文,成为普渡大学计算机科学终身教授。

当谈到回到中国加入阿里的原因时,思洛给出的答案是:跳出学术研究的小圈子,“我第一次看到自己的技术被数千万用户使用,这种兴奋之情无法用语言来形容。”他最深刻的理解是,他在学校是一个赋权的学生,但是当他和工业界的人在一起时,他能感觉到他的角色和影响已经扩大了。

阿里巴巴是思洛发挥自己能力的理想场所。“大多数人工智能都需要技术、场景和数据的支持,尤其是自然语言处理。在这三个方面,企业比学术界更有优势,阿里在这三个方面的优势领先于世界其他地区。”

达摩研究所的研究方向主要锁定在前沿技术领域,达摩研究所的科学家也是这些领域的佼佼者。

目前,阿里巴巴拥有25,000名R&D技术工程师、近1,000名研究人员和许多优秀的年轻创新人才入选麻省理工学院tr35。这支集产品、学术和R&D于一体的创新人才梯队,使该企业拥有强大的科技驱动力,并从资金、技术和人才三方面为探索科技未来奠定了基础。

“技术研发绝不是为了发表论文”

除了自然语言处理,语音识别属于认知智能。因此,达摩研究所的机器智能技术实验室吸引了许多语音识别和智能语音交互领域的科学家。

作为达摩研究所机器智能技术实验室智能语音交互的首席科学家,闫志杰表示,与其他人工智能技术相比,智能语音相对成熟,但很难进一步突破现有技术的门槛,与应用场景深度融合。许多中国企业也缺乏自主创新的战略耐心,但他从阿里身上看到了这种决心,于是他在2015年加入了达摩研究所机器智能技术实验室的前身idst。

深度解密阿里达摩院:如何让科技与商业共舞

在此之前,翟志杰在微软亚洲研究院工作了近八年,他的主要工作是学术研究,如撰写论文和改进开放标准数据集的算法。但是,翟志杰希望他在R&D的成果能更早地成为产品,被更多的人使用,从而听到用户的直接反馈,促进技术的进一步发展。

在阿里,达摩研究所不是一个纯粹的研究部门。它与商业和商业紧密相连,与学术思维、产品思维和商业逻辑紧密相连。

闫志杰说,阿里的实验室里有三种人。一是算法研究,二是算法登陆,三是促进产品化的工程技术人员。将这三种人组合成一个组织,可以使算法的研究成果迅速产生。

达摩研究所不同于一般公司在研究和产品等不同部门之间的技术转换,它整合了从尖端技术探索到产品化的完整功能。以阿里自主开发的语音识别模型dfsmn为例,翟志杰表示,从算法验证结束到最终推广到阿里巴巴云供开发者使用,整个过程只需一个月左右。

罗斯介绍说,当大多数科学家刚到阿里时,他们仍然有一点技术思维,但达摩研究所希望技术能与产品和业务共舞,这样技术就能在业务中发挥支持和主导作用。只有当技术人员对业务条件和业务需求有了更深的理解,他们才能更好地释放他们的技术能力。

为此,阿里为这些科学家准备了一个会议仪式,并要求包括罗斯和智智杰在内的新科学家深入一线,到一线技术部门进行锻炼。阿里的科学家被要求从商业同事那里学习商业模式,从产品同事那里学习产品概念,从客户服务同事那里学习用户偏好。例如,思洛被派到阿里巴巴的搜索部门。

甚至,许多R&D员工都成了“猪倌”。为了探索智能农业,阿里人工智能养猪团队的十几名R&D人员已经在养猪场呆了几个月。通过阿里的人工智能技术,每头猪都有自己的档案。通过视频图像分析技术,记录猪的体重、食物摄入量、运动强度等。如果一头猪不能躺下,人工智能会判断它是怀孕了还是生病了。达摩研究所机器智能技术实验室主任金荣也将这种下到前线的做法称为“下乡”。

深度解密阿里达摩院:如何让科技与商业共舞

“阿里的技术研发不是为了发表论文,而是为了成为企业发展的眼睛。”面向未来业务的研发。”阎知杰说道。

世界需求每天落后7.5亿次

用户可能没有意识到许多尖端的人工智能技术已经被应用到几乎所有的阿里产品线,比如淘宝和天猫。

记者了解到,达摩研究所已经成功搭建了包括自然语言处理和语音识别在内的一系列通用技术平台,为阿里巴巴的整个核心技术系统提供支持。罗斯领导的自然语言处理团队肩负着打造阿里巴巴整个自然语言处理技术平台的使命。

全球化是阿里集团未来20年的三大核心战略之一。在阿里经济中,越来越多的人开始在全球范围内进行买卖。让世界上没有困难的事情,首先,让每个人在语言交流中没有障碍。

以阿里巴巴国际站为例,70%的买家用英语交流,其余30%用西班牙语、俄语和土耳其语等小语种交流。根据阿里对卖家的调查数据,大约96%的卖家对小语种无能为力。这就产生了对机器翻译的巨大需求。然而,达摩研究所的机器翻译技术正好填补了这项业务的空空白,有效地支持了阿里在俄罗斯、土耳其、西班牙、巴西等地的发展。目前,阿里的机器翻译每天被调用多达7.5亿次。

深度解密阿里达摩院:如何让科技与商业共舞

此外,菜鸟物流通关、阿里巴巴云国际社区、飞猪旅游翻译助理、美甲社会口语翻译等一系列产品也应用了这一技术。

这只是达摩研究所技术带来的巨大商业价值的冰山一角。

“其他”达摩学院

在这个技术驱动发展的时代,掌握核心技术,特别是基础科学和颠覆性技术的突破,将决定企业能走多远,也决定国家的竞争力。对于阿里巴巴这个102年的企业来说,加大科技创新研究的投入,走科技驱动的发展道路是不可避免的。达摩学院成立了。

马云对达摩学院的发展提出了三个要求,即“比阿里巴巴活得更久”、“服务全球至少20亿人”、“放眼未来、用科技解决未来问题”。

希望世界顶尖的科学力量汇聚一堂,潜心研究未来的核心科技,这是达摩研究所的目标,真正实现“做一个伟人,利国利民”的目标。

就R&D系统而言,达摩研究所形成了三个层次的R&D系统:展望未来3-5年的前沿应用技术、展望未来5-10年的原创基础技术和展望未来10-20年的前瞻性基础技术研究。

在达摩研究所成立的当天,马云发表了一篇演讲,他说研究不应该是为了好玩而研究,也不应该是为了利润而研究,而是为了用利润和乐趣来解决问题而研究。

“为了娱乐已经走得太远了,为了利润已经走得太近了,他们走不了多久。一个企业有多大取决于它解决了多大的社会问题。这就是阿里巴巴的思维逻辑。”马云表示,“解决社会问题”是阿里巴巴一直实施的技术研发逻辑。阿里巴巴不再是一家普通的商业公司,而是一家由技术驱动、技术和商业完美结合的公司。(中信经纬应用)

标题:深度解密阿里达摩院:如何让科技与商业共舞

地址:http://www.ayczsq.com/ayxw/16129.html