AI华人科学家加盟蚂蚁“共享智能”破解数据孤岛难题

来源:南国网作者:时间:2020-05-07 14:04:29
  网上搜索“张本宇”,你可以找到无数高大上的标签,AI华人科学家中排名前十的大牛;曾就职谷歌、Facebook,后创立云脑科技;深耕人工智能领域20年,手握154项美国专利,在国际一流期刊及会议上发表的45篇论文已被引用超过1万次。

\

蚂蚁金服共享智能实验室首席科学家 张本宇

  甚至还有一张西装革履,交叉握手于胸前,面朝镜头露出标准职业笑容的封面硬照。撕去标签,离开网络,真实世界里的张本宇,穿着随意,就像身边普通的程序员,看上去远比78年出生的实际年龄小。

  从1999年他在北大攻读人工智能硕士算起,正式踏上AI的征程。20年过去了,荣辱沉浮,恩怨俱散,他仍是最初那个追着数据跑的少年。

  AI老兵的新战场

  我试图让张本宇描述下入职蚂蚁金服后的高光时刻。他回忆一会,很遗憾地告诉我,没有什么高光时刻,但有一幕深深印在他脑海里。

  那是去年12月18日,圣诞节前一周,他从硅谷的家中出发,坐11小时飞机,抵达上海后换机场高速前往杭州,汽车驶进西溪路556号,一幢极具现代化气息的“之”字形建筑赫然出现,门口立着五个大字“蚂蚁Z空间”。

  很快,张本宇出现在一间名为“恒长钱庄”的办公室,和20余名同事一起等待CTO宣布共享智能事业部成立。

  他回忆起上一次来杭州,专程来跟管理层对接“共享智能”的相关事项,却赶上上海雷暴,飞机迫降在韩国,“好事多磨”那是他惊魂未定时跳出的第一反应。

  如今,他和20多张年轻朝气的脸庞在镜头前微笑合影,用仪式记录事业部成立,他又想到四个字“新的起点”。

  这些新同事都是二三十岁的年轻人,他们来自人工智能、大数据、数据技术等不同部门,Base在杭州、北京、上海的都有。他们的集合就像一次全科手术,汇聚方方面面的专家,给心肌梗塞的病人开刀,病因是数据不畅造成的血栓,“共享智能”则成了手术刀。

  什么是共享智能?对于这个问题,张本宇显得非常兴奋。他告诉笔者,共享智能是一门新兴的交叉学科,近些年获得了学术界与工业界的广泛关注。

  当前,数据是极其重要的生产要素,也是各类大数据应用的基础,数据的质量和数量也已经成为影响人工智能模型效果最重要的因素之一。随着AI模型能力和算力的提升,各种应用场景对各种异构、异源数据的使用效率也在飞速提升。然而,数据的广泛使用在提升应用效果的同时也引发了公众对于数据安全性的担忧。这主要是归结于数据自身的两个很重要的特性:一个是可复制性,一个是可复用性。可复制是指,数据可以被完整的、极低成本的拷贝;可复用性是指,某份数据可以被多个不同领域的场景复用,也可以在相对长的一个时间轴上被复用。

  所以如果不同应用之间直接共享数据,那么可复制性和可复用性,一定会导致数据泄露的情况,也就是被留存二次使用,从而侵犯了商业利益。更为严重的是,如果是个人相关的数据,很多时候,数据的管理者和使用者并不是数据的所有者。一旦在数据共享的过程中,发生了数据泄露,被对方滥用,那数据的管理者不仅仅是商业利益受到侵犯,它很可能也没有尽到数据管理的责任。从欧盟的GDPR开始,到美国CCPA,再到中国的数据安全法、网络安全法、个人信息保护法都对这种数据管理失责和数据滥用,都有着严格的规范。所以各大数据方,出于保护商业利益、法律风险、舆论风险各方面考虑,都在收紧数据共享,从而形成了大数据孤岛。

  为了便于进一步理解,张本宇举了个例子:有A,B,C三家企业,这三家企业各有利润,都不想被披露出来。当行业协会找到他们,想要通过他们的数据计算出行业的平均利润,以进一步指导行业发展。

  此时,无论哪一家都不肯让步,因为披露数据等于自亮家底,会直接反映各家的真实情况,不能让竞争对手知道。但死抱着数据不开放,无异于把数据变成上岸票价昂贵的孤岛,消亡于自由开放的信息海洋。

  而蚂蚁金服提出的共享智能,就是为解决数据协作需求与隐私泄露和数据滥用之间矛盾的技术解决方案。其目标是,在不直接共享数据的情况下,连通大数据孤岛,实现多方数据可用不可得,也就是拿不走,看不见,但是用得好,让数据这个生产要素能够安全高效地发挥作用。

  早在2016年,蚂蚁金服就开始致力于共享智能的技术研发,并一直在夯实四个基石性的研究方向,即多方安全计算、可信执行环境、差分隐私以及联邦学习。多方安全计算和可信执行环境侧重解决计算过程中的数据安全问题,差分隐私侧重保护计算结果里的隐私泄露,而联邦学习擅长解决大数据孤岛带来的人工智能算法收敛性及效率问题。

  张本宇强调,单独的一个方向并不能解决多方数据可用不可得的问题,共享智能的研究既包括推动这四个基础方向的进步,又包括对这四个方向的融合创新,才能提供满足不同实际需求的多种产品与服务。

  目前,“共享智能”技术已经在蚂蚁金服内部及合作伙伴方的智能信贷、智能风控等业务领域中应用。这一次共享智能以事业部的形式单独成立,意味着新的号角吹响。

  未来,张本宇将和他的这个团队,在一座座数据孤岛间奋力划桨,登岸建“高铁”,链接起数据新世界。

  41岁的张本宇就站在那里,深情的目光望过去,都是自己21岁时的影子。

  竹城少年初长成

  1978年,张本宇出生在江西吉安,一座竹城。吉安文化发达,因而有“一门九进士”“五里三状元”的美誉。张本宇一家就很会读书,父母分别毕业于同济和北大,对孩子的教育方式是散养。

  幼年的张本宇,每月定期收到一笔来自父母的“购书资金”,他可以买任何他想看的书。在学习方面,张本宇不走寻常路,上语文课做英语作业,上英语课做化学作业,上化学课就看小说。他不爱刷题,崇尚高效不重复,不喜欢枯燥重复的劳动。

  决定从事人工智能相关的工作,结缘于一款名为“人工生命”的小游戏。人工生命是一个在二维矩形世界模拟生命演化过程的游戏,每个方格居住着一个活着的或死了的细胞,细胞的生死取决于相邻八个方格中细胞的数量。

  玩家作为这个世界的上帝,随意设定某个方格细胞的死活,以观察对生命的影响。在张本宇手里,他通过编写程序,让这些细胞演化成一只小鸟,沿着一定规则向前飞。

  这款游戏十分接近生命最真实的运行情况,可以看做一个以生命的运算方式运行的计算机,使用了人工智能中的概念。这个概念让少年张本宇着迷,在填报高考志愿时,他义无反顾地选择了北京大学的计算机专业。

  1995年,张本宇如愿进入北大。1999年,他在北大攻读了人工智能硕士,正式踏上AI的征程。

  2002年,24岁的张本宇毕业后去了微软亚洲研究院(MSRA)。在MSRA的6年里共发表45篇论文,前三年致力于搜索、广告、推荐这几个互联网核心方向上的AI算法,后三年参与负责大规模分布式存储、计算与AI框架的研发。

  从2008年开始,张本宇期望能将学术付诸实践,走了普罗大众看来“一路开挂”的事业路:在北京看完奥运会后先是跑到硅谷,就职于Google,从事搜索广告优化。

  2年后,加入初具雏形的Facebook社交帝国,其大量可用于AI研究的社交数据深深吸引了他,并一路啸聚群雄,攻城掠地,带领团队开发了Facebook中占据利润来源90%以上的信息流广告业务,感受一把准创业氛围。

  2013年,移动互联网迅速崛起,Google成立新项目Google Now,试图在手机中加入真正的智能,张本宇又被挖回Google Now项目,负责推荐平台与算法。AI诞生于数据,纵观张本宇的工作经历,几乎就是追着数据跑,哪里的数据多,哪里的数据有价值,他就去哪里。

  四年一觉创业梦

  2015年,张本宇离开谷歌,毅然选择回国创业,一手创立 “云脑科技”,目标是建立解决大数据孤岛的AI生态系统,并在通信行业、金融科技、人才教育、能源制造四个领域展开一系列探索。遗憾的是,2018年公司没有通过经济形势的考验。

  折戟沉沙的张本宇,在AI创业这条赛道上奔跑了,摔倒了,流血了,陷入了迷茫。他休息思考一段时间后,收到蚂蚁金服的邀请,加入共享智能的团队,继续AI的探索。

  回首过去,他的创业初心和共享智能的愿景,都是解决数据孤岛的难题。而蚂蚁金服有大量的业务场景,这是一家科技创业公司从基因中就缺失的部分。4年的创业经历让他明白,纯技术公司要去撬动商业场景有多么艰难。

  于是,张本宇欣然应邀,这一次他不仅有技术,还有数据和业务的同学,以及蚂蚁金服的商业号召力,构建起一个互相支撑的生态。

  白天,他和硅谷当地的同事,构思技术的边界,一旦发现国际最新的技术动态,立刻钻研拓阔知识储备;到了晚上通过钉钉和国内的同学交流,国内的算法团队会反馈大量业务场景需求上来,他将迅速引入最新技术落地。

  在创业时代,他把公司定位为“打造行业与人工智能之间的桥梁”,但现在,他认为只是桥梁已经不够了,他们要造就要造高铁。他最想对共享智能的同学说两点:一是要从业务出发,让业务为客户创造更好的价值;二是要用技术上最合理的方法,来帮助实现第一条。

  前几天,张本宇无意中看到一则新闻,人工生命游戏发明者,英国数学家约翰·康威,因新冠肺炎,于4 月 11日上午在普林斯顿逝世。

  一时间他错愕在屏幕前,这个引导他进入AI世界的前辈就这样在2020年的春天悄然离去,他回忆起少年时第一次接触到这款游戏的心情,那只编写的小鸟似乎还在某个角落飞。他在iOS上专门寻找到这个游戏,专门玩了一会,用这种方式悼念约翰·康威。

  旧神已死,新神将至,人间终会迎来下一轮万物生长,不管是技术,还是人。

南国网

上一篇:全民兼职 众赢创富——全球首款兼职应用商店APP正式上线

标签
  • AI
  • 盟蚂蚁