长春一位医生:如何让你的鸟要往哪里飞?

戴文元不是那种严格遵守规则,喜欢“玩花”的人——

有多种编程规范。他经常不跟随他们。他写了一些完全不遵守规则的程序,但执行效率却极高。当然,别人也追不上,也是不可维护的。

第四范式中的前 10,000 行代码是他编写的。那时他刚刚创业,白天作为创始人忙着各种事情。半夜的12:00,到了他最好的状态写代码的时候了。

他只是坐在黑暗中,开始在键盘上打字,这是他一天中最舒服的时间。

正文|金钟

编辑|刘斌

摄影|高远

制作人|焦辰

视频制作|小漫视频

当你知道鸟儿要去哪里时

2018年中国平均每分钟出生28个婴儿。在每天发生的 41,000 多例分娩中,每位女性都面临一个重要问题,是自然分娩还是剖腹产?这不仅关乎他们将遭受的痛苦,甚至关乎他们的生存。而这也是一个往往在最后一刻才决定的事情。在这个医疗繁荣的时代,它是少数主要以医生的经验来判断的事情之一。

今年春天,长春的一位妇产科医生发现了一种新方法,可以提供一种缓解疼痛的工具。医生偶然发现了互联网上的一个人工智能平台,想试试看它是否能更准确地预测新生儿。孩子的体重,来指导医生的判断。这台机器操作起来并不难。他将以往采集的孕妇体检指标数据全部以表格的形式输入机器,很快得到答案——无需选择配方,无需复杂操作,机器一切由本身。

这种看不到过程的操作,可信吗?医生也对结果感到惊讶——所有病例的误差都在 0.2kg 以内。这甚至高于目前临床医学所达到的精度。结果被写进了一篇论文,并最终在顶级医学会议上发表。

综上所述,提供人工智能机器的公司第四范式没有先验知识。医生通过官网试用门户试用了名为 AutoML 的产品,并完成了计算。

公司创始人戴文元先生得知此事后,更加激动,甚至比他们拿到银行的大单还要激动。他还讲了另一个类似的故事。一天,一位朋友告诉他偶然看到别人使用他们的产品。这是一个“候鸟迁徙”项目,机器被用来预测候鸟的飞行路径。当您知道鸟类的去向以及它们将要经过的区域会出现污染或烟雾时,您可以进行干预以尽可能确保它们的安全。

在这些故事中,戴文元最看重的就是这些具体而鲜活的人。他们没有太多的人工智能基础,他们不知道如何编写代码,他们可能只会操作 Excel 表格,但他们可以通过基础学习使用他们的工具。使用人工智能。“我认为这意味着我们真的改变了世界。”

人们坐在一个陌生的新 AI 工具前,困惑、尝试,最终为自己所用,就像我们多年前第一次接触计算机时所做的那样。

1991年,在古城苏州读小学二年级的戴文元,在参加了3次数学考试后,获得了加入计算机兴趣小组的资格。一周一次的电脑时间极其宝贵,都用来写程序了。他打了个比方:“如果你花这么多钱和巴菲特共进午餐,你肯定会花时间问他问题,绝不会浪费时间和他聊天。”

10岁就开始在机房的电脑上写logo语言,家里的书架上也有C语言的书。在此之前,他的父母让他学习他的特长,但他总是半途而废。他坚持了一年的书法,只坚持了一年的国际象棋。中国象棋最长,但他写了逃课的原因,“卡”了6年。. 只有电脑是他自己选的,至今坚持了28年。

就好像终于找到了某种人生的入口,年轻时的自我发现和肯定,从此再也不变。高一时,他通过竞争获得了大学的推荐资格,他下定决心只读计算机系,所以放弃了无法选择专业的清华大学。后来,在上海交通大学,他获得了ACM国际大学生程序设计大赛的世界冠军。

另一个关键节点是在香港科技大学的实验室,在那里他第一次知道什么是人工智能,并将其作为毕生的追求。起初,他在纸上追求它;然后他离开学校去百度练习广告推荐系统;然后他去了华为的诺亚方舟实验室,看看他在非互联网领域能做到多远;公司可能是最好的方法,所以现在有了第四范式。

“最重要的是我玩得很开心。我很感兴趣,我在目标上,我不会考虑其他任何事情。”

为队友准备可乐的工作

采访前,戴文元凌晨1:00还在工作,凌晨5:00回复了微信。

我们想知道他是如何安排一天的工作的——一位接受《人物》采访的女演员表示,她会将自己最想做的事情安排在早上,这样她每天都会更快乐更快乐,度过一个愉快的夜晚。但戴文渊的回答是:“我真的不记得自己喜欢做什么了。” 一切从逻辑开始,做该做的事,顺理成章。如果机器正在运行,它非常适合。

“逻辑”,搭档陈宇强评价他的时候,总是提到这个词。戴文元曾任陈玉强大学初级导师、百度实习带头人。他认为,逻辑是他从戴文渊身上学到的最重要的东西。“比如形成一个描述或者一个算法,他关心这里的本质逻辑;第二点,你怎么做,别人能看懂,别人也能看懂。”

这种极端的理性,与戴文元在ACM比赛中所接受的训练是分不开的。

上大学之前,他的性格正好相反,紧张又情绪化。高二的时候,他的计算机水平已经是江苏省第一,代表省参加全国信息学大赛​​。经过10年的准备,到了现场,一考就开始紧张,二考还好,但一考全面,就排在全国第23位。当时第18名到第22名打成平手,前20名进入国家集训队,但他无缘。

进入国家队,代表中国参加世界信息学大赛​​是他中学时代的理想。他认为他也有这种力量。从 10 岁开始,他的世界只有电脑和问题,他花了很多时间做编程培训。比赛结束后,他从北京回到家中,描述了当时的心情:“就像奥运会一样,一个非常有能力争夺体操冠军的人,却从平衡木上摔了下来。”

当时正好高中有个地方推荐到清华,但是他不能选专业,不能接受不学计算机。与此同时,上海交通大学教授于勇给戴文元所在的学校发了一份写有自己名字的推荐表。于勇说,这块表不能给别人。戴文渊不想要,就自动作废。戴文元接受了上交的邀请。

高中毕业前的五月,是每年举行ACM比赛的时间。戴文远不需要高考,所以他在家里看了一晚上的比赛。那个时候,网络还不能做视频直播,只能做文字,只能不断的打开和刷新一个网页。这是上海交通大学第一次获得世界冠军。选手林晨曦后来成为戴文元的教练,后来创办了现在家喻户晓的人工智能公司依图科技。

戴文元的 ACM 之旅一开始并不顺利。大一的时候参加过两次比赛,都没有拿到好名次。在备战高三的时候,他开始思考,“如何做出最正确的决定,如何非常理性地思考”——“你不需要证明自己比队友强。在我的团队中,一年前,三个人都很强,想证明我是这支队伍中最强的人,但是我发现这件事根本没有意义,只有这支队伍强,至于你强还是弱你的队友,没关系。”

这是一个关键的答案。如果他以前认为自己是最好的,那个时候他开始接受自己可能没有那么优秀,“在那个层次上,世界上最好的人(相比之下),你会发现电脑编程技巧与维护 2005年第9期总第135期,就个人能力而言, “是打不过。但球队不是,我们必须想办法取胜。”

在那之后,事情变得更容易了。他和队友住在一起,承担着让“可乐会写好代码”的队员随时喝可乐,和另一个他完全不感兴趣的队员一起看动漫,只是为了和他们互动培养默契,达成相互理解。他的目的不再是解决问题,而是在这场比赛中夺冠。

那年的决赛,恰好在上海举行,比赛开始的第一个小时,他们就已经被对手甩开。当时,戴文元对队友说,“接下来的4个小时就是我们最后的4个小时,对比完我们就退赛了,我们不用想前一个小时做了什么,只要把握好就可以了。” “最后4个小时,充分发挥我们的岁月。把这一切都积累起来,不留遗憾。” 第二、三、四时辰,他又重复了这句话,当时,三人的心态很平静。

比赛结束前一小时,排名将按照惯例关闭,结果不会实时更新。他们当时排在第四位。但在距离最后的第8分钟,他们用看似不可能的“暴力枚举”方法解决了一个新问题,成为解决问题最多的球队,夺得冠军。

说完,三人精疲力竭,倒在房间里。带着这个代表世界最高水平的奖杯,戴文元告别了三年的ACM比赛历史。

图片[1]-长春一位医生:如何让你的鸟要往哪里飞?-老王博客

更基本的问题

那时正值大三,同龄人开始寻找人生方向。选择冷清还是火热,戴文渊也站在了小道的分岔口。

他面临的第一个选择是确定他的研究方向。在他的描述中,当时的 AI 是一个“一点都不流行”的专业,大家都热衷于图形学,做 CG 渲染,能够去好莱坞。什么是人工智能?剩下的专业选择了一个。他只能向人解释,有一部科幻电影叫《人工智能》。上海交通大学也没有人工智能领域的教师。戴文元被派往香港科技大学向杨强教授学习。

香港科技大学依山而建。实验室没有窗户,也没有手机信号。他被关在里面,根本不知道白天黑夜。他心存疑虑,觉得自己在做一件无人能做的事。

但杨强教授是一个相信并热爱人工智能的“疯子”。学生们总是开玩笑说他们是《西游记》里的师徒。除了师父,其他人都只是想:“我靠,西边那么远,不如回高老庄。” 每次学生萎靡不振,他就被杨强“K-fed”,如果他“K”很多,他就会被感染。“我知道这个人为什么坚持了几十年了,这件事离得这么远,你为什么还……?这个目标怎么了?你没有动摇。” 许久之后,他们也跟了上去。

戴文渊很快就取得了成绩。即使在 10 年后,当他打开他的谷歌学术页面时,他的成绩单仍然闪闪发光。2007年至2008年的两年间,他共发表论文11篇,其中多为Top Conference,迁移学习领域单篇论文被引用次数居世界第三。陈玉强师弟记得,当时这个成绩不仅在交通大学,在国内也是罕见的。那个时候,人工智能还没有那么流行。它一年只收到大约100篇文章。当时中国人不在AI圈子里。戴文元觉得自己的成绩得益于ACM比赛的基础、做事方式、目标导向。

他得到了学术界的认可,但很快就发现事情不太对劲。“我知道如何发表顶级会议的论文,甚至如何发表被很多人引用的论文,但我发现了一个问题——在这个领域,没有什么可以用的。” AI是基于数据的,加上算法可以得到结果,但当时大家只关注算法。“不是算法没用,而是如果你在破烂的数据上比算法好,那么算法就没有商业应用价值,所以我们才会被人嘲笑,说你还在做AI。”

解决这个问题只有一个方法,那就是进入工业领域。他心里苦苦挣扎:“那个时候从学术界到工业界太可惜了,当时有个词叫‘走向工业’,什么叫‘工业化’?如果你走不下去了,写代码。” 但百度对他的诱惑是,它是当时数据质量最好的公司之一,而且肯定会因为商业化的需要落地,所以他毫不犹豫地放弃了博士,加入了百度,成为最年轻的T10科学家,一头扎进了火热的现实。

他在百度的四年工作,可以用一个词来概括,就是“点击率提升系统”。本系统的目的是提高百度搜索的商业化实现。点击率的提高首先让商家满意,因为广告被点击的次数更多;用户不再对他们收到的内容不感兴趣;百度更满意,因为百度是按点击率收费的。这其中的关键是机器学习技术,它将效率提高了 8 倍。

该技术已经得到验证,戴文元认为AI应该有更大的用途。他打过很多仗,愿意调到其他部门做推荐系统、视频、问答,甚至围棋。当然,马上就被驳回了——百度是上市公司,每个季度都有营收预期,而他是背负预期的人,“通常在每个季度的最后一个月,我都是最忙的人之一。”整个公司。没有时间考虑其他事情,先完成财务报告。不久之后,他决定离开百度。

因为希望推动整个AI产业的发展,离开的理由听起来太理想化、遥远、孤立。但其实一切都可以追根溯源——2012年冬天,戴文元还在百度工作,有人在微博上讨论谷歌和Facebook的区别,提到Facebook的一位科学家离开了,因为“他觉得自己的技术完成。用它来计算一个广告的点击率太可惜了。一位朋友艾特告诉戴文元,他留下了“哭”的表情,说“靠墙”。

陈玉强对戴文远的理解是,他一直是一个“问题制造者”。他一直在挑战更基本的问题、更大的问题、尚未解决且不知道如何解决的问题。陈玉强想起了一个细节。离开百度的时候,戴文元正在琢磨机器人的操作系统是什么。不是因为他喜欢尝鲜,而是因为这是一个新的价值观,一个重要的价值观。

他们一起从学生时代到创业,戴文元想做的事,没人做过。“不是已经有问题了,谁提出算法A,他就提出算法B,如果他不提出,他就会提出一个新的问题,这也是比较痛苦的一点,我们没有人可以复制,只有别人复制我们。”

闭眼跳下

2015年,陈玉强突然接到戴文元的消息,邀请他创业。陈宇强当时负责构建今日头条最关键的推荐系统。听说他要走了,张一鸣每天都跟他聊到深夜。

但陈玉强看重两点。首先,戴文元是一个值得追随的领袖。其次,他要做的是做一个纯粹的人工智能平台公司,让更多的企业和个人可以用上AI。跳下去”。另一位联合创始人胡世伟当时也加入了。他们当时互相开玩笑说:“你跳,我跳。”

戴文元决定创业的原因很简单——他看到了人工智能的广阔市场,终于明白了自己想在大公司做多少。

离开百度后,他去了华为,想看看华为是如何为企业服务的。曾竞标华为为一家银行搭建大数据平台。他发现,即使搭建了平台,把数据放到平台上,也无法创造价值。他为银行做了几个AI应用,小额贷款营销效率提升了25倍,最终银行买下了华为的大数据平台。而他做的人工智能应用本质上只是一块“垫脚石”,他自嘲是“演员”。

客户当时也表示想购买AI系统。戴文元受到鼓励,并与公司进行了沟通。该公司的结论是:这不是我们的产品。如果你买一个大数据平台,我可以给你这个系统。这件事让他认清了现状——当时华为的主渠道是“端、管、云”,而他想做的却是主渠道之外,他无力改变。

就这样,一群怀揣人工智能理想的年轻人开始了在深圳福田口岸私人出租屋的第一步。当他们开始为第一个客户服务时,他们只有两名正式员工和两名实习生。服务结束六个月后,对方催开发票,发现公司内无人熟悉开票流程。

创业的第二年,刚刚站稳脚跟,戴文元就提出要做AutoML技术。这项技术的核心是在其中封装了极其强大的算法电脑编程技巧与维护 2005年第9期总第135期,让机器能够自动建模。“这听起来像是一个幻想,但它是可以实现的。训练机器就像训练小狗一样简单。客户定义目标,收集数据,为机器设置行为和反馈,然后抽象出规则和算法。” 他在接受采访时说。

因此,许多过去需要手动完成的任务,例如选择模型、调整参数和处理原始数据,都不再需要。只需要组织数据并将其提供给 AutoML。这大大降低了普通企业的门槛和成本。用戴文元的话来说,任何能熟练使用 Excel 的人,经过数小时的训练,都能使用 AutoML。

这个门槛可以降低多少?就像我们提到的产科医生和候鸟一样,这里也有一对夫妻开设的摄影工作室,他们自己做了一个AI客服。

AutoML 今天取得的成就不是一个合乎逻辑的故事。FourthParadigm 决定做 AutoML 时,它的开发速度并不快。有点像2005年,戴文元在香港科技大学实验室做这件事时怀疑自己。但2019年的今天,已经是陈玉强所说的“黎明”——AutoML已经是人工智能领域最火热的技术之一。第四范式也是唯一一家由五家主要银行投资的初创公司。去年底估值超过10亿美元,进入“独角兽”行列。

谈起明天的理想,戴文渊又回到了过去。他记得,在微软制作 Excel、Powerpoint 和 Word 等 Office 软件之前,打字是一项非常专业的工作,而电影则用于课堂演示。在苏州上小学的时候,老师让他们用旧版的WPS在机房打字。那个时候,世界上能做到这一点的人寥寥无几。他想做的事,就像微软一样——每篇文章的作者怎么能自己打字。“如果纵向比较,做AutoML要难很多,但如果从历史上看,那时候做Word不难吗?”

他有时会想,如果有一天公司不需要他负责任何事情,他会重新成为一名科学家,专注于 AutoML。

他不是那种严格遵守规则,喜欢“玩花”的人——编程中有各种各样的规范,他经常不遵守,写一些完全不遵守规则的程序,但执行效率极高。当然,这些代码别人拿不下来,是不可维护的。第四范式中的前 10,000 行代码是他编写的。那时他刚刚创业,白天作为创始人忙着各种事情。半夜的12:00,到了他最好的状态写代码的时候了。他只是坐在黑暗中,开始在键盘上打字,这是他一天中最舒服的时间。

如今,距离他在香港潜心研究人工智能,两年发表11篇论文,已经过去了10年。这些年他进了这个行业,然后自己创业,论文的产量并不高。今年是一个高峰。发表论文3篇,戴文远的名字再次出现在谷歌学术。这些论文都与他最关心的 AutoML 有关。

“时间的力量”系列视频

制片人|张涵郭兴安

策划|焦陈刘斌

导演|刘军

影像摄影|刘子飞、刘军、李子硕

编辑|刘子飞

涂色|一鸣

© 版权声明
THE END
喜欢就支持一下吧
点赞0
分享
评论 抢沙发

请登录后发表评论