对话冯·诺依曼理论奖得主叶荫宇：ChatGPT于行业智能，更像是全科医生对专科医生

斯坦福大学讲席教授、冯·诺依曼理论奖获得者：叶荫宇

钛媒体特别专题策划《数字思考者50人》：探访中国50位独具代表的数字化思考者。我们理解的 TechThinker ，涵盖了中国数字化浪潮中的技术践行者、政策制定者与投资决策者。在这场长达10年的乘风破浪中，我们每个人都在分享技术进步的果实，却鲜有人知道结果背后的故事。我们期待通过《50人》，还原中国数字化推进过程中的关键决策，同时也为你呈现数字思考者们的管理与经营之道。

国际市场震荡不定，供应链波动剧烈、芯片短缺、碳排限制......百年变局叠加世纪疫情，大环境的震荡层层传递到企业生产制造中，当这些限制条件突然产生的时候，整个企业的生产运营如何应对？怎样能够在受到限制的情况下，仍然最大化利用产能去实现生产？

这时简单依靠经验“拍脑袋”决定显然不再奏效，因为人工经验总是基于过去已经发生的，没有办法快速地应对不断产生的新问题，也无法精确优化一个高度复杂与随机的大系统。

尽管在工业数字化的进程中，方式方法持续升级，但是常规的数字化系统要么协同性不够，要么精准度较差，计算和决策效率低，一旦遇到变化就显得非常脆弱，更不要说在多种突变因素之下快速制定优化方案，没有办法真正发挥数据的价值，而此类问题正是智能决策技术所擅长解决的。

小到一个需求的波动、一个生产场景下的急单插单，大到疫情、国际形势这些黑天鹅事件，智能决策就是在大量的约束条件下，快速找到最优的解决方案，让资源的使用效益最大化。比如订单满足率最大化、库存成本最小化，或是运输成本最小化等等。

随着数字化转型进入深水区，外部经济增长放缓，对于企业而言，如果不紧跟步伐做出转型，那么面临的就不是赚不赚钱的问题，而是生与死的问题。越来越多的企业渴望通过引入智能决策，以直观发现、分析、预警数据中所隐藏的问题，及时应对业务中的风险，向最优决策无限靠近。

智能决策的共识在倒逼中逐渐建立起来，但实践道路比想象中艰难得多、复杂得多。

技术被寄予厚望，但技术也有能力边界。随着ChatGPT大热，很多人都开始畅想AI技术能在工业的复杂决策场景中发挥越来越重要的作用。

从上世纪80年代开始，叶荫宇教授就一直专注在运筹优化领域的研究。2009年曾获得美国运筹与管理学会最高奖，冯·诺依曼理论奖，也是获得此奖的首位华人学者。在他看来，精确的数学建模仍然是主流的方法，运筹学的诞生就是为了解决问题，因为有可解释性、可控性，“有些企业管理者会特别关注决策结果的可解释性。特别是在工业运用中，有些是多目标的，不是只有一个目标函数，要权衡各种不同因素，权衡不同的利益，完全靠黑箱是会有问题的。”

不过，技术的使用并不是“非黑即白”的选择题，数字化的商务决策中，一般要经历建模、求解、决策多个流程，AI的强项在于量化、需求管理、规律性分析，而决策中则需要平衡与优化一些高度复杂，约束互相制约的优化模型和运筹学模型。盲目的追求单一技术的“通用性”并不是最好的方式，“AI也不会完全取代优化算法”，将运筹学和AI深度融合，各取所长，才是更实际的做法。

比起短平快的To C企业,To B企业接受考验的链条更长、维度更多，技术之外，要解决的问题和场景更复杂。一方面既要深入行业，又要避免掉进劳动密集型的定制化陷阱。另一方面，像经营决策、计划排产、资源调度等等，这些答案都掌握在行业Know-How手中。

技术与实践短兵相接的地方不是一个接触点，而是一个多方位的接触体，既要向内招揽行业专家，归纳不同行业底层逻辑，平衡服务边界与服务成本，又要向外坐在一起了解一个个具体的需求，向下扎根服务能力。

面对技术在业务面前“自证价值”的问题还要拿得出“真金白银”的量化指标：在库存上节约了多少钱，在订单满足率上提升了多少个百分点，产能利用率提升了多少，产能浪费降低了多少，碳排放指标合理利用了多少……

凡此种种，我们不难看到，智能决策技术落地的背后早已不是一个方向性的大问题，而是实践过程中十个、百个、千个的小问题。此刻，唯有扎扎实实的苦功夫，才是真实有效的。

去年下半年，叶荫宇教授开始了六年一次的学术假期，这次他把大部分时间放在了国内，走访企业、在智能决策公司杉数科技指导算法研究、在大学授课。借此机会，钛媒体APP和叶荫宇教授聊了聊运筹优化的应用发展与趋势、AI的影响和融合等话题，希望借由他多年的学术研究视角，以一个更理性的角度看待当下的热点与实际问题。

从AlphaGo到ChatGPT，深处是求解优化问题

钛媒体：您有关注目前大热的ChatGPT吗？

叶荫宇：从我的角度来说， ChatGPT在应用场景中还是属于一种你来我往的形式，有人把它叫做“博弈”，有人把它叫做interaction（交互）。之前的AlphaGo的场景是下围棋，也是你来我往的博弈过程。其实严格地说，瞄准这种场景的过程，在运筹学中很早就有模型，例如常见的“马尔可夫决策过程”（Markov Decision Process），就是刻画如何在不同情况下，采取最优的行动（action）。

最近又出了一个Markov Decision Process with generation（生成式马尔可夫决策），generative有两个含义，一个含义就是更多的案例，更多的语种，用ChatGPT来说就是更多的文本出现了。可以采索的action可以不断地创造新的答案，新的回答。ChatGPT 将大语言模型和强化学习有机的结合起来，使得我们可以对语言模型的输出质量进行有效评价，这样的奖惩反馈机制可以使得ChatGPT不断进步，创造出更好的文章。而本质上，强化学习也是一个基于马尔可夫决策过程的多阶段复杂优化问题。它将机器学习和马尔可夫决策过程融合起来，自动地学习马尔可夫决策过程中的奖励函数和状态转移过程。

钛媒体：也就是说，不管是AlphaGo还是ChatGPT，最终都可以追溯到求解优化问题。

叶荫宇：所有这些模型都是先要搭建一个框架，多少层，多少个函数源，是什么架构等等，最后架构出来。AlphaGo和ChatGPT某种程度上可以看作数据，算力与算法在工程上的完美结合与实践。在这个过程中，每个部分都发挥了极其重要的作用。毫无疑问，算法是其非常核心的重要环节。

钛媒体：之前看过您一个发言，讲到了当年选择专业的时候，也是AI和运筹学做了一些权衡的，后来还是选择了运筹学。

叶荫宇：对，我1982年去美国的时候，AI也是非常火热的时候，当时我还参加了一个叫做“构造一个专家系统”（Experts System），就是建一个好的方法，希望把所有专家的东西整合起来，形成一个统一的回答、统一的意见。

但是当时有两个瓶颈，第一个是数据不大，当时没有网络，大家只能在报纸上搜集东西，太慢了，没有很大的数据来训练那个专家系统；第二个就是哪怕数据大了以后，算力跟不上，就不可能把模型训练得很好。

后来我就改做运筹学，搞算法，在某种意义上也是因为那个方向当时遇到了瓶颈，转而去搞底层算法构造、底层算法设计。

不要盲目AI化，要和优化算法融合使用

钛媒体：我们和一些做大模型研究的人交流过，他们说原来很多算法随着参数、数据的增加，曲线会有平缓的趋势，但现在在大模型下，只要往里面灌更多数据，加更多参数，曲线还是在非常陡峭地在增长。所以我也想听一听您的意见，人工智能这套打法，将来对运筹学的理论和实践会有什么影响？

叶荫宇：运筹学和ChatGPT能做事情还是有一些区别的。ChatGPT包罗万象，什么问题都能给你输出一个看似说得过去的回答，但是在专业性很强的问题上，比如超大规模复杂系统的快速求解，它肯定是做不了的。而且ChatGPT目前还很难自主的进行数学建模，比如为一个大规模复杂问题，准确的收集相关的数据，分析约束，自动进行建模。打个比方，某种程度上，他更像是一个全科医生，各种病都能看的，有些问题看得还不错。运筹学，以及求解器，像是一个专科医生，在某些特别复杂的专业问题上，造诣会更高深一些。

运筹学有时候也有一些类似做法，比如穷举法。比如说有一个优化问题，现在算力这么高、这么强，把所有解都求出来，然后找一个最好的。但是这样的话比较暴力。

目前像ChatGPT这种，毕竟有时间让它训练，哪怕训练一个月也可以等得起，就算是出下一代的GPT也可以。但是有些实际问题是等不起的，比如说现在杉数科技搞了一个南方电网的现货市场的调度问题，这个调度过程中状况变化太快，理想状态是最好是每秒钟都能重新计算，我们把它叫做online optimization（在线优化）。美国电力日内市场的计算间隔为5分钟，但国内日内市场更为复杂，当前的计算间隔为十五分钟，计算未来一小时（以五分钟为颗粒度）的机组调度问题。时间颗粒度的细化大幅度提高了调度模型的复杂程度，同时要求算法的求解能力也需要提升。

再就是从人类的追求来说，暴力法总是太粗暴了，目前的做法确实可解释性也是个大问题，本来AI就是要把算法搞得更精细，能够节省成本，用最少的时间，最小的案例办更多的事，这也是为什么当时在美国后来对算法比较情有独钟的原因。

另外，我觉得AI也不完全是靠暴力的。AI的底层设计中一定是有方法的，不然为什么说国内有些同样的产品可能训练不出来，不然它也可以暴力致胜。所以这点上讲ChatGPT肯定不是简单的暴力方法，必然有更好的技术，比如说在底层设计中运用了最好的优化算法。实际上国内要赶上去，不光是模型、架构、数据要比它全，也要把算法设计、底层训练搞得更精细，更有效。

钛媒体：基于大模型的人工智能，其实是一个算法的黑箱子，很难追溯内在的逻辑。在整个求解器的模型里，现在存在不存在这样的黑箱子问题？

叶荫宇：优化里确实也有黑箱问题。比如有一类问题我们连建模函数的形式都没有，需要用到优化的zero order method（零阶算法）来进行求解。这类问题的应用场景越来越多了。比如说石油行业的钻井问题，由于看不到底下的石油分布在什么地方，因此在什么地方钻井，在什么地方注水，这些就完全没有表达式，只能观测结果，只有input（输入）和output（输出）。

又比如说工业界，当时我们做优化，结果钢铁行业突然来了一个碳排放，这个环境因素怎么表达成一个解析式放到优化目标里呢？此外还有一些社会问题，政策场景，甚至包括直播带货，这个模型有解析式吗？有公式吗？要优化什么东西？只能通过做了这个事以后得到，是a就有这个结果，是b就有那个结果，在某种意义上，这些都是属于一种黑箱优化问题。

以前我们认为要用优化求解器必须要有一个所谓的特定目标函数，而且目标要有一定的表达式，约束也要用数学公式来表达。现在要跳出这个圈子了，就是要对付黑箱子。另外黑箱子问题的背后还是有一个规则，有一个好和坏的区别，虽然可能数学性质不好，甚至导数不存在，但是只要两个东西能够比较谁好谁坏，就可以做优化。

钛媒体：黑箱会不会导致决策失控进而带来风险？

叶荫宇：虽然模型是一个黑箱模型，但是解必须要有可解释性，这是我认为最重要的问题。而且，要能够控制。

我们现在特别强调问题的鲁棒性，黑箱模型的决策一定要有鲁棒性，不能让它肆意妄为，通过这样的结果保证风险可控。我自己认为这要通过决策模型间的调节，把鲁棒性加上去，把风险函数加上去，这样尽管黑箱，还是可以兜底的。

钛媒体：ChatGPT出来后，有些人就在预测说AI很快就会有自主意识。

叶荫宇：我倒不觉得用ChatGPT做决策会带来失控，应该还是可控的。AI最终还是人在它的脖子上拴了一个绳子，你怎么引导，它就会怎样。包括黑箱这些东西，也可以通过调整参数让它的回答变成可控的，不是不可解释的。

我现在倒是担心另外一点，就是如果我们这个社会普遍都来用这种ChatGPT，会带来单一化的风险。如果大家都用这个做作业的话，ChatGPT就是唯一标准，这个社会就不那么多姿多彩了，真正这个社会要能够开放，还是要多样化，还是要有一些个性化，不同的声音、不同的创新。

钛媒体：您提的这个也是我有点担心的问题，现在大家如果都AI化，就有点像当年做高频交易的状态，都用同样的算法，会在一个时刻形成刺激振荡，变得非常可怕。

叶荫宇：对，在某些特定环境下，可能要这样，但是对一个社会来说，并不希望都是一个面孔，都是一种声音。所以在这个意义上，我觉得反而是另外一种风险。

另外，我觉得AI还不能完全取代优化算法，优化算法还是有一定的规律，有一定的机理的，而且把它的思路放进去，有些企业高层是能够理解的。现在有些企业高层还是觉得AI不可信，质疑是怎么出来的？下一次出来会不会又不一样？或者出来的话，为什么这个比那个好？特别是在工业运用中，有些东西是多目标的，不是只有一个目标函数的，要权衡各种不同因素，权衡不同的利益，所以完全靠黑箱还是有问题的。

求解器要向多样化发展

钛媒体：您在很早的发言里提到过行业定制版的AI，在您看来，行业定制版AI落地的难度有多大？瓶颈在哪里？

叶荫宇：我跟葛冬冬、王子卓（两位均为杉数科技联合创始人）他们也提过，一定要做有定制化的求解器。我们以前搞运筹学，总是希望有一个算法能够解所有问题，后来发现，追求能够一个算法解所有的问题是很好，但却忽视了很多问题本身是有特点、有特征的。我们要根据问题的特征，选择不同的方法，有时用内点法，有时用单纯形法，有时用原始型的方法，有时用对偶的方法……

最近我们就在做这个试验，针对不同问题，得出在那个特征下的最好的工具，也是通过机器学习的方式，我们把它叫ML To Optimize（机器学习驱动的优化方法）。

以前我们在学术上认为搞特定问题的算法设计是不好的，但是你仔细想想怎么能够把问题解决，哪怕用不同武艺对付不同的敌人，这在某种意义上也是说得过去的，这就是定制化的问题，而且这个优化，你可以看到采取不同方法，速度可以提高十倍、一百倍。

钛媒体：您觉得这个行业特点怎么体现出来呢？在将来的这套智能决策里，比如说行业know how怎么体现出来呢？

叶荫宇：行业中的know how要结合领域知识，我现在感觉有个问题是国内的人才培养上，搞算法的和搞业务的是分开的。从教育层面要培养这样一种人，对算法也懂，但是不一定要非常精，但是业务又很熟，这个中间的桥梁作用非常重要。

另外我觉得从我们搞求解器、搞算法的这些人，也需要主动走出去，了解某一个行业，了解他们的痛点，求解器作为最底层的软件，需要在外面做很多包装，需要很多系统，很多软件，这样才能提升它的应用效率。

钛媒体：做定制化的话，投入和产出以及未来规模方面的问题如何平衡？

叶荫宇：比如说做金融决策的FICO Xpress（美国一家分析软件公司），就是把优化作为核心部分，然后在核心上面构造了更多层的应用，那样就大多了，哪怕只是用到金融行业里，用户已经足够多了，结果它就更容易吸引顾客，更容易卖钱，市值也高。

钛媒体：以前求解器相对小众，现在华为、阿里这些大厂都参与了进来。

叶荫宇：光有求解器的话，这个量很小的，它是太底层的路线，大投入的话我觉得会浪费一部分资源，搞什么东西不能太多，大概三五家就可以了，搞得太多的话就恶性竞争了。

可以去做，但是不一定要做求解器，比如专门做一些能源方面的、供应链方面的或者通信方面的，这就是我刚才说的个性化，我们最缺的是这样的东西。

在美国，做求解器的主要是三家：Fico、Gurobi、IBM Cplex。谷歌虽然也有一些搞求解器的人，大规模线性规划搞得还不错。但是他们更注重研究这个东西如何加速DeepMind或者底层的一些东西，微软的那个部门直接叫Quantum Computing，跟我也保持交流，对量子计算和其它一些业务相关的算法更强调一些。

钛媒体：优化算法技术有很多成熟的应用场景，例如金融、供应链、物流等等，这几年有什么新的应用场景被发现？比如前面提到的能源类

叶荫宇：能源不是新应用场景，很多年前，国内的南方电网、国家电网，都有很大的OR（Operations Research，运筹优化）团队，专门做优化的，并且能力不错。

但是新能源如何接入，这就是一个新问题。比如怎么更加安全地把一些新能源融合到供电体系当中。比如风能光能容纳进来如何考虑它的随机性，电动车的充电桩怎么布局。

还有就是在医疗治病方面，包括癌症治疗决策，医疗资源规划等方方面面，优化都用上去了。再一个就是前些年比较火的自动驾驶，也会用到很多优化问题，就是最优控制的问题。

钛媒体：在国内外，运筹优化的应用场景有什么样的不同吗？

叶荫宇：在发展趋势上，其实没有很大不同。决策环境中比较有规则的，规则比较清楚的，标准比较统一的，运筹优化用得都会比较好一些。

但是我个人认为运筹优化反而在国内有更好的发展空间，你像我刚才说的自动驾驶能不能上道，可能在美国要真弄个十年还弄不下来，但是在我们国内可能很快可以达到一个共识，运筹优化也是同样道理。

不过，国内也要让那些企业有更多的自由空间和环境，不要把他们的手脚绑定了，让他们能够更有信心一些。

钛媒体：目前优化算法、求解器产品的落地，都还是需要极高的智力资源投入，这也限制了这个技术在产业的渗透速度。您觉得这个问题的答案是什么？

叶荫宇：这个发展渗透需要环境，需要生态构造慢慢培养，人家也在看我们目前正在做的这个事情，到底能不能起来。

钛媒体：这些应用的企业有什么共同特点吗？

叶荫宇：都是头部企业或者腰部以上企业，规模比较大。特点有三个，一是数据完备，没有数据，这个事情是做不成的；二是意识完备，领导重视，也有专门的部门或者人力；三是体量大，意味着它有足够资金投入，愿意花钱做这个事情。

钛媒体：在应用智能化技术来帮助决策方面，您对国内企业的建议是什么？

叶荫宇：还是要一步步地走，像美国那样，从一些比较确定的、可解释的决策模型、决策算法，主要是运筹优化方面的来做起，做得更高了以后再看AI。因为美国也在尝试AI怎么用，现在也比较彷徨，主要是它不能保证一定的鲁棒性，在一些像航空等对安全性要求很高的领域，要是出一点错的话，都是不得了的，是要用传统的工具。

钛媒体：刚才也谈到了学术的起起伏伏，AI在美国的确做了很多年的学术冷板凳，它一直不是显学，这几年因为各种原因，算力、数据等等，一下子就起来了。您怎么看待美国这么年学术的起起伏伏，而且现在也在谈基础创新，您觉得坐冷板凳的能力是不是才是这种基础创新最需要的东西？

叶荫宇：我觉得AI最近的发展不能说是AI自己凭空而起，而是得益于其他学科的不断发展，有很多综合因素需要考量，比如很重要的两点，一是硬件方面，计算机越来越快；另一个是算法的改进，比如大规模线性与非线性优化的算法不断提升。

所以在这个意义上确实要耐得住寂寞，只要有兴趣你就去做，尽管当时不是在风口上，我觉得这也是好的。有时候搞研究不要追风，政策也不一定说因为这个东西很火，就赶紧把资源都放到那个地方去。各个学科像是一个网一样，不均衡发展的话，还是会被拖后腿。（本文首发钛媒体APP，作者｜韩敬娴）