1. 首页>>分享

周鸿祎谈企业大模型应用:破破亿热象却难挂钩业务,勿追求一个解决所有问题

不要追求一个大模型解决所有问题

在座各位在春节期间都目睹了 DeepSeek 一周用户破亿的热闹情形。许多企业家朋友在企业内部已部署了 DeepSeek,期望能给业务带来提升。不过,最近有不少企业家朋友跟我讲,尽管已经部署了,但不清楚该如何与业务相联系。

面对这种情况,周鸿祎针对“企业如何用好大型模型”给出了建议。他认为,企业部署大模型以及使用 AI 的目的较为清晰,一是提升产品或服务的能力与价值,二是提升品牌或组织的影响力以及客户的满意度,三是降低现有的业务成本,四是增加现有的业务收入,五是孵化新的业务或创造新的收入来源。周鸿祎直言,一方面不能低估大模型的未来潜力,另一方面也不要高估大模型现在的能力。

现在大模型自身正处于探索与发展的阶段,企业无法制定极为复杂且完整的 AI 战略。所以,最为重要的理念是不要期望一个大模型能够解决所有的问题,而是要挑选垂直应用的场景,甚至可以是一个大模型去解决一个垂直场景的问题。周鸿祎如是称。周鸿祎提及,企业要培养员工的“AI 素养”。全体员工都需参与其中,从高层到底层要形成 AI 文化。要鼓励一线员工能够熟练地使用 AI。

从技术路径方面来说,周鸿祎建议企业去选择基座大模型,其中首选的是能够进行私有化部署的开源模型。在他的观念里,闭源云端通用大模型存在一些状况,像是不能够在本地进行部署,缺少政企内部的相关知识,存在着泄密的风险,规模过于庞大而无法进行定制,成本也比较高昂。

DeepSeek-R1 这类开源模型既能实现私有化部署,又能做到定制及剪裁。更为重要的是,它几乎是免费的,成本极低。周鸿祎表示,除了 DeepSeek 之外,蒸馏小参数模型也能够作为基座模型。并且在一套组织当中,可以存在多个基座大模型,像文字大模型、推理大模型、编码大模型、视觉大模型、声音处理大模型等。不同的能力是由不同的基座模型来完成的。

打造分布式算力,以推理算力为主

基座模型选好以后,就需要规划算力网络。

周鸿祎明确表示,大型企业具备使用专有云算力的能力,同时也可以自行建设算力中心,并且还能够进行购买。中小型企业则可以尝试去使用公有云服务,或者利用一般配置的电脑来部署 7B、14B 这样的小参数模型。在算力类型方面,企业最初不需要配备用于训练的算力,主要需要的是用于推理的算力。

在应用方面,周鸿祎提出,企业首先要判断 AI 是否能够介入,接着去寻求最大的收益。要做到“对上服务领导,对下助力员工”。把公司内部的流程仔细地进行拆解,将其拆分成多个垂直的场景,然后找出在各个场景中存在的堵点、卡点,以及大模型是否有能力去解决这些问题。在做好准备之后,还需要建设“四大支柱”。

具体而言,周鸿祎所提及的“四大支柱”分别为:其一为“打造知识库”;其二是“构建智能体”,此相当于给大模型赋予了“手”和“脚”,使其能够使用工具;其三是“打造垂直大模型”;其四是“打造企业专用能力和工具”。

周鸿祎称:为何今年智能体比大模型更为热闹呢?这是因为企业期望大模型具备“手”和“脚”,能够去执行具体的任务。然而,要想构建起通用的智能体,其难度是相当大的。所以,企业更应当去思考如何打造针对垂直业务的专业智能体。

周鸿祎指出,目前市面上智能体提供的是通用的“泛能力”。企业使用智能体时,需把内部业务系统转化为“工具”,让智能体能够调用,以此参与内部业务和流程。他强调,若没有智能体,大模型只能进行单步工作。一旦要处理核心业务、担任关键岗位,就需分解执行复杂流程。周鸿祎提出了以下几点建议:其一,大模型在企业内部的应用必然是由业务来主导;其二,大模型无法取代政企原有的 IT 系统;其三,企业的数字化水平倘若越高,AI 就越能够加速数转智改。

每日经济新闻

本文采摘于网络,不代表本站立场,转载联系作者并注明出处:http://www.mjgaz.cn/fenxiang/275434.html

联系我们

在线咨询:点击这里给我发消息

微信号:13588888888

工作日:9:30-18:30,节假日休息