国产大模型:既需向上突破也要向下扎根
“请问您用DeepSeek吗?”
“我用,我本身专业是计算机专业,我对人工智能有偏爱。”在3月4日举行的十四届全国人大三次会议的新闻发布会后,大会发言人娄勤俭面对现场记者采访时的这句回应火了。
今年春节期间,国产大模型DeepSeek凭借低成本、高效能、强智能的应用体验给人们留下了深刻印象。今年的全国两会上,“国产大模型”“DeepSeek”也是被许多代表委员反复提及的高频词。
近年来,随着我国人工智能大模型产业加速发展,越来越多的国产大模型表现惊艳。作为数字化时代的核心驱动力,人工智能正加速渗透进入国民经济的多个领域。在不断向上突破性能天花板的同时,国产大模型应如何扎根产业实践,为产业升级赋能,成为代表委员们热议的话题。
垂直模型扎根产业土壤
有问必答的快速响应、清晰明了的思考过程、全面翔实的参考资料……通过通用大模型,许多人开启了与人工智能的第一次“亲密接触”。作为人工智能领域的重要突破,通用大模型具备强大的语言理解和生成能力,能够为多个领域提供智能支撑。
随着我国产业数字化进程不断加速,各行业对人工智能的需求也愈发精细化、专业化。传统的通用大模型在落地产业场景时,往往无法与具体业务精准结合,导致“水土不服”。在此背景下,专为产业细分需求打造的垂直模型应运而生,成为大模型技术落地产业应用的新趋势。
“我们做大模型第一天就确定了‘1+N’的战略路径,即‘1个底座大模型+N个行业大模型’。我们结合通用底座、工具链和知识工程,拥有了‘建算力、理数据、训模型、落场景、保安全、精运营’的全套解决方案。”科大讯飞股份有限公司董事长刘庆峰代表认为,通用大模型底座的天花板正被不断打破,应用场景落地已进入红利兑现期,需要以更少成本、更低算力、更高效率推动落地。
例如,借助阿里通义等通用大模型的底座能力,钉钉面向业务场景打造出AI助理产品,覆盖制造、医疗、零售、教育等多个行业。在金石机器人常州股份有限公司,通过学习、沉淀大量机器人专业知识,钉钉AI助理直接服务全国1000余家经销商,高效解答各类产品售后问题;同时,它还可以根据问题描述,一键生成工单,并指派给对应负责人,将售后问题的解决时间从半个月缩短至3天内,显著提升了企业运行效率。
“大模型在垂直领域大有可为。”360集团创始人周鸿祎委员表示,中国大模型发展的重要方向应该是借助产业和场景优势,将大模型与业务流程、产品功能相结合,寻求多场景应用,实现垂直化和产业化落地。
加快形成“数据飞轮”效应
我国拥有联合国产业分类中的全部工业门类。在500个工业品种中,有四成以上产品产量位居全球第一,产业具有全、多、大的独特优势。庞大的产业规模为行业垂直大模型落地提供了肥沃土壤,同时也带来了风险挑战。
产业数据是垂直大模型的“养料”。我国产业种类丰富,但也造成产业数据类型和结构多样、数据质量参差不齐等难题。谈及大模型落地产业应用,多位代表委员提及,应推动产业数据共享,加快高质量数据收集利用,在产业领域形成“数据飞轮”效应,即通过数据的不断积累和利用,驱动大模型性能持续提升。
中国电气装备集团有限公司科技创新部部长张帆代表认为,许多制造企业数字化转型起步晚、基础薄弱,生产过程中的数据采集不全面、不及时;工业数据又往往存在噪声大、格式不统一、关联性差等问题,缺乏行业数据标准引导,难以为大模型训练提供足够的高质量数据。同时,受限于数据安全风险、商业利益保护等因素,企业间筑起了高高的“数据围墙”,数据共享存在瓶颈。
基于此,张帆建议,应加快形成工业领域统一的人工智能数据格式规范和具体行业标准等,促使企业间对数据资产的交易基础达成共识;龙头企业要发挥链长作用,面向战略性高价值场景,建立需求牵引、格式统一的高质量工业数据集。
围绕大模型产业落地中的数据瓶颈,多地已开始行动。例如,北京市发布的《北京市推动“人工智能+”行动计划(2024—2025年)》中提出,依托北京数据基础制度先行区,打造安全可信数据空间,引导企事业单位开放并汇聚高价值行业数据。