如何在具体行业和场景中落地,如何把大模型的能力在应用层上跑通,正在成为大模型较量的关键。
撰文|蓝洞商业 赵卫卫
打开微信,搜索「腾讯混元助手」,在内测版小程序注册申请,就会跳出「排队中」界面,「你已经在等待体验中,本期内测开放名额有限,加入成功将会有短信进行提醒。」
(资料图片仅供参考)
这是目前,一个普通人接触腾讯混元大模型最快的方式。
腾讯的大模型,姗姗来迟。终于在9月7日的腾讯全球数字生态大会上发布,拥有超千亿参数,腾讯云、腾讯广告、腾讯会议等都已经开始接入。
腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生介绍:「腾讯混元大模型拥有超千亿参数规模,预训练语料超2万亿tokens,具有强大的中文理解与创作能力、逻辑推理能力,以及可靠的任务执行能力。」
「已经有 50 多个产品在应用混元大模型,在腾讯内部,混元大模型已经成为业务底座,可以说腾讯已经全面拥抱大模型。」腾讯集团副总裁蒋杰表示。
坐拥微信和QQ两大国民级应用,大语言模型的C端落地场景是腾讯最具想象力的部分;而大语言模型如何在B端市场的行业侧落地,也成为腾讯在今年9月逐渐开放的能力方向。
ChatGPT带动了大语言模型创业热潮。自今年3月以来,先是百度发布文心一言内测版;4月,阿里旗下的通义千问也开始内测,此后国产大模型争抢发布,被行业内戏称为「百行千模」。
如今,腾讯的大语言模型混元虽迟但到,终于让BAT在大语言模型的战场上再次成为对手。
之前,包括百度文心一言在内的第一批大模型在8月31日通过备案正式上线,意味着大模型市场竞争进入了公开化的全新阶段,面向用户全面开放,也就加速了产品应用的落地。
百度集团执行副总裁、智能云事业群总裁沈抖曾对媒体说,在文心一言开放当天,在百度智能云千帆大模型平台(百度面向企业端推出的大模型开发与管理平台)上,日活企业数增长超过 40%。
左手to C,右手to B,已经成为大模型的一体两面。
而「百行千模」带来的审美疲劳,也最终让行业认识到,如何在具体行业和场景中落地,如何把大模型的能力在应用层上跑通,正在成为大模型较量的关键。
在争抢用户和客户为主题的大模型冷静期中,腾讯如何后来居上也成为留给自己最大的考验。
大模型争抢方向:更实用
对标ChatGPT一直是国内大模型的主要基调,「在口语化文本精确理解、超长记录高效提炼、理解生成实时处理上,腾讯混元大模型中文能力已经超越GPT3.5。」
蒋杰称,「你可以把混元看作是一个在内部开源的模型,公司的每个业务都可以看到我们发布的所有能力,并基于这个能力去与应用相结合。」
混元大模型的核心卖点在于,它是由腾讯全链路自研的通用大语言模型,可以流畅进行专业领域的多轮对话,具备强大的中文创作能力,复杂语境下的逻辑推理能力,以及可靠的任务执行能力,对行业更重要的是,混元将作为腾讯云MaaS服务的底座,客户可直接调用或作为基底模型构建专属应用。
而数字生态大会上,蒋杰展示混元大模型的一个突出能力,就是「更可靠」。
此前,大模型产品经常出现答非所问胡编乱造的情况,这就是突出的「幻觉」问题,蒋杰通过关羽和秦琼的问答案例,意在说明经过大量的研究和尝试,混元大模型找到一种更强大的推理和思维能力,有效降低大语言模型30%-50%的幻觉率。
「百模大战」开战已久,比拼参数并不能成为当下大模型市场竞争的最大亮点。谁在市场上更实用,谁能在自己的生态中跑出爆款应用,成为当下大模型厂商们争先巧夺的关键之一。
比如百度就通过「文心杯」创业大赛,选拔百度大模型生态内的优秀选手,通过投资和技术支持等方式,让基于大模型上的应用层开发和创新,成为大模型进入更大市场的关键变量。
也就是说,谁的大模型更实用,谁的大模型拥有更多伙伴,是当下大模型厂商最焦虑的事情。
而蒋杰在发布大模型时提到,相比混元大模型的能力测试,腾讯更关注大模型的应用,旨在助力行业侧的能力提升和效率提高,混元大模型已经在腾讯会议、腾讯文档、腾讯广告等多个业务取得明显效果。
他举例说,混元大模型在腾讯文档中,已经支持数十种文本生成场景,可以做到上百种专业文书的规范书写;支持数百种Excel公式生成,Exce公式生成的正确率,GPT3.5达到了71%,而混元达到了82%;
在腾讯会议的应用中,混元大模型与腾讯会议打造的AI助手,只需要用户用简单的自然语言指令,就可以完成会议内容的提取、分析、生成内容总结等复杂任务;
在腾讯广告的应用中,腾讯也试图去适应不同行业和地域的特色,满足千人千面的需求,让图片、文字和视频等广告内容更自然结合。根据腾讯透露的数据,混元大模型生成的广告内容采纳率,高于目前火热一时的大模型应用层面产品Midjourney。
总体来说,腾讯混元大模型更实用能力的展示将在B端和C端两个方向探索。
一个是C端用户层的挖掘,虽然混元大模型在微信上的应用还没有全面公测,但根据发布会透露的内容,其依然沿用文本生成能力展现,不管是文案创作还是AI绘画,其本质上都是创意层面的加持,让营销等行业的生产力得以提高。
另一个是B端行业侧的应用升级,混元大模型是通用底座,在底座之上构建更具针对性的行业模型是关键。
比如,打造零门槛对话式数据分析的企点分析AI助手、提升精准度和泛化性的OCR模型等针对具体行业侧的模型能力,都在9月开始面向大客户开放内测。目前腾讯云已支持20多款开源模型,让企业能通过API(应用程序编程接口)接入这些开源模型。
一系列混元大模型的应用将在9月徐徐展开,腾讯显然在大模型之路上不肯掉队。
大模型决战还早?
「流水不争先,争的是滔滔不绝」,这句话或许就是腾讯在大模型市场上的写照。
「我们也一样在埋头研发,但是并不急于早早做完,把半成品拿出来展示。」今年5月,2023年腾讯股东大会上,腾讯创始人马化腾的表态让人警醒,他认为大模型是互联网百年不遇的、类似发明电的工业革命一样的机遇。
马化腾用的是历史的眼光去衡量,腾讯在乎的是这个「电灯」的实用性和耐用性,而不是死盯着早一步投入市场激起的那簇虚无的水花。
早一个月不是至关重要的,关键是还是要把底层的算法、算力和数据扎扎实实做好,「而且更关键的是场景落地,相信我们是有很多场景是可以落地的,目前(我们)还在做一些思考。」
不急功近利,想明白自己的擅长,抓住擅长的机会,让过去的业务在大模型的加持下产生1+1大于2的效益,这可能是马化腾对腾讯大模型的最大期许。
对现在的腾讯来说,混元大模型是腾讯云MaaS(Model-as-a-Service)服务的底座,如何让客户可以基于混元、也可以基于开源模型,做自己专属的行业大模型,成为腾讯自身生态不断发展壮大的方向之一,
因此,一个最好的理解就是,衡量大模型到底好不好,客户说了才算。
「我们的大模型能力,也正在重塑腾讯云广泛的PaaS、SaaS产品,这些探索实践,也进一步验证了我们MaaS能力的可用性、易用性。」在腾讯全球数字生态大会上,腾讯云副总裁吴运声介绍。
大模型目前应用最广泛的落地场景就是客服,大幅降低客服的构建成本。
腾讯发布的新一代腾讯企点,就引入了混元大模型能力,针对对话交互、人工辅助和知识构建三个层面进行提升,目前腾讯已经在推动文旅、政务、地产等领域落地标杆案例。
从本质上说,目前大模型核心重塑的一个是降本,一个是提效,客户需要通过大模型提升自身的效率变革,这是大模型满足的最大痛点。
比如,在阅文集团展现的内容创作领域上,文生图、图生图就是一种方式。阅文基于腾讯云TI平台搭载的Angel推理加速引擎,推理能力平均提升30%,在文生文领域,更是把成本降低到原来的四分之一。此外,TI平台提供动态batch和自动服务调度机制,大幅提高了服务吞吐量。
大模型底座上如何长出的更具有适配性的行业模型,也成为大模型适用能力的展现的途径之一。
腾讯混元大模型之上的分析模型,就通过腾讯企点分析AI助手来覆盖了四大场景:覆盖对话式分析,辅助数据配置,提取智能结论、一键生成报告。「未来,人人都能拥有专业数据分析能力,让数据跑得更快,为业务一线提供决策支持。」吴运声介绍。
而在直播短视频内容的带动下,用数字技术创造的人物形象也成为越来越普遍的应用之一。在数智人的落地上,腾讯此前推出过数智人工厂,如今在大模型的加持下,数智人的生产周期,已经从从原来的24小时缩短到1个小时,大大提升了生产效率。
相对而言,腾讯混元大模型的能力依然没有完全展露,例如企点分析AI助手在9月只面向大客户开放内测申请,微信上的混元大模型小程序还需申请才能内测,腾讯旗下诸多游戏产品如何结合大模型进行升级,并没有在这次大会上得以详细展现。
「务实创新,专注打好基础,不急于拿出半成品展示」,腾讯混元大模型虽然姗姗来迟,但一系列动作起码标志着中文世界内的大模型之战还将持续很长一段时间。
当下仍旧是大模型冷静期,距离大模型的决战为时尚早。