大模型混战,科大讯飞来晚了?
流水不争先,争的是滔滔不绝。
1
(资料图片)
“和ChatGPT掰手腕”
5月6日,讯飞星火的燎原之势初显。
发布会现场,通过科大讯飞董事长刘庆峰和科大讯飞研究院院长刘聪的演示,可以看到科大讯飞此次推出的大模型讯飞星火,在文本生成、语言理解、数学能力上,展现出了不凡的思考能力和智慧。
从发布会展示的效果来看,讯飞星火似乎真如科大讯飞董事长所言,部分能力已经超过了ChatGPT。
文本生成方面,速度快,要点全,多模态。
从直播来看,讯飞听见的实时双语字幕在国内上市公司中确实无出其右,讯飞星火延续了科大讯飞的语音转文字的优势,人机交互时对话非常丝滑,文本生成能力极快,短短几秒就迅速给出了相应文本。
从稿件质量上来看,字词准确,语句通顺,要求写的欢迎词要点俱全,让人挑不出什么毛病;现场所编写的故事也脑洞大开,能够把一些抽象的角色,用关联的思维逻辑串联起来。
而除了文本生成,讯飞星火也可以根据要求进行人声朗读,还能迅速生成虚拟人的视频。
从语音输入,到文本生成,到语音朗读,再到生成虚拟人的视频,其内容生成能力与丰富的形态,或将颠覆不少行业。
语言理解方面,讯飞星火的智慧则更为凸显。
而且除了真机实测实际系统现场互动,增加的现场实时互动,也给人更为直观的冲击。
举个例子,当被问及,“俗话说,男子汉大丈夫宁死不屈;但俗话又说,男子汉大丈夫能屈能伸。这两种说法应该怎么理解呢?”
讯飞星火并没有被绕晕,给出的回答逻辑非常清晰,能够很好的理解特定句子在不同场景下的含义,在后面的追问中,也能够灵活调整自己的答案。
数学能力上,根据现场发言,讯飞星火已经超过国内外大模型,包括ChatGPT。
刘聪现场问出了一道复杂计算题,“花坛里有三种花,一共88朵,其中月季花的数量是菊花的4倍,牡丹花的数量是菊花的5倍少2朵,那么请问花坛里一共有多少朵牡丹花?”讯飞星火在迅速给出答案的同时,也给出了具体的解题步骤。
而与数学一脉相承的代码能力,知名前沿科技媒体《IT之家》,对讯飞星火展开了Python语言的算法代码以及C++语言的测试。讯飞星火不仅能完整写出代码,并且能够即时联系上下文给出结果,还对算法思路进行了简单补充介绍,可以说非常便捷且全面。
整体看下来,讯飞星火本身就有科大讯飞的文本优势,在测试中面对逻辑上的设坑也能够准确避开,其多变的展现形态,更是为多场景使用提供了丰富的想象空间。
2
大器晚成
从发布会现场来看,讯飞星火展示出了不俗的技术实力与竞争力。
但较于国内其他上市公司的大模型争相加入首发热潮,科大讯飞的反应似乎显得有些“迟钝”。
科大讯飞2月曾明确表示,讯飞星火是5月6日发布,不过6月9日发布也可以,说明对旗下的研究已经有十足把握了,发布会不过是早晚的问题。
其实6月9日发布,对科大讯飞是更有意义的,因为6月9日是科大讯飞的24周年庆。
认知大模型的发布对于科大讯飞来说,显然也将成为一个意义非凡的日子;而且科大讯飞在业内属于少有的比较有浪漫情怀的公司,其专门设立的1024开发者节,不仅是程序员的特殊纪念日,更暗含着1024这个计算机操作系统中特殊的进制单位。
目前,科大讯飞也公布了接下来的升级版本及发布时间。
6月9日,突破开放式问答(即实时问答)、多轮对话能力、数学能力再升级版本将被推出;8月15日,代码能力再次升级,新升级的多模态交互能力也将正式开放给客户;10月24日,直接赶超ChatGPT。
即使发布晚了,科大讯飞也并未显示出过分担忧的情绪,从一个企业的角度,他们也清楚地知道,认知大模型的核心是社会刚需。
大模型前景很好,但技术落地才能对社会产生实际价值,同时反哺公司,实现自我造血的良性循环。
战略上来看,“平台+赛道”是公司经过多年验证的有效商业模式,这种双轮驱动模式与现在星火认知大模型的“1+N”架构有着异曲同工之妙,其中,“1”是通用认知智能大模型,“N”是大模型在教育、办公、医疗、汽车等多个行业领域的落地。
比如发布会上,“大模型+AI学习机”,展现出AI可以像老师一样批改作业的能力,从字词纠错,到语病调整,再到作文评价,不仅更加精准高效,还展示出了像口语老师一样的实景对话。
再比如,“大模型+智能座舱”,根据公开消息,科大讯飞在国内汽车智能语音应用市场保持占有率第一,而作为大热的智能汽车行业,大模型赋能汽车实现更自由、更智能的语音对话已经走向现实。
最后一点,科大讯飞董事长刘庆峰在访谈中提到,“在安全性上我们还要更谨慎一点”,“一定要兼顾信息安全和伦理人文”。
流传比较广的一个新闻是,三星投诉ChatGPT泄露了其机密数据,据相关报道是说,三星有员工把敏感代码上传,让ChatGPT帮忙改bug。但用ChatGPT辅助工作,传上去就相当于直接公开,出于安全考虑,很多科技大厂还是选择禁用ChatGPT。
如果有人恶意破坏,给ChatGPT投毒,甚至编辑暗网ChatGPT,刻意编辑一些引导性的语言模型,蓄意打破地缘政治平衡……后果可能更加难以想象。
不过,由于这场技术的颠覆性,掉队的风险可能大于技术本身的风险,发展既不能操之过急,也不能因噎废食,所以刘庆峰说的“谨慎一点”,从中长期目标来看,是正确的。
3
早有征兆
去年11月30日,ChatGPT在全球多个领域引起广泛关注,12月份,科大讯飞正式启动“1+N”认知大模型专项攻关,短短几个月,讯飞星火应运出世。
几个月当然不足以做出认知大模型,“大模型”这个概念只是后来才为人们所熟知,但实际上相关的技术尝试和立项,并不在少数。
1999年创业之初,科大讯飞的目标就是让机器像人一样能听会说。
2011年,科大讯飞承建了语音及语音信息处理国家工程工作室,而语音和语言的核心能力是开发认知大模型的基础条件。
2014年,公司又推出讯飞超脑计划,明确提出要让机器人具备能理解会思考的能力,包括去年1月份宣布的超脑2030计划,实际上也是在此领域深耕。
2017年,公司承建了认知智能全国重点实验室,而去年12月启动专项攻关之初,就是科大讯飞和中国科学技术大学共同承建的认知智能全国重点实验室,牵头设计了通用人工智能的7个重要方向的整套测试方法。
2017年,科大讯飞还让机器在全球首次通过了国家执业医师资格考试,并超过了96.3%参加考试的医生,也就是在应用能力,甚至是专业的医疗方面,已经早早取得一定成果了。根据发布会,科大讯飞的医疗专业大模型,则预计在今年的1024期间正式发出。
骐骥千里,非一日之功。几个月做出大模型只是表象,实际上在此之前的准备一步也少不了。
经过多年发展,科大讯飞在Transformer深度神经网络算法方面,已经掌握了丰富的经验。
开源证券研报指出,科大讯飞作为AI“国家队”,技术积累深厚,在教育、医疗、政务等领域深耕多年,对下游需求理解深刻。
拥有超50TB行业语料数据以及每天超10亿人次用户互动的活跃应用,场景和数据优势显著。
多方比较之下,在核心技术方面,科大讯飞已经保持国际领先水平。
另外,据科大讯飞在今年4月通过投资者关系活动记录表披露,其在总部自建了业界一流的数据中心,且已建成4座7中心深度学习计算平台,为大模型训练平台提供硬件基础。
目前科大讯飞已开源6个大类、超过40个通用领域的系列中文预训练语言模型,相关模型库月均调用量超1000万,在Github平台获得星标数位列同类中文预训练语言模型前列。
这条路可以说是用钱铺出来的,连年增长的研发投入只是最基本的。
总的来说,无论是技术积累,还是算法和模型,亦或是研发投入,科大讯飞的技术实力是经过时间沉淀的。无论是从企业的角度,亦或是国家的角度,这都是一场不能输的“战争”。
4
结语
2019年,科大讯飞被列入实体清单,其掌握的核心技术,让美方忌惮。
科大讯飞拥有全球领先的人工智能核心技术,但庆幸的是,这次没被卡住脖子。
刘庆峰在发布会现场强调,“一定要坚持做源头技术创新”。被列入实体清单后,科大讯飞也迅速切换到了以国内供应链为主的非美供应链体系。在核心技术方面,我们这次保留住了技术的火种。
过去几年里,科大讯飞牵头承担了国家自主可控人工智能平台的诸多项目,还与华为、寒武纪、曙光等企业建立了深度合作。
“科大讯飞一直认为,人工智能的发展绝不是单个企业和单个科研机构的事情,而是需要大家合作共赢的。”刘庆峰说。
较为难得的是,不断投入研发终于达到领先技术水平后,科大讯飞选择了以开放的态度,点燃自己,传递星火。
发布会当天,“2023科大讯飞AI星火营生态计划”正式启动,计划包括开放源头技术能力、挖掘优秀AI人才、赋能优秀创业团队等多方面内容。
雄关漫道真如铁,面向未来,星火亦可燎原。