您的位置:首页 >热点 >

大模型激战半年:王小川进击、王慧文退场,腾讯字节姗姗来迟

2023-08-14 10:27:19    来源:凤凰网

有人加速迭代,有人摩拳擦掌,有人姗姗来迟,有人暗淡退场。


(资料图片仅供参考)

图片来源:Pixabay

国产通用大模型的混战远未结束。在半年左右的蛰伏期过后,大部分玩家都浮出了水面。

在这之中,有人加速迭代。8月8日,由搜狗搜索创始人王小川创立的百川智能发布了旗下第三款大模型产品 Baichuan-53B,背后训练参数高达530亿。此时距离王小川宣布进军大模型战场不过4个月的时间,这家创业公司进展神速。

这还只是一个开始,百川智能方面向时代财经透露,后续还会有多款产品发布,包括规模更大、参数超千亿的大模型。

也有人黯淡退场。由美团联合创始人王慧文创立,吸引源码资本、五源资本等知名VC机构,以及美团创始人王兴、快手创始人宿华等互联网大佬投资的光年之外,曾一度被市场认为是国内大模型战场上最强有力的玩家之一。

然而,随着6月下旬王慧文因健康问题离岗退出,无法继续执掌光年之外,这家备受期待的大模型创业公司只能卖身美团,一众投资人也随之退股。

还有人另辟蹊径。AI大牛周明创立的澜舟科技,强调轻量化模型,希望用更低的成本解决B端场景问题。而曾帮助谷歌将BERT模型的训练时间从3天降到76分钟的新加坡国立大学校长青年教授尤洋,则成立了潞晨科技,试图用低成本训练大模型的解决方案突围。

相比之下,大厂自研的大模型则姗姗来迟。直到8月初,腾讯自研的混元大模型和字节打造的AI对话类产品Grace才先后传出内测消息,具体面世时间仍未可知。

同样停留在测试阶段的,还有李开复创立的AI 2.0企业“零一万物”。在7月3日举办的对外交流会上,李开复透露,该公司在三个月内已实现百亿参数规模的模型内测,目前正向300亿—700亿参数规模扩大。不过,该产品至今仍未向市场开放。

这些仍未发布的大模型产品将为科技行业带来什么样的改变,值得市场期待。从这个角度来看,这场混战或许还要持续很久。

进击的王小川

由王小川创立的百川智能,正以其惊人的产品发布速度吸引市场的关注。

在其4月宣布下场做大模型后,仅用了两个月零五天的时间,就在6月15日发布70亿参数开源大模型Baichuan-7B。不到一个月时间,又发布了130亿参数开源大模型Baichuan-13B。

8月8日发布的Baichuan-53B,已经是这家大模型创业公司半年内发布的第三款产品,百川智能进展神速。

百川智能相关负责人回复时代财经表示,公司在创立之前就已经花了很多时间做前期准备,开始就把路线和方法想得比较清楚。

其指出,做大模型都会考虑三个层面:数据、算法和算力。抛开算力不说,做搜索的公司天然有优秀的数据能力,百川智能的核心团队此前已经做了20年的数据抓取、抽取、清洗、去重、反垃圾等操作,可以更快拿到高质量数据集。

而算法是以自然语言处理为中心,将算法工程进行迭代,不是单一的工程问题,而是在文本数据驱动下,算法和工程共同运行。此前在搜索领域积累的经验在这里也能很好地发挥作用,利用数据评价推动模型进步。

“有了之前多年的技术和经验积累,百川智能做大模型产品的速度才会又快又好。”

不过,在发布会上,王小川亦指出,当下国产通用大模型仍处在一个分型复刻的阶段。各家厂商基本都在对标OpenAI,不可避免地会出现同质化的问题。

正因如此,在他看来,与美国闭源大模型的头部格局已定的情况不同,“中国谁的大模型最好”现在并没有结论。在这场混战之中,钱是重要的,但最终决定的力量还是人和团队、组织能力。大厂钱多、人多、算力多,但组织效率通常不一定够好,创业公司的组织效率可能好,也可能不好。

“大家都在争取机会,而且不一定落在大厂里。”

王小川还在采访中谈及退场的王慧文。其指出,王慧文是国内几个主流做大模型里唯一一个没有强势技术背景的,对他的挑战比其他家要大。工作中要做大量的技术决策,招什么人、走什么技术路线图、需要多少计算资源,一定会面临非常多的决策压力。

“不是做大模型压力大,是没有技术背景做决策压力会大很多。但是技术足够的话,其实挺愉悦的。”

腾讯、字节姗姗来迟

大模型混战开启之初,互联网大厂因为坐拥更多算力、人才、资金和数据,被认为是强大的竞争对手。

百度自研的文心一言早在今年3月底就已率先落地;阿里打造通义千问紧随其后,在4月11日举办的阿里云峰会上揭晓。就在阿里发布通义千问的前一天,王小川才刚刚宣布下场,成立百川智能。

相比之下,同为一线大厂的腾讯跟字节,推出通用大模型的步调要慢许多。

8月3日,据36kr报道,腾讯自研的 “腾讯混元大模型”已经进入应用内测阶段。三天后,8月6日,字节旗下的AI对话类产品Grace也被爆出历经两个月的研发后,终于进入测试阶段。

此时距离百度发布文心一言已经过去4个月。对于腾讯通用大模型产品步调稍慢的原因,马化腾曾公开表示,“腾讯也一样在埋头研发,但是并不急于早早做完,把半成品拿出来展示。”

不过,“并不着急”的腾讯,还是在今年6月中旬率先公布了“行业大模型”的路线,一口气抛出10大行业超过50个解决方案。无独有偶,字节跳动也同样在6月发布大模型服务平台“火山方舟”,通过集成多家AI科技公司及科研院所的大模型,向企业提供全方位的平台服务。

市场曾一度认为,行业大模型将成为这两家大厂突围的方法。

但事实或许并非如此。当下被鼓吹的行业大模型始终存在着被替代的风险。科大讯飞总裁吴晓如曾向时代财经指出,10年前,在语音识别技术上,也曾诞生过诸多聚焦在通话、行车、办公等不同场景的专用模型,但随着通用模型技术的成熟,专用模型也随之退场。

“我认为大模型也会经历一样的阶段。”

相比之下,从更长远角度看,通用大模型才真正代表着一个平台级或颠覆性的大机会。正是因此,腾讯和字节都不可能放任自己错过,哪怕进度缓慢,但它们必定要坚持在场。

有腾讯内部人士向时代财经指出,腾讯的计划一直是两条腿走路,通用和行业齐头并进。只是与一些激进的厂商相比,旗下产品涵盖社交、游戏、广告、内容创作等多个领域的腾讯,要更为谨慎一些。

学院派创业者另辟蹊径

在大模型战场上,来自高校、研究机构的学院派创业公司组成了竞争的第三极。

它们既不是王小川、王慧文这样的种子选手,在创业之初就能凭借人脉吸引到数亿美元的投资,并以此迅速起步。也不像腾讯、阿里、百度这样的大厂,在算力、人才、资金等各个方面都占据难以逾越的优势。

但凭借着他们对于人工智能技术的深度理解,这些创业者仍然能在夹击之下,另辟蹊径找到新的发展方向。

比如由原微软亚洲研究院副院长周明创立的澜舟科技,不同于市面上一众追逐千亿乃至万亿参数的大模型产品,这位从1980年就开始研究NLP(自然语言处理)的华人AI大牛希望以更轻量级模型解决B端场景的问题。

其推出的孟子大模型曾以十亿参数,刷新此前被百亿、千亿级别参数模型轮番霸榜的中文语言理解权威评测基准 CLUE 榜单。

这是一项务实的决策。出于数据安全考虑,绝大部分企业都不会将数据上传,而是会要求本地化部署,成本因此被显著拉高。在接受媒体采访时,周明指出,哪怕只是本地部署推理,拿训练好的大模型来用,千亿参数大模型也需要8到16块 A100,换算下来至少是一两百万元的投入,“对很多场景来说,客户需要便宜和够用”。

由新加坡国立大学校长青年教授尤洋创立的潞晨科技,则希望利用算法技术降低大模型的调用成本。

现如今,无论是大厂,还是创业公司,都必须面对国产大模型同质化趋势愈发明显的问题。如果这一问题不被解决,未来大模型极有可能陷入当下云服务厂商面临的低毛利困境。

尤洋对时代财经表示,这是因为底层技术基座迭代成本过于高昂。他以GPT举例,OpenAI每一次的训练成本高达6000万美元,每隔三四个月就需要训练一次,迭代一次则需要四五次训练。以此计算,每迭代一次技术基座可能需要2亿到3亿美元。

过于高昂的成本导致市场上的技术基座极其稀缺。基本上只有GPT、LLAMA,还有国内的GLM。各家厂商基本都是在模仿这几家大模型做产品,才导致了同质化的问题愈发凸显。

长期研究高性能计算的尤洋因此成立了潞晨科技。该公司目前推出的开源系统Colossal-AI 可通过高效多维并行、异构内存等技术,显著降低AI大模型训练、微调和推理的开发与应用成本。

尤洋认为,只有伴随大模型训练成本快速下降,或者采取更好的优化技术,使得参数控制在200亿左右,还依然能够达到和千亿参数一样的效果时,才会真正迎来大模型百花齐放的那一天。

标签:

相关推荐

外地游客被困礁石遇险 救生队员水陆接力救人

虽是蚊子但不咬人!青岛这里发现全球新物种

大动作!"欢乐芜湖”与携程集团再次联手

中国最大网络棋牌公司博雅互动将购买500万美元加密货币,曾因涉赌案被罚款9.43亿元

《命运方舟》碎牙乌尔布鲁斯位置一览

四川路桥:世界最大跨径悬浇拱桥古金高速水落河特大桥顺利完成拱圈合龙

新威凌创新成果获权威部门认可:获汨罗市创新创业大赛二等奖 被推荐参加岳阳市比赛

国际蒙医医院金桥院区正式对外开诊

减仓迈瑞医疗超20亿元,北向资金本周大手笔加仓这些股票

香港真的开始“七折卖房”了?

中国第13次北冰洋科学考察首个海域作业任务全部完成

未王策三十—— 第二次临州之战(下)

朔州接待酒店:全力保障服务省运会

山西朔州持续科学改良、因地制宜治理——农牧融合发展 盐碱地变了样

A股IPO审核趋严,七月以来新增受理仅一家

哇嘎下载速度0(哇嘎下载速度慢怎么办)

手机发热一直死机重启

消息称苹果 iPhone SE 4 手机将采用 USB-C、Face ID 等配置

“莫言B站账号被封”系谣言

宁波宁兴控股股份有限公司(关于宁波宁兴控股股份有限公司简述)

客厅电视柜这样做 客厅电视柜四种组合方案

vivox30上市时间和价格(vivo X30发布:价格和上市时间确认)

贵州已建成国家级和省级高技能人才培训基地73个

男子要女孩微信被拒后对其爸爸动手?警方:系网民编造杜撰

抢险争分夺秒 救援一刻不停 西安泥石流灾害加紧搜救

海关查获一批侵权产品

图便宜买鸡蛋上当者不少李某诈骗数十万元被判刑十年半

石景山公租房明天申请登记 257套房向三组家庭配租

美国匹兹堡市一栋房屋发生爆炸 已致4人死亡

洪水之后:涿州这座城

“寒气”传到基金销售,天天基金上半年利润接近腰斩,日活下降近三成

百分数应用题及答案解题公式 百分数应用题及答案

pdf格式转换word格式乱码(pdf格式转换word)

加拿大仍有千余起森林大火正在燃烧 半数以上处于失控状态

产业链争先布局 出口爆发式增长!我国动力电池高质量“续航”

美国夏威夷山火已致89人遇难 灾区重建可能花费55亿美元

招聘夜市商场摆摊 提供2800多个就业岗位 “就业在北京”受欢迎接着办

英媒:美联储缩表即将达到1万亿美元

减肥不瘦胸要吃三文鱼鸡蛋?中医推荐3类食物+1运动维持好身材

飞龙股份(002536.SZ)收到项目开发协议书 生命周期内预计销售收入超4亿元

飙涨1771倍!多家巨头出手,“天价锂矿”抢夺战落幕

香港财政司司长陈茂波:要把香港的夜市搞活搞旺

华为p系列有直面屏吗

遇难人数升至89人 夏威夷野火成为美国百年来“最致命”野火

四预警齐发!极端天气应对手册,关键时刻能救命!

抗洪歌曲《又见到你》2023版

如果你家在蓄滞洪区,哪些损失可以得到补偿?

夏威夷野火遇难人数升至89人,媒体:失踪人数可能高达千人

走!一起探秘国家公园丨为藏羚羊护航

直击西安山洪泥石流救灾:救援官兵协同搜救遇难群众4名

中国第13次北冰洋科学考察队正式开始海冰综合调查作业

山东高密燃气闪爆已致2死2伤

湖南3名杂技演员表演时从空中坠落,被送医救治

“我没有被骗,我连96110都拉黑了!”,警察上门劝导

贵州启动“千名行长进千家商会”工作 深化“商会+银行+企业”金融服务模式

新疆昌吉:绿波荡漾菡萏香

东京、新加坡和旧金山,给国内城市什么启示?

共享按摩椅免费投放 遍地的共享按摩椅为何惹人嫌 基本情况讲解

曼谷旅游,一定要去打卡的景点,唐人街美食攻略

国台办回应赖清德窜美:彻头彻尾的“麻烦制造者”

赖清德“过境”纽约,中国驻纽约总领馆:媚美卖台,注定失败

山东高密一烤鱼店燃气闪爆,已致1死1伤

辽宁交通部门连夜抢修67处险情,干线公路2处封闭

来了就能住!房山336名受灾村民昨天搬进阎村公寓安置房

美媒:犯罪率居高不下,美国旧金山数百政府雇员被告知在家办公

2023敕勒川草原半程马拉松赛激情开跑

户籍门槛,正在“消失”?

许昌一法院发布六条悬赏公告 最高悬赏一万!

没人能对腻脚清汤羊说不

欠了犀牛宝7年没还会坐牢吗

最“壕”持有21亿 私募成为ETF重要“买手”

内蒙古苏尼特右旗报告2例鼠疫确诊病例,系此前鼠疫病例家属

承德兴隆六道河子:坐上火车去赶集

国营民资孵化器各展所长 生命科学园里“创新种子”加速萌发

化身“体验官”深入园区寻找灵感 高校师生为文化产业园发展贡献“金点子”

房山窦店81户受灾村民入住安置房,生活便利吗?记者探访

针对高超音速武器,美日要研发新型拦截导弹

巴拿马运河因干旱进一步限行 排队船只数量远超同期

英意日的未来战机研发联盟,会有新成员吗?

外媒:疗养院要变移民收容所?纽约一地居民发声抗议

广东省清远市2023-08-13 11:38发布高温黄色预警

安徽省宣城市2023-08-13 11:46发布雷电黄色预警

长宁这场乒乓球比赛请来奥运会裁判执裁

湛江风电与内蒙古丰镇市签约3GW风光储一体化项目

时隔一年!美国能源股再度崛起

日本年轻人远离“铁饭碗”:全国仅1.4万人报考,加薪也不想当公务员

快捷酒店涨价,五星酒店看了都惭愧

超42亿!又一天价锂矿落槌 1.1万次报价 升值1300多倍 背后买家或涉A股公司

8月银行理财到期规模为今年以来单月最高

景德镇御窑瓷器亮相恭王府

香江来信丨这位一“出更”就立功的阿Sir,亦警亦医成了跨界佳话

今天东北地区局地有大暴雨,中东部多地继续“蒸桑拿”

北京门头沟:城区公交线网全面恢复

北京门头沟:累计评估鉴定危房1116间,倒塌419间

美国费城毒品持续泛滥:数十名吸毒者昏倒在街头 手臂伤口渗血

北京今天下午西南山区有雨,地质灾害风险仍较高,请注意防范

中经评论:这张“脸”,不能谁想用就用

大江时评:“新三样”走俏,折射“中国创造”加速跑

美国夏威夷野火已致80人遇难:海滨度假小镇“不复存在”

外媒:中国出境游恢复势头良好