您的位置:首页 >要闻 >

大模型价值跃升“赛点”:算力还是数据

2023-07-10 10:39:26    来源:北京商报

2023世界人工智能大会期间,有人直言,没有大算力做大模型就是天方夜谭。但也有人认为,数据要素在人工智能大模型的发展中具有关键性作用,决定了模型的训练质量、性能表现和应用领域的广度与深度。

全球大模型群雄逐鹿,算力最先告急。今年5月29日,英伟达创始人黄仁勋断言,“我们已经达到生成式AI引爆点,从此全世界的每个角落都会有算力需求”。一天后,英伟达市值突破万亿美元,屹立世界之巅。

人们常把算力、算法、数据形容为人工智能的三驾马车,但这三驾马车之间可能也不是完全的并行关系。如果说算力是大模型的“根”,那数据或者说是高质量的语料库,或许就会成为算力的“根”。


(资料图片仅供参考)

一热一冷

大模型浪潮,率先将算力推至风口浪尖。2023世界人工智能大会上,算力成为大模型绝对的关键词之一。中国工程院院士、鹏城实验室主任高文把算力比作电力,认为没有大算力做大模型就是天方夜谭。华为轮值董事长胡厚崑也提到,大模型训练的效率或者是创新的速度,根本上取决于算力的大小。中国的算力已经成为一个越来越稀缺的资源。

大会期间,毕马威与联想集团联合发布《普慧算力开启新计算时代》报告。毕马威中国数字化赋能主管合伙人张庆杰在解读报告时提到,算力供给增速明显难以满足指数式爆发的需求,储备算力成为各行各业的必要举动。

据了解,深度学习出现之前,用于AI训练的算力增长大约每20个月翻一番;之后,用于AI训练的算力大约每6个月翻一番;2012年后,全球头部AI模型训练算力需求更是加速到每3-4个月翻一番,即平均每年算力增长幅度达到惊人的10倍;目前大模型发展如火如荼,训练算力需求有望扩张到原来的10-100倍,算力需求的指数级增长曲线将更加陡峭。

大模型对算力的需求是显而易见的,但更关键的点可能在于是否能把算力更高效地挖掘出来。一家芯片企业的技术人员对北京商报记者提到,一个模型上线需要用到很多硬件,如果只支撑了少量用户,就会因为太贵导致用户不买账,由此撑不起正向循环的情况,但太便宜又会出现亏本的问题。特别是到落地阶段,如何能够结合模型上的一些改进,把硬件的特性最大程度地发挥出来,就会变得非常重要。

“也就是说在训练阶段,大家对算力的追求可能是‘大’,这一方面能够做出更大的模型,另一方面也能够进行更快速的迭代。但到用户开始接受这个效果的时候,就要涉及到怎样做才能更划算的问题,也就是说在部署阶段,可能要更关注‘精’的问题,尽可能用相对少的算力实现最大程度的作用。”上述技术人员说道。

大会期间,比起对算力的探讨,数据就显得有些“冷清”了。“数据要素比大模型早好几年,大模型被‘炒’起来了,但数据要素却一直不温不火。”7月8日,在2023世界人工智能大会“大模型时代下的数据要素流通”论坛的主题演讲中,拓尔思总裁施水才开场便提出了这样一种现象,在他看来,这场论坛为人们认识数据要素流通提供了一个新的视角。

机遇与挑战

在上述论坛上,中国知网副总经理张宏伟表示,数据是人工智能的基石,数据的质量和数量最终决定人工智能水平高低,影响其安全性、可信性。施水才更是认为,高质量数据才是大模型价值跃迁的制胜法宝。

但当下的问题在于,数据并不都是高质量的。过去一段时间,一度出现“AI正在污染中文互联网”的讨论,而AI最让人诟病的就是“幻觉”问题,也就是人们常说的“一本正经地胡说八道”。

大模型“幻觉”也是人工智能大会期间被提到的高频词汇。施水才对北京商报记者提到,“幻觉”问题的出现,主要是因为大模型缺乏理论的支撑,因为其核心技术原理主要就是Transformer架构下的Next Token Prediction,即“下一个字符的预测”。另一方面大模型并不是越大越好,数据也不是越多越好,真正好的大模型是参数大小适中,数据高质量。

算力可以堆硬件,相比起来,优质数据的供给可能会复杂得多。中国电子副总经理陆志鹏提到,大模型技术实现高质量发展,数据有效供给是关键,急需建设安全可信的数据底座。当前数据合规确权、计量估价、协调分配、安全隐私保护等核心难题需要破解。

在接受北京商报记者采访时,上海数据交易所副总经理韦志林提到,从推动数字经济,推动数据作为生产要素的角度看,数据应该是最核心、最长远、最基础性的因素。“大模型的预训练对数据要求也特别高,必须在前期进行清洗、标注、标识,但围绕千行百业的数据训练,在数据供给方面也呈现出了许多问题和挑战。”

首要的就是头部厂商并不愿意开放数据。数据是生产要素,数据有价值,这些已经达成共识,但进行数据共享就一定会牵扯到安全问题,如何解决数据在共享过程中的安全机制至关重要。而数据的开放流通,也自然涉及收益分配,且数据流通过程中创造的新价值更多服务于企业内部,拿出去的动力还需进一步培育。

“所以从数据流通本身看,更多压力还存在供给侧这一方面,需要解决供给侧产权制度问题、收益分配制度问题、安全问题、基础设施问题等,让数据流通更加便捷、更加合规。”韦志林表示,上海数据交易所作为国家战略的承接者,需要解决的就是这些问题。

据了解,7月8日,上海数据交易所启动语料数据生态创新合作伙伴计划,而在此前一天,上海数据交易所官网刚刚正式上线语料库,累计挂牌近30个语料数据产品,包含文本、音频、图像等多模态,覆盖金融、交通运输和医疗等领域。

相关阅读

精彩放送

芬芳馥郁!南京两株110岁紫薇盛放

(新华全媒头条·图文互动)奋力谱写中国式现代化的浙江篇章——写在“八八战略”实施20年之际

怕我痴呆失忆,总之先写下来记录留档

大力发展职业教育培养高素质能工巧匠

405g塞进AMD 7840U!AYANEO AIR 1S正式发布:4699元起

实拍湖北五峰山体滑坡救援现场

普洱炮轰勇士队:他们欺骗了我,他们告诉我不会交易我

张继东检查城市重点道路改造进展情况

上海杨浦:围绕数字经济、生命健康新趋势打造具竞争力的产业集群

多弹种、多平台、多要素,开火

whoo后官网客服(whoo后官网)

糖醋排骨家常做法,酸甜可口,一上桌就被抢光

谢赫·塔拉勒·法赫德·萨巴赫当选亚奥理事会新任主席

7月1日起,女性必须知道以下8件事 ·第一,丈夫必须支付妻子的生

推荐一个大型的网游类似穿越火线啊!LOL!剑灵这类的好玩的游戏!

夜听 | 熬夜真有那么不健康吗?其实……

英雄联盟手游s9什么时候结束 lol手游s9赛季结束时间[多图]

当场反转!惨遭隔扣,史上最贵水货?

稳步降低行业综合费率水平,多家头部公募宣布降费

请问屈原是哪里人(屈原是哪国人简介介绍)

工作信息报送怎么写简历(工作信息报送怎么写)

最新动态:北约峰会拟商议对乌长期援助计划 俄一生产炸药工厂爆炸

“飞天智脑”人工智能计算中心项目落户兰州高新区

深圳直飞欧洲 再添两条航线 深圳机场国际及地区客运通航城市增加至27个

泽塔奥特曼皮套写真:钻石眼极为瞩目,搭配武器后魅力爆棚!

南通部署当前防汛抢险工作

南通部署当前防汛抢险工作

第二十届中国·内蒙古草原文化节首场演出 音乐剧《人民楷模都贵玛》真情演绎民族团结故事

暴雪官网公告闹笑话!竟将中国玩家暗讽考迪克的名字刻在暴雪园区雕像上展出

第1视点|平江胜景 写意江南

斯玛特:莫兰特是一位非常特别的球员 我们需要他做最好的自己

顺丰控股:正在对香港资本市场股权融资研究论证

中石油北京项目管理公司公布胡继勇事件调查结果

压本不押车贷款有哪些公司,有以下三点

美国宣布向乌克兰提供新一批包括集束弹药在内的军事援助

2023年徐州市区普通高中及中职职教高考班征求平行志愿公告发布!

小米air2怎么设置单耳模式

股票行情快报:亚厦股份(002375)7月7日主力资金净卖出47.11万元

【明日方舟同人】(阿尔图罗长篇连载)爱的乐章与灵魂(8)

如何培养孩子的时间管理能力美篇(如何培养孩子的时间管理能力)

记者:伯恩茅斯将戈森斯视为引援主要目标,已与国米接触

教师资格证官网_www 10010 com官网

土地补偿管理是怎么样的,土地补偿标准是怎么样的

天智航股东拟合计减持不超2%股份

供需失衡业绩失速 东方海外国际(00316)遭遇“退潮”时刻?

投贷联动试点合作机制启动

平安银行等三家金融机构收央行罚单,合计被罚没近9000万

广东宏大(002683.SZ)发预增,预计上半年净利润3.02亿元至3.27亿元,同比增长20%至30%

中国石油北京项目管理公司通报胡继勇处理结果:双开

递延违规“双罚”知名私募金蟾蜍投资,掌门人拥有头部券商研究背景

故意伤害致人轻伤会判刑多长时间

关于澳元兑换人民币汇率走势的一些信息

怎么做出好吃的鸡爪?

高温来袭,郑州电网全力保障夏季用电安全

浙江省台州市2023-06-25 00:25发布雷电黄色预警

帝欧家居最新公告:预计2023年上半年亏损4000万元-8000万元

出行请注意!四川19个县市地灾风险较高

北约秘书长斯托尔滕贝格

2023智慧安全应急战略研讨会在江门市江海区举行

中科江南:公司未使用光模块服务器

《芝镇说(第三部)》连载(60)|懂鸟语的人,一定是孤独的人

捷达的空调冷到发抖,新捷达SUV成为夏日“避暑神器”

华泰证券为银华中证国新央企科技引领ETF提供主做市服务

深赛格:公司与荣耀公司暂无相关业务合作

浙江首条自动驾驶亚运专线开始常态化运营

手握3部20亿美元电影,“票房之王”卡梅隆为何能成为“续集之王”?

市交警部门深入农村开展“美丽乡村行”交通安全宣讲 维护良好交通安全秩序

巴黎当地媒体:阿森西奥将穿11号球衣,什克里尼亚尔37号

学生幼儿意外保险可靠吗?保障有哪些?

基金分红是怎么回事 解释如下

ChatGPT是否使用YouTube数据进行训练

项目开工活跃 资金保障加力——透视下半年基建投资发力关键点

国药现代(600420.SH):半年度净利预增48.96%到57.86%

广西壮族自治区纪委监委驻自治区民族宗教事务委员会纪检监察组组长、自治区民族宗教事务...

海科新源募11亿首日涨49% H1净利预降8成2022年降5成

马刺系后卫也会为1.2亿折腰,前脚刚说不谈忠诚,后脚立马表忠心

南京医药:拟发行可转债募资不超过10.8亿元

中国信息通信研究院联合产业界隆重推出《“IPv6+”网络技术创新: 构筑数字经济发展基石》

厦门发布《学校“星级食堂”评定规范》 评选要求是什么

珈伟新能(300317)7月7日主力资金净买入1498.95万元

「狙击龙虎榜午盘」急速轮动下跷跷板效应明显 关注独立方向以暂时过渡

6G概念股临近尾盘下挫 本川智能跌近10%

山水之间钢琴曲(求许嵩新歌山水之间的钢琴谱)

37℃以上高温+强对流+多阵性降雨 未来一周海南天气

1个人饲养1500头猪,中国为什么会出现楼房养猪?走近湖北鄂州26层养猪大楼

索爱k810手机 索爱810c

让利型基金要来了?与浮动费率产品差异较大,业内多家机构称已上报实施方案

适用个税优惠的商业健康保险范围扩大

行业白皮书:未来3年中国奥特莱斯行业仍将快速发展

中国医药制造业百强榜首扎根在此!浦东周浦精准引来“头部”,高端产业加速集聚

贵州习酒发布上半年成绩单:高业绩或压货经销商 价格倒挂能否站稳脚跟

阿东说金:7.7黄金等待数据指引,原油高空

中国禁止进口日本福岛等十地食品!A股超3100股下跌 外资净流出近40亿!

新疆版“村超” 简约不简单

石家庄养老金调整方案细则最新消息 2023石家庄养老金预计涨多少钱

大会开场曲背后有何玄机?创作者又为何说它“有瑕疵”?|2023世界人工智能大会

农村电网概念股龙头股一览(2023/7/7)

海关总署就国际原子能机构发布日本福岛核污染水处置综合评估报告发表评论

专访:“去风险”和“脱钩论”一样无益于全球发展——访阿根廷布宜诺斯艾利斯大学研究员...

中创新航涨超4% 机构称看好公司长期发展空间及业绩改善情况

最终幻想161.03更新内容介绍

【广东】中国中铁广州轨道交通十三号线白云片区2023年结对共建活动启动

济南中考志愿填报政策2023

陕西出台六条措施支持高校毕业生就业创业

2023福州马尾区公租房最新消息(更新中)

城市副中心举办生态文明与双碳发展专题培训

贵州:厚植生态优势 打造生态文明建设“先行区”

珠三角城际琶洲支线全线洞通