加入收藏

大模型“爆火”后,不妨再来点冷思考

2023-08-27 11:14:58 来源:新华网

大模型似乎没那么“热”了。今年6月,ChatGPT访问量环比下滑9.7%,为其推出以来首次下滑。从全球范围看,尽管不断有企业发布或更新大模型,但媒体和公众似乎没那么“上头”了。在昨天举行的2023世界人工智能大会青年优秀论文奖颁奖仪式暨青年科学家论坛上,复旦大学计算机科学技术学院教授邱锡鹏直言,虽说是“百模大战”,但各家大模型之间同质化严重,实质性的创新比较少。事实上,大模型远未到变成一个单纯的工程问题的时候,距离人们理想中的通用人工智能,其本身还有许多科学问题亟待解决。


(资料图片)

“百模大战”其实是“一张脸”

“大模型还有科学价值吗?”邱锡鹏在开场白中似乎就给大模型浇了一盆冷水。大模型的爆火并非偶然,是几十年科研不断推进的结果,但在ChatGPT爆火后,一个明显的变化是这一领域中科学进步少了,大家都寄希望于通过工程手段“大力出奇迹”。

比如,现在几乎所有的大模型预训练都基于Transformer架构,这固然是一个非常好用的架构,但其弊端也愈发显现,它所耗费的计算资源非常庞大,需要超级算力的支撑。

另外,生成范式成为主流,这使得想要使用大模型,就必须将自己的任务变成生成式的,即便是那些非常复杂的结构化预测问题也都要用生成式方法解决。甚至,连生成式范式也在趋向统一,原先还有Seq2Seq(一种用于序列到序列的深度学习模型)和LM(语言模型)两大类,现在只剩下后者。

而且,研究领域也在萎缩。邱锡鹏说,以自然语言处理(NLP)为例,2015年之前,这个领域还有多个不同方向,比如对话、问答、机器翻译等,那时的学者各自有着自己的研究,并从别的研究领域中获得灵感,而现在大家都涌向大语言模型这条单一赛道。

大模型面临“十大科学挑战”

尽管大模型展现出通往通用人工智能的潜力,但这条路并不好走。邱锡鹏列出了大模型亟需解决的“十大科学挑战”,包括架构设计、思维链、幻觉、多模态延展、自动化评价、平民化等。其中,大模型的架构创新是当务之急。邱锡鹏说,大模型之所以称为大模型,是因为其庞大的数据量使其拥有了涌现的能力,虽然人们至今不知道涌现是如何发生的,但是否有涌现是区别大模型与小模型的主要特征。换言之,想要大模型更智能,继续扩大其规模是一条显而易见的路。

但是,当下主流的Transformer架构已经制约了模型的进一步扩大。这是因为Transformer的复杂度是输入字符长度的平方级,每多输入一个字符,计算量就会以指数级增长。因此,“只有找到更高效的新架构,才能支持未来模型规模的进一步扩张。”

另一个对大模型发展至关重要的问题是评价体系。尽管当下有许多测评大模型优劣的榜单,但业内对此并没有形成统一标准。而且对于擅长“刷题”的大模型来说,很多数据集上的表现已不足以衡量其真实能力。

颠覆性创新常在“冷门”处

深入研究创新规律不难发现,越是扎堆的“热门”圈子,往往难出颠覆性创新成果,ChatGPT本身就是个“冷门选手”爆火的案例。在其火遍全球之前,在大语言模型领域,谷歌的“理解与生成相结合”的路线是绝对的主流,在这种情况下,研发ChatGPT的OpenAI公司仍然选择坚持走自己的路。

现在,原本默默无闻的生成式AI成为了“顶流”。当人们一哄而上投入其中时,仍有一部分人还在坚持以IBM沃森机器人为代表的“AI符号主义”技术路线。以“爆款”常偏爱“冷门”的创新规律来看,或许未来的“核爆点”会奖励默默坚持的“少数派”。

事实上,获得今年世界人工智能大会最高奖项SAIL奖(卓越人工智能引领者奖)的论文《机器学习结合阻抗谱技术预测锂电池老化》,就不是一个关于大模型的研究。文章作者、中山大学物理学院副教授张云蔚说,她只采集了2万个电化学阻抗谱,就实现了AI精准建模。比起海量数据,更重要的是思路。就是这样一个小模型,将过去需要花费几天才能实现的电池寿命预测缩短到了15分钟,且检测精度是原来的10倍。

在大模型爆火的半年多时间里,大家似乎形成了一种共识,即只有资金雄厚和数据储备充足的大厂才有进军大模型的资格。对此,邱锡鹏认为,大模型还有大量科学问题需要攻关,这些问题除了预训练阶段需要耗费大算力外,在对齐、指令微调等方面所需的算力并不高。而随着算法的优化,3090显卡足以能完成大模型的研究,这是一条小公司也能“出奇迹”的赛道。(记者 沈湫莎)

关键词:

相关新闻

资讯

图书展销+阅读活动+直播推广+非遗展示  第四届“濠滨书市”启动
图书展销+阅读活动+直播推广+非遗展示 第四届“濠滨书市”启动

“濠滨书市”活动现场。记者许丛军本网讯书籍是人类进......更多>

三洋摄像机ca9说明书 三洋摄像机
三洋摄像机ca9说明书 三洋摄像机

1、说不听的,你可能不信。2、你拿个索尼的高清DV做个......更多>

珠三角数字化转型实践:低成本迈好第一步 为中小微企业搭建支撑生态
珠三角数字化转型实践:低成本迈好第一步 为中小微企业搭建支撑生态

流水线上的自动化生产机器轰鸣运转几分钟,“投喂”的......更多>

乔帅谈李凯尔本场表现:这是他的世界杯首秀 他需要时间
乔帅谈李凯尔本场表现:这是他的世界杯首秀 他需要时间

乔帅谈李凯尔本场表现:这是他的世界杯首秀他需要时间......更多>

大降温+7级大风!江西天气大反转!
大降温+7级大风!江西天气大反转!

今天江西很多地方下了雨截止到26日14时赣西北、赣东北......更多>

息差、房企风险、城投贷款质量影响业绩几何?交行管理层答一财
息差、房企风险、城投贷款质量影响业绩几何?交行管理层答一财

8月25日,交通银行(下称“交行”)发布2023年半年度......更多>

延安巷老旧小区改造“提速”  本月底雨污实现分流
延安巷老旧小区改造“提速” 本月底雨污实现分流

顺庆全媒体见习记者谭港城市雨污分流改造工程是改善人......更多>

年内回购超千万股,充裕现金在手,同道猎聘潜力几何?
年内回购超千万股,充裕现金在手,同道猎聘潜力几何?

今年以来,就业难题成为备受关注的焦点,尤其在中国这......更多>

财通证券与淳安县人民政府签署战略合作协议
财通证券与淳安县人民政府签署战略合作协议

财通证券(601108)消息,8月25日,财通证券(601108)与......更多>

沈丘:县人大常委会组织开展农业强县专题调研
沈丘:县人大常委会组织开展农业强县专题调研

8月24日,沈丘县人大常委会主任许四军,县人大常委会......更多>

关注

房子多少钱一个平方怎么算 一个平方怎么算
房子多少钱一个平方怎么算 一个平方怎么算
0471房产来为大家解答以上的问题。房子多少钱一个平方... 更多>
房子多少钱一个平方怎么算 一个平方怎么算
0471房产来为大家解答以上的问题。房子多少钱一个平方... 更多>
宇宙元尊在神州(关于宇宙元尊在神州简述)
,你们好,今天0471房产来聊聊一篇宙元尊在神州,宙元... 更多>
亚马逊美国站新增1个禁售品类
鞭牛士8月25日消息,亚马逊官方宣布,,美国站“呼吸... 更多>
原地“穿越”千年 全球最大纯商业体里逛乞巧市集
原地“穿越”千年全球最大纯商业体里逛乞巧市集---湖... 更多>
创胜集团-B(06628)发布中期业绩,净亏损2.38亿元 同比增加16.45%
创胜集团-B(06628)发布截至2023年6月30日止6个月中期... 更多>
柿子吃不完?在家就能做香甜软糯的柿饼
秋天是柿子丰收的季节,熟透的柿子散发出诱人的香甜气... 更多>
上半年实现稳产高产 积极关注优质资源项目
【财华社讯】中国建筑国际(03311 HK)公布,截至2023... 更多>
集聚诸多优势 延边州厚植发展动能
8月24日,在第十四届中国——东北亚博览会韩国商务日... 更多>
《绿色低碳先进技术示范工程实施方案》印发
据国家发展改革委网站8月22日消息,国家发展改革委等... 更多>
新消费降温,良品铺子还能走多远?
如果时间倒退到多年前,杨红春应该不会料到现在良品铺... 更多>
《价值盲盒》 :人的行为可以“设计”?审视精英思维方式
潘启雯从希望能够引起人们对“精英的思维方式”关注的... 更多>
喝完酒喝酸奶为什么吐得更严重了(喝完酒喝酸奶)
1、喝酒后喝酸奶很好,可以保护胃粘膜,让胃不受酒精... 更多>