北京智源人工智能研究院林咏华:大模子将从互联网应用慢慢走向千行百业 | REAL大会
界面新闻记者 | 于浩
10月26日,在由界面新闻主办的2023 REAL科技大会上,北京智源人工智能研究院副院长林咏华颁发了题为《打造大模子技能的“Linux”,为AI将来十年成长打下坚硬根本》的主题演讲。
在生成式人工智能的高潮下,大模子及相关应用正在步入研发落地的新阶段。而回望人工智能财富的成长,“质量”成为实现AI落地的“最后一公里”问题,即可否到达财富、家产的成长要求。针对这一点,林咏华的概念是,大模子会比小模子更具挑战。
她出格提到,大模子的练习数据、数据配比、练习数据输入顺序,练习进程中的所有超参配置都没有完全果真,因此难以完全复现大模子的本领和问题;同时,大模子举办算法修改和从头练习的投入极高,使得企业很难对其举办修补。再者,抖客教程网,算法、数据和进程都有大概存在“debug”,问题成因难以阐明。
这些因素都抉择了基本模子将会影响下游模子的本领,做基本模子的企业机构需要不绝打磨。
林咏华强调,将来10年,大模子一定牵引人工智能走向优美的星辰大海,但在当下面对多种挑战,包罗基本大模子用度昂贵、练习数据集获取不易、评测方式东倒西歪、东西碎片化、计较资源日益受限等。
在她看来,开源开放让从业人员得以站在前人的基本上继承前行。智源此前的一系列宣布行动也表白,其试图操作开源开放来办理上述财富挑战。
详细到基本大模子方面,克日智源公布悟道·天鹰Aquila大语言模子系列全面进级,个中340亿参数的Aquila2-34B在多个榜单均表示抢眼。另外,智源将Aquila2模子系列全部开源,Aquila2的创新练习算法、FlagScale框架、FlagAttention算子集以及语义向量模子BGE均已同步开源。
据林咏华透露,智源研究院所开放的全球最大的中文数据集WuDaoCorpora今朝已对外开放低风险数据200G,至今已有数万次下载。
评测方式方面,林咏华指出,大模子在生成本领、认知本领、人类思维本领的测评方面都面对着挑战:除少数生成任务外,生成本领仍主要依靠人类评分;认知的界线难以确定;测评人类思维本领需要新的巨大测试荟萃、界说新的测试方法。
计较资源方面,海内厂商所回收的架构和开拓东西链的差异、浩瀚的AI框架、层出不穷的场景等等因素,使得异构芯片间适配事情量大、开拓巨大度高、评测尺度也难以统一。
针对这两方面的挑战,智源研究院别离推出了大模子评测体系及评测平台FlagEval以及AI芯片评测开源项目FlagPerf。
“大模子已经从语言模子走向多模态,这是技能走向落地的一个重要阶段。”林咏华暗示,将来大模子会从互联网应用慢慢走向千行百业,“我们但愿看到大模子走出数字世界,走向物理世界,走向自动驾驶、呆板人等场景。”