百川智能宣布第三款大模子,王小川:大模子的时机不必然落在大厂里
界面新闻记者 | 李京亚
“在美国做开源大模子或做通用已没有悬念,投资也已经明晰,但在中国不是,海内谁能做最好的大模子此刻没有定论,各人都有争取的时机,并且不必然落在大厂内里。”百川智能首席执行官王小川在8月8日媒体宣布会现场如是说。
据《中国人工智能大模子舆图研究陈诉》显示,停止5月28日,海内10亿级参数局限以上基本大模子至少已宣布79个。假如回溯至谷歌2017年宣布Transformer网络布局之时,在五年时间内全球已降生了若干形态各异、落地于差异场景的大模子技能群。
8月8日下午,百川智能公布宣布公司旗下第三款大模子产物Baichuan-53B,开启第一批内测。同时,王小川接管了界面新闻等媒体的采访。
此前,百川智能在7月11日宣布了参数量为130亿的通用大语言模子Baichuan-13B-Base和对话模子Baichuan-13B-Chat的两个量化版本。这个宣布意味着,创立仅4个月的百川智能已经推出了三款大模子产物,速度之快令人咋舌。
固然三款大模子的定名都以百川开头,但王小川出格指出,这些大模子并非定位为2C终极的沙盒型产物,他们本质上更多是为2B处事。
在8日下午,百川智能第三个模子baichuan-53B启动了首批内测处事,界面新闻记者经测试发明,这款产物在答复最新且稍有难度的问题时,表示出了很强的逻辑性。
据王小川所述,baichuan-53B更大的本领是能很好领略语言泛化背后的寄义,这款产物代表文科水准的抽象、类比和关联本领很强,能把各类观念有机毗连,“我们这个模子在文科规模走前列。”王小川认为。
事实上,强文科本领的大模子浮现了王小川的技能审美,他本人在4月创业之月朔场采访中就提及,逻辑自己并不高级,更高级的人类伶俐在类比和抽象之中,像分类、种别这种工作,ChatGPT就做得挺好。
B端的决议
但无论是此前搜狗团队在语言本领上的积聚,照旧新产物在文法、修辞、逻辑学方面的惊艳表示,百川智能的模子并不面向2C。固然在2B以外,百川团队已在陈设包括2C的超等应用,但王小川强调,此刻开放接口测试是为辅佐各人在事情上取得希望,不为C端场景单独去做优化,“不管之前的7B与13B,照旧53B,更多是为2B行业做筹备。”下月,baichuan-53B会开放API,相关组件也会连续开放。
这一细节表述激发了2B2C模子在同一公司内部站位的迷思。
就在克日,有头部VC相关投资人汇报记者,一级市场此刻并不看好针对2B垂直规模的模子,因为在数据上很难组成壁垒。对此,王小川对界面新闻暗示,B端大模子天花板确实不高,但确定性反而清楚,许多企业有B端需求,只是对接巨大性高,研发本钱高,每个企业有本身的私有数据,如何做好中间层毗连尤为要害,假如没有一个好的模式,会把两边都拖垮。他同时给出了一个B端大模子贸易模式的愿景,“B端带有天然真实场景,有中间层做企业处事,也有后头做模子的公司(好比我们),我领略的是这样的三层布局。”王小川指出。
但他也汇报界面新闻等媒体,当2B补完之后会开始补齐2C国界,百川智能不会只对准一个偏向。
当前偏重B端的站位也表明白王小川在开闭源上的选择,他称,大模子自己不代表2C,就不像像安卓、IOS需要二选一,本日从2B的角度,其实开源闭源都很需要。
据媒体报道,是本年3月大模子高潮鼓起之后,王小川用2周时间做了入局大模子创业的抉择,在这个时间节点上,少数几家头部大模子公司如智谱AI和MiniMax已经声名鹊起。
王小川坦言,对比智谱AI和MiniMax等已经具备必然市场影响力的大模子公司,百川智能是后发者进入市场,因此开源是揭示技能实力的一种方法,“我们相信后头的技能成长会很是快,只要一连不绝有技能迭代,就会发生本身的贸易模式。”王小川很垂青开源带来的代价,他认为,将来80%的企业会用到开源模子,因为开源模子小巧,而闭源没法对许多场景做出上佳适配。