剧本大全

百川智能宣布第三款大模子，王小川：大模子的时机不必然落在大厂里

发布时间：2023-08-14 18:00:01剧本大全次评论

百川智能大模子的文科本领走在前列，这更切合王小川的技能审美。

界面新闻记者 | 李京亚

“在美国做开源大模子或做通用已没有悬念，投资也已经明晰，但在中国不是，海内谁能做最好的大模子此刻没有定论，各人都有争取的时机，并且不必然落在大厂内里。”百川智能首席执行官王小川在8月8日媒体宣布会现场如是说。

据《中国人工智能大模子舆图研究陈诉》显示，停止5月28日，海内10亿级参数局限以上基本大模子至少已宣布79个。假如回溯至谷歌2017年宣布Transformer网络布局之时，在五年时间内全球已降生了若干形态各异、落地于差异场景的大模子技能群。

8月8日下午，百川智能公布宣布公司旗下第三款大模子产物Baichuan-53B，开启第一批内测。同时，王小川接管了界面新闻等媒体的采访。

此前，百川智能在7月11日宣布了参数量为130亿的通用大语言模子Baichuan-13B-Base和对话模子Baichuan-13B-Chat的两个量化版本。这个宣布意味着，创立仅4个月的百川智能已经推出了三款大模子产物，速度之快令人咋舌。

固然三款大模子的定名都以百川开头，但王小川出格指出，这些大模子并非定位为2C终极的沙盒型产物，他们本质上更多是为2B处事。

百川智能公布第三款大模型，王小川：大模型的机缘纷歧定落在大厂里

在8日下午，百川智能第三个模子baichuan-53B启动了首批内测处事，界面新闻记者经测试发明，这款产物在答复最新且稍有难度的问题时，表示出了很强的逻辑性。

据王小川所述，baichuan-53B更大的本领是能很好领略语言泛化背后的寄义，这款产物代表文科水准的抽象、类比和关联本领很强，能把各类观念有机毗连，“我们这个模子在文科规模走前列。”王小川认为。

事实上，强文科本领的大模子浮现了王小川的技能审美，他本人在4月创业之月朔场采访中就提及，逻辑自己并不高级，更高级的人类伶俐在类比和抽象之中，像分类、种别这种工作，ChatGPT就做得挺好。

百川智能公布第三款大模型，王小川：大模型的机缘纷歧定落在大厂里

B端的决议

但无论是此前搜狗团队在语言本领上的积聚，照旧新产物在文法、修辞、逻辑学方面的惊艳表示，百川智能的模子并不面向2C。固然在2B以外，百川团队已在陈设包括2C的超等应用，但王小川强调，此刻开放接口测试是为辅佐各人在事情上取得希望，不为C端场景单独去做优化，“不管之前的7B与13B，照旧53B，更多是为2B行业做筹备。”下月，baichuan-53B会开放API，相关组件也会连续开放。

这一细节表述激发了2B2C模子在同一公司内部站位的迷思。

就在克日，有头部VC相关投资人汇报记者，一级市场此刻并不看好针对2B垂直规模的模子，因为在数据上很难组成壁垒。对此，王小川对界面新闻暗示，B端大模子天花板确实不高，但确定性反而清楚，许多企业有B端需求，只是对接巨大性高，研发本钱高，每个企业有本身的私有数据，如何做好中间层毗连尤为要害，假如没有一个好的模式，会把两边都拖垮。他同时给出了一个B端大模子贸易模式的愿景，“B端带有天然真实场景，有中间层做企业处事，也有后头做模子的公司（好比我们），我领略的是这样的三层布局。”王小川指出。

但他也汇报界面新闻等媒体，当2B补完之后会开始补齐2C国界，百川智能不会只对准一个偏向。

当前偏重B端的站位也表明白王小川在开闭源上的选择，他称，大模子自己不代表2C，就不像像安卓、IOS需要二选一，本日从2B的角度，其实开源闭源都很需要。

据媒体报道，是本年3月大模子高潮鼓起之后，王小川用2周时间做了入局大模子创业的抉择，在这个时间节点上，少数几家头部大模子公司如智谱AI和MiniMax已经声名鹊起。

王小川坦言，对比智谱AI和MiniMax等已经具备必然市场影响力的大模子公司，百川智能是后发者进入市场，因此开源是揭示技能实力的一种方法，“我们相信后头的技能成长会很是快，只要一连不绝有技能迭代，就会发生本身的贸易模式。”王小川很垂青开源带来的代价，他认为，将来80%的企业会用到开源模子，因为开源模子小巧，而闭源没法对许多场景做出上佳适配。

第三(6)发布(41)智能(16)机会(5)大模型(12)百川(3)王小川(3)小川(3)不一定(1)

抖客教程网

抖客教程网

剧本大全

百川智能宣布第三款大模子，王小川：大模子的时机不必然落在大厂里

相关文章

热心评论

评论列表