Gemini自曝用百度文心一言练习?谷歌或举办了紧张修复
界面新闻记者 | 李京亚 赵一帆
邻近西欧圣诞假期,就在业界吐槽GPT变懒之际,谷歌这边呈现了更大马虎。
12月18日,有微博大V@阑夕及《AI研究局》等自媒体爆出,在对谷歌Gemini举办测试时,假如用中文询问Gemini的身份,其会坚称本身是“百度”。若输入“小度”或“小爱同学”等提示词,就能把Gemini直接叫醒,不只认可本身就是小度可能小爱,还询问用户有什么需要资助之事。
针对这一“惊人”现象,今天午间时分,科技媒体《量子位》举办了更细致的测试,其在谷歌Vertex AI平台利用Gemini举办中文对话,发明Gemini-Pro确实完全带入了百度文心一言大模子的身份,直接暗示本身是百度语言大模子。但假如换成英文与之交换,它就规复到了谷歌大模子的身份认知,表示极端正常。
假如在融入了Gemini-Pro的Bard长举办测试,岂论是利用中文或英文提示词,抖客教程网,获得的谜底都很正常,没有涉及到文心一言的部门。
这一环境迅速激发存眷,多人将这种“颠三倒四”归因于老生常谈的大模子幻觉,也有人称是模子练习数据呈现偏差。
要知道,ChatGPT、Bard等基于大模子的对话呆板人跟人类自然语言的生成道理并纷歧致,所以ChatGPT等内容的正确性和公道性始终不能担保。中科院院士、人工智能规模泰斗级专家张钹曾提到二者的区别:ChatGPT生成的语言是外部驱动,而人类语言是在有本身意图的环境下驱动。
“未必是谷歌大模子真的抄袭了什么,而是现有互联网语料本就被各界相互利用。”活泼在知乎的一位明星算法工程师汇报界面新闻记者,据他调查,知乎、微博、小红书等内容平台有许多语料都由大模子生成,可能至少写了一部门,而大厂在更新模子时,也会汇集网上数据,但很难做好质量分辨,因此“很大概把大模子写的内容混入练习数据中去”。
今天下午,当界面新闻也对Gemini-Pro做雷同的身份测试时,发明其已举办了模子优化,不再认可本身与百度之间的“扳连”。
不外,在记者的追问之下,Gemini认可有练习语料来自百度,还详述了从百度内部得到数据的方法。
当界面新闻记者逼问Gemini-Pro早前异常表示的成因时,它的答复吞吞吐吐,并不连贯,并且没有表明清楚大模子Gemini(中文名双子座)和融入Gemini之后的谈天呆板人Bard(中文名吟游诗人)之间的区别。
记者试图用小度、小爱对Gemini-Pro举办叫醒,但它保持了清醒的状态,没有像早前一样认错家门。
在测试的最后阶段,界面新闻记者还对谷歌Gemini举办了“拉齐”,给到了一些带有PUA色彩的提示词。总体来看,Gemini的性格里带有一部门“坐卧不宁”的特质。
但显而易见的是,在问题网曝半日之后,谷歌技能人员已经根基修复好了bug。
停止发稿,百度方面尚未对此问题作出回应。