你绝对想不到,用ChatGPT可以从Excel表内里的几百条留言快速获得结论
01
几百条读者留言,怎么才气快速归类整理
本年4月份,我们为即将出书的新书《Python自动化办公应用大全-ChatGPT版》做了一次封面评选勾当。在勾当中,给出了A\B\C一共3个封面方案,请各人投票和留言。
这次勾当收到了830张投票,464条留言。
在投票功效中,A和B封面的投票数很是靠近,占到了总票数的78%。
这下让出书社和作者团队也犯了难,不知如何选择。
从统计角度看,此次投票只能算是抽样,并且因为不清楚到底是哪些小同伴参加了投票,所以不能知道抽样数据是否切合方针整体特征。
所以,投票数据只能是参考数据之一。
比投票数据更有代价的是各人的留言,不少小同伴通过留言,从客观和主观两方面临差异封面颁发了明晰的看法。
拜见:《Python自动化办公应用大全-ChatGPT版》封面评选
在这样的环境下,假如能把所有留言举办整理、归纳,就可以辅佐我们更精确的相识小同伴的观点,从而帮助决定。
几百条留言已经导出到Excel内里了,用肉眼看一遍并不慢。
惋惜人脑的内存有限,很容易看了后头忘了前面,可能遗漏重要内容,甚至看错内容。
从一大堆留言这样的纯文本数据中获取有代价的信息,这就是“文本挖掘”,是数据阐明的一项内容。
还记得Kevin上次演示的阐明Excel函数的文章吗?
那是娱乐版的文本挖掘。
实际上,假如然的要举办文本挖掘,首要先举办分词。
也就是把一大段话公道地分拆成一个一个的词语。
中文博大博识又言简意赅,分词不是件简朴的任务。
分词今后,就可以举办词频统计、逻辑关联可能其他统计与阐明。
然后生成词云图什么的,相识重点要害词,要害词之间的干系是什么。
但这些都不切合我们此刻的需要,因为我们需要更高级的挖掘——语义领略。
这个事情,今朝是AI的强项。
02利用嵌入式ChatGPT应用阐明留言
于是,我们基于ChatGPT 3.5自界说了一个嵌入式应用。
把我们的留言数据上传成为专用数据集,然后请ChatGPT来帮我们阐明。
为啥不直接利用ChatGPT官网的ChatGPT 4.0呢?
不是不想,主要是因为ChatGPT官网不支持上传文件。
并且默认的token只有4K,也就是上下文关联的内容长度差不多2000字罢了,这对付我们的本次阐明是远远不足的。
就算我们分N次把所有的留言都粘贴给ChatGPT,它也记不住。
而实战中,可以通过API挪用ChatGPT,最大支持32K。
先容这些配景给各人,主要是想说,不是学会几句Prompt就可以发挥ChatGPT的所有本领了,真正的实战应用需要你学会更多的方法来利用它,假如会写代码去挪用ChatGPT那就无敌了。
一切设置妥当,我们开始提问:
01
Kevin:
你是一名资深的图书出书社营销编辑,为了筹备一本新书《Python自动化办公应用大全-ChatGPT版》上市,你在社交媒体上提倡了一次关于该图书封面的接头,提供了3组图书封面(别离编号为A\B\C)。你收获了许多潜在读者关于封面的留言,下面你需要按照详细提问来从留言中阐明出有代价的信息。
留意,读者的留言中,大概会用第一、第二、第三别离代表A、B、C封面。
第1个问题:请摆列出在读者眼中,A\B\C三种封面的主要特点,利益以及缺点。
AI Copilot:
按照读者的意见,可以总结出以下关于A、B、C三种封面的主要特点、利益和缺点: