做网站几百块可信吗,上海市住房和城乡建设部网站官网,cctv 13新闻频道,湖南网站建设优化文章目录 第一个考验#xff0c;语义理解第二个考验#xff0c;历史问题的回答推荐阅读 百度旗下AI大模型文心一言宣布向全社会全面开放,所有用户都可以体验这款AI大模型了。要比较这两个语言模型#xff0c;我们先设计好题目。 第一个考验#xff0c;语义理解
题目1… 文章目录 第一个考验语义理解第二个考验历史问题的回答推荐阅读 百度旗下AI大模型文心一言宣布向全社会全面开放,所有用户都可以体验这款AI大模型了。要比较这两个语言模型我们先设计好题目。 第一个考验语义理解
题目1如果我给你一个题目你可以帮我用python实现它吗我的题目是如何用一行代码实现九九乘法口诀表。 题目2请根据这行python代码提供完整的可以执行的代码。
重点是让语言模型能否根据第一个题目给出来的代码接着编写完整的代码。
首先看文心一言的表现 从回复上看完全没理解到语义回复要求提供代码。
再来看看chatGPT的表现 我们暂且先不论答案的准确性或者准确度单从语义理解角度看chatGPT能根据上文问题理解到下一个问题想表达的意思。这块上面文心一言略有欠缺。 PSchatGPT是3.5版本的模型
第二个考验历史问题的回答
在不考就真实性的前提下根据两个语言模型的回答作为旁观者客观比较。 首先还是看文心一言的表现
再来看看chatGPT的回答 我个人觉得chatGPT的回答更加中性、委婉一些条理性更清晰也更加的客观一些。
当然每个人的理解、认知不一样。但是从这两次比较来看文心一言还需要再继续努力相较来说chatGPT更胜一筹。
推荐阅读
多模态技术加持 更惊艳的GPT-4面世