【时快讯】视频 | 最终，吊打ChatGPT的是…？| Meta元宇宙指北

2023-03-16 11:48:14 来源 : 新浪网

(资料图片仅供参考)

转自：周到上海

就在今日凌晨，万众瞩目的大型多模态模型GPT-4正式发布！OpenAI团队花了6个月的时间，使用对抗性测试程序和从ChatGPT得到的经验教训，对GPT-4进行迭代调整，在真实性、可控制性等方面取得了有史以来最好的结果。

简单来说，GPT-4是一个多模态大型语言模型，即支持图像和文本输入，以文本形式输出；扩写能力增强，能处理超过25000个单词的文本；与ChatGPT所用的模型相比，更具创造力，并且能够处理更细微的指令。虽然在许多现实场景中的能力不如人类，但在各种专业和学术基准测试中已做到人类水平的表现。

目前GPT-4没有免费版本，仅向ChatGPT Plus的付费订阅用户及企业和开发者开放。测试该版本比以前的版本更强大，称它可以接收图像和文本输入，输出文本，并且由于它有更广泛的常识和解决问题的能力，可以更准确地解决难题。

那么GPT-4究竟强大到什么程度呢？输入一张手绘草图，它就能直接生成最终设计的网页代码，此外，它还以高分通过了各种标准化考试。我们来看看学霸GPT-4的表现：SAT拿下700分，GRE几乎满分，逻辑能力吊打GPT-3.5。GPT-4在高级推理能力上，肉眼可见地超越ChatGPT。

在美国律师资格考试 Uniform Bar Exam、法学院入学考试 LSAT、“美国高考” SAT 数学部分和证据性阅读与写作部分的考试中，它的得分高于 88% 的应试者。GPT-3.5排名在倒数10%左右，而GPT-4考到了前10%左右。

就问你面对这么卷地学霸，会胆怯吗？其实也还好啦，作为人类我们还是要对自己有信心。尽管功能更加强大，但GPT-4与早期的GPT模型具有相似的局限性。

OpenAI表示GPT-4还是会出现推理性错误。它会轻信用户明显的虚假陈述，有时它会像人类一样在难题上失败，例如在它生成的代码中引入安全漏洞。

不过，GPT-4相对于以前的模型显著减少了幻觉。在OpenAI的内部对抗性真实性评估中，GPT-4的得分比 GPT-3.5高40%。此外，已经有包括Duolingo、Stripe 和 Khan Academy多家公司将GPT-4搭载到他们的产品中了。

来源：周到上海作者：Viola

标签：

x 广告