(资料图片仅供参考)
转自:周到上海
就在今日凌晨,万众瞩目的大型多模态模型GPT-4正式发布!OpenAI团队花了6个月的时间,使用对抗性测试程序和从ChatGPT得到的经验教训,对GPT-4进行迭代调整,在真实性、可控制性等方面取得了有史以来最好的结果。
简单来说,GPT-4是一个多模态大型语言模型,即支持图像和文本输入,以文本形式输出;扩写能力增强,能处理超过25000个单词的文本;与ChatGPT所用的模型相比,更具创造力,并且能够处理更细微的指令。虽然在许多现实场景中的能力不如人类,但在各种专业和学术基准测试中已做到人类水平的表现。
目前GPT-4没有免费版本,仅向ChatGPT Plus的付费订阅用户及企业和开发者开放。测试该版本比以前的版本更强大,称它可以接收图像和文本输入,输出文本,并且由于它有更广泛的常识和解决问题的能力,可以更准确地解决难题。
那么GPT-4究竟强大到什么程度呢?输入一张手绘草图,它就能直接生成最终设计的网页代码,此外,它还以高分通过了各种标准化考试。我们来看看学霸GPT-4的表现:SAT拿下700分,GRE几乎满分,逻辑能力吊打GPT-3.5。GPT-4在高级推理能力上,肉眼可见地超越ChatGPT。
在美国律师资格考试 Uniform Bar Exam、法学院入学考试 LSAT、“美国高考” SAT 数学部分和证据性阅读与写作部分的考试中,它的得分高于 88% 的应试者。GPT-3.5排名在倒数10%左右,而GPT-4考到了前10%左右。
就问你面对这么卷地学霸,会胆怯吗?其实也还好啦,作为人类我们还是要对自己有信心。尽管功能更加强大,但GPT-4与早期的GPT模型具有相似的局限性。
OpenAI表示GPT-4还是会出现推理性错误。它会轻信用户明显的虚假陈述,有时它会像人类一样在难题上失败,例如在它生成的代码中引入安全漏洞。
不过,GPT-4相对于以前的模型显著减少了幻觉。在OpenAI的内部对抗性真实性评估中,GPT-4的得分比 GPT-3.5高40%。此外,已经有包括Duolingo、Stripe 和 Khan Academy多家公司将GPT-4搭载到他们的产品中了。
来源:周到上海 作者:Viola