gpt-4是一个多模态大模型,其新能力和性能上的提升备受市场关注,微软也确认最新版必应将升级使用gpt-4大模型。
图像处理是亮点,对比前代性能大提升
openai公司的chatgpt近段时间不断火出圈,资本市场也是各种热炒。如今chatgpt热度还未散去,openai又发布了更强大的gpt-4大模型,堪称“王炸”产品,chatgpt的智能程度将更加强大。
与此前的gpt系列模型相比,gpt-4最大的突破之一是在文本之外还能够处理图像内容,一起来看看。
当地时间3月14日,openai发布多模态预训练大模型gpt-4,增加了识别和理解图像的能力,同时文本处理能力提升至2.5万字,且回答准确性进一步提高,还拥有编歌曲、写剧本等更创造性的写作能力。
不过,目前gpt-4没有免费版本,仅向chatgptplus的付费订阅用户及企业和开发者开放。
同时,微软也确认bingchat聊天机器人(新版必应)已升级使用openai的gpt-4技术。此前,微软还宣布,已可以在基于azure智能云平台上的openai服务中使用chatgpt。
gpt-4有多强大呢?
在官方演示中,gpt-4几乎就只花了1-2秒的时间,识别了手绘网站图片,并根据要求实时生成了网页代码制作出了几乎与手绘版一样的网站。
除了普通图片,gpt-4还能处理更复杂的图像信息,包括表格、考试题目截图、论文截图、漫画等,例如根据专业论文直接给出论文摘要和要点。
换句话讲,现在的人工智能,已经不仅仅停留在文字处理上了,还能处理简单的图像,这样的人工智能已经越来越接近科幻片里人们想象中的模样。
那么对比此前chatgpt使用的gpt-3.5版本来看,新版的gpt-4性能提升了多少?
openai称,在公司内部的对抗性真实性评估中,新版gpt-4的得分比chatgpt此前使用的gpt-3.5模型高40%,相应的“不允许内容请求的倾向”降低了82%,根据规则响应敏感请求(如医疗建议和自我伤害)的频率提高了29%。
openai称,在测试的26种语言中,gpt-4在24种语言方面的表现均优于gpt-3.5,其中gpt-4的中文(普通话)能够达到80.1%的准确性。
众所周知,中文在计算机识别上比英文的难度更大,语义更加复杂,gpt-4目前对于中文的准确性已经很让人惊艳。
而在专业学术方面,新版gpt-4性能提升幅度也是巨大的。
据openai介绍,gpt-4在专业和学术方面表现出近似于人类的水平。例如,它在模拟律师考试中的得分能够排进前10%左右,相比之下,gpt-3.5的得分只能排在倒数10%左右。
除了律师考试,gpt-4还在美国大学入学测试sat中考到710分,虽然分数不高,但已经够上美国大学录取水平。更重要的是,gpt-4能在大学的基础微积分课程中获得4的成绩(5分为满分),这证明了该模型已经掌握了高等数学大部分的概念。