gpt-4是什么?gpt-4模型是第四代大型语言模型(llm),braun将llm称为“游戏规则改变者”,它们教会机器理解自然语言,意味着人类将不再独享这项技能。
这一模型是通过gpt技术实现的。
gpt全称为generativepre-trainedtransformer,是一种使用人工神经网络的深度学习技术,能够使机器像人一样聊天交流并进行创作。
而说到gpt-4,就不得不提到它的姐姐gpt-3.5,由该模型开发的聊天机器人chatgpt一经面世,便引爆ai界的竞赛,也让多年来屈居老二的微软必应获得了赶超谷歌搜索引擎的机会。
因此gpt-4将推进基于gpt-3.5的chatgpt所使用的技术。
多模态或成最大亮点
3月9日,微软德国ctoandreasbraun在一场名为“aiinfocus-digitalkickoff”的活动中表示,gpt-4将在下周发布,将提供多模态模型。自3月初发布kosmos-1以来,微软正在与openai微调多模态这一事实应该不再是一个秘密。
“我们将在下周推出gpt-4,我们将有多模态模型,提供完全不同的可能性——如视频,”braun说。这位首席技术官称大型语言模型是“游戏规则的改变者”,因为它们教机器理解自然语言,然后以统计学方式理解以前只能由人类阅读和理解的内容。同时,该技术已经发展到了基本上“适用于所有语言”的程度。“你可以用德语问一个问题,得到意大利语的回答。通过多模态,微软/openai将“使模型变得全面”。
此次gpt4转向多模态,未来的输入输出将出现图像、视频等形态,或将在业内产生更具颠覆性的影响。openai此前推出的dall-e2和clip便是一次很好的尝试。
braun表示,借助多模态,微软(和openai)将使模型变得全面”。这意味着多模态可能成为gpt-4模型的最大亮点。
在活动上,微软ai技术专家holgerkenn和clemenssieber对多模态ai的相关功能进行了介绍。
根据kenn的说法,多模态ai不仅可以将文本转化成相应的图像、音乐甚至是视频。在微软宣布前,机器学习专家emilwallner就在推特上预估,称gpt-4可能具备这种能力。
sieber则介绍了一些多模态ai产业化的潜在案例,例如多模态ai能够将电话呼叫的语音直接记录成文本。根据估算,该功能能为微软位于荷兰的一家大客户节省500个工作小时/天。
微软会把gpt-4集成到必应里吗?
作为openai的主要投资者之一,微软已经将chatgpt的技术集成到旗下应用产品中。
其中,chatgpt版必应仅发布一个月,其日活用户就突破了1亿,为历史上首次。借助chatgpt版必应,微软正以惊人的速度赶超搜索引擎一哥谷歌。
因此多数分析认为,已经尝到不少甜头的微软将继续把gpt-4集成到必应之中。