刘庆峰在发布会上放出豪言,星火大模型将在23年10月底能够在通用大模型能力上对标ChatGPT,“在中文上要超越ChatGPT,英文上达到相当的水平。”
只是,如今AI大模型领域的技术迭代已经不是以年为计量单位,真的是堪称“日新月异”,时不我待!
首先,讯飞星火认知大模型目前还无法进行文生图。据悉,讯飞星火大模型的“Plus版本”拥有理解图片、文生图等功能。
此外,对于语言理解、数学能力、长文本生成三项能力,我们也进行了实测。
以下是小编挑选出来的一些问题,让我们先来个“开胃菜”。
“煮一个鸡蛋要5分钟,煮4个鸡蛋需要几分钟?”这是一道常识题目,难度也就是小学水平。
讯飞星火大模型是这样回答的:
接着,小编突发奇想,出一道错题看看讯飞星火如何自圆其说。
“鸡兔同笼,头有10个,脚有42只,鸡兔各有多少只?”
讯飞星火先是将错就错,求出来鸡的数量为-1只,然后表示“这个结果不符合实际情况,因为鸡的数量不能为负数”。经过重新审视题目,讯飞星火表示“题目中的数据可能存在误差或特殊情况”。
讯飞星火认知大模型虽然啰啰嗦嗦,但是确实能把题目分析得头头是道。
作为语言大模型,看家本领就是语言理解能力,那我们来测一测。
“俗话说:得饶人处且饶人;俗话又说:放虎归山,后患无穷!你怎么理解?”
讯飞星火认为这两个俗话的含义是不同的,并就二者的含义进行解释,还告诫人们在生活中应该平衡自己的利益和他人的权利。
数学能力是考验AI大模型是智能还是智障的试金石。小编专门挑了一道高考题来考考它们。
“函数f(x)=cosx-cos2x,试判断函数的奇偶数及最大值?”
此函数的正确答案应该是偶函数,最大值为9/8。
小编发现讯飞星火在函数的最大值上回答正确,却把函数f(x)求成了奇函数。在小编的提醒下,讯飞星火最终求出了正确答案。这“知错就改”的态度还是不错的。
在考察文本生成能力方面。
小编让讯飞星火模仿鲁迅先生的写作风格生成一篇散文,让我们来欣赏欣赏它的文采吧!
你觉得谁写得更好呢?在下方评论区讨论一下吧。