ChatGPT、Gemini、通义千问等一众大语言模型,哪家更适合您?

2024-05-11 11:03:44     来源:

随着人工智能技术的飞速发展,大语言模型(Large Language Models, LLMs)在各行各业的应用日益广泛,尤其是在软件开发、数据分析、客户服务等领域。蘑菇云创客空间[445期开放夜] 就以“ChatGPT、Gemini、通义千问等一众大语言模型,哪家更适合您”这样的主题,开展了一次深度的大语言模型的测评。开放夜现场测评了十几个国内外大语言模型,测评角度从逻辑、数学、翻译、伦理等方面,深入探讨和体验了这些大语言模型的实际效能。

图片17_副本.png

测评的大语言模型:

1.Kimi 智能助手:由月之暗面科技有限公司开发的先进AI。

2.智谱清言:由智言科技开发的大语言模型,以深度学习和自然语言处理技术见长。

3.讯飞星火:科大讯飞推出的创新语言模型。

4.文心一言:百度的前沿语言模型,致力于理解和生成自然语言。

5.豆包:专注于提供个性化的智能对话服务。

6.通义千问:以广泛的知识库和灵活的对话能力著称。

7.海螺AI:新兴的语言模型,擅长处理复杂的语言任务。

8.腾讯混元助手:腾讯推出的多功能AI助手。

9.Sider: 是由日本公司Sider开发的大语言模型。

10.ChatGPT:由OpenAI开发,国际上广受认可的更大规模、功能更全面的语言模型。

11.Claude:Anthropic开发的先进语言模型,注重安全性和可靠性。

12.groq:以其专为AI设计的硬件加速器而闻名。

13.Gemini: OpenAI 开发的较小规模的语言模型,旨在提供更高效的计算和资源利用。

14.Mixtral:开源人工智能初创公司 Mistral AI 开发的超越GPT-3.5的AI模型

测评问题一: 鸡兔同笼的数学问题

鸡兔同笼是一个经典的数学问题,通过观察鸡兔的头和脚的数量关系,可以利用代数方程来解决问题,从而确定笼子里鸡和兔子的数量。这个问题常常展示了代数方程组的应用。

<span

<span

<span

针对鸡兔同笼的问题,除了Gemini Pro没有得出正确的结果,其余的大语言模型都可以给出正确结果。

测评问题二:翻译(诗句中翻英)

诗人马致远的诗句“断肠人在天涯”,描写了“夕阳向西缓缓落下,只有孤独的旅人漂泊在遥远的地方。”诗句的翻译涉及到文化差异和诗人独特情感。Mixtral 的语言模型正确的解释了诗句本身的含义,帮助翻译者很好地理解这句诗句。 Claude的语言模型对于诗句的本身理解是不正确的。

<span

<span

<span

这句诗翻译家许渊冲翻译为“Far, far from home is the heartbroken one.”由此可见,大语言模型可以帮助翻译者分析这句诗基本的意思,但是涉及文化层面的深层含义,还是做不到意译的。

开放夜也探讨了如下涉及生活、工作的一些问题,比如:

过年福字要倒着贴,那为什么不直接生产倒过来的福字呢?

收到公司的裁员通知邮件,你应该怎么回复邮件来保住工作?

一个乌龟掉进了井里,井里有30米深。乌龟白天爬3米,晚上滑下2米。问这只乌龟需要多长时间才能爬出井口?

<span

<span

DFRobot AIGC小组主理人夏青在开放夜的现场测评了十几个国内外大语言模型,通过多维度问题的测评,他认为:对于处理综合性问题,OpenAI的ChatGPT 4.0逻辑清楚,能提供非常有用的信息。尽管在回答一些较为复杂的问题上略显不足,但在大多数场合下,其性能仍然令人满意。然而,ChatGPT 4.0在国内的使用成本是一个不容忽视的问题,不仅涉及订阅费用,也包括使用的技术门槛。

<span

与此同时,Gemini和Claude等海外语言模型,尽管在遵循指令方面略显不足,但已达到了实用水平。令人惊喜的是,国内的Qwen1.5 72b开源模型在中文理解和特定任务,几乎能与ChatGPT4.0匹敌此外,其他开源模型如Mixtral和新发布的LLaMA3虽在逻辑性上略逊于商业模型如ChatGPT,但总体表现已超越了ChatGPT 3.5。

综合分析来看,尽管ChatGPT 4.0仍然是目前市场上最优秀的大语言模型,但不可忽视的是,无论是国际市场还是国内市场,其他厂商的模型均显示出迅速的进步。开源模型的崛起也证明了开源社区在AI时代的巨大潜力。当前的大语言模型在处理理性问题方面表现一致,但通常无法提供情绪价值回应。例如,一些国内模型如“豆包”将展现其在情绪回应方面的潜力。这种能力的发展可能为未来陪伴型机器人的商业模型提供新的方向。

蘑菇云创客空间

蘑菇云创客空间是上海浦东的一家创客空间,是科技部授牌的首批国家级创客空间,由浦软孵化器提供场地支持、上海智位机器人提供硬件及技术支持的一家为创客服务的开放式创客空间。拥有独立的加工室、公共协作区域以及储物、耗材商店,为硬件爱好者、程序员、设计师、DIY 发烧友等各类创客,甚至包括进行创新研发的科创团队提供一个开放式的社区化会员空间。

标签:

猜你喜欢

澳科大成为本澳首个与CIMA签订CGMA®财务领袖课程合伙伙伴协议并获得认证的高等教育机构
INR101注射液IND申请获批,云南白药加速推进核药领域布局
靶向发力,激活内生动力 中石油河北销售刀刃向内,将发展的动能源源不断激发出来
两年只换不修!解放NG车型何来如此底气?
爱优选:吉尔吉斯斯坦辅助生殖中的食物策略:吃对了就成功了!
永州东方医院服务保护患者隐私
永州男科怎么样?永州东方医院管理制度严谨树立良好口碑建设
永州男科怎么样?永州东方医院以严谨之心捍卫健康
既要又要还要 创业第一台轻卡怎么选
希诺S酒店宁波旗舰店盛大启幕 探索城市生活新方式
2024年度河南市场监管科普讲解大赛圆满落幕
最有想象力的城市更新|北京团河派出所旧址变身“折叠公园”——靠近设计事务所/浙江工业大学工程设计集团
和美中国·礼乐长安:大丰美育浸润“一带一路”
2024神经环路示踪与调控大会暨 针灸研究前沿技术创新大会于深圳 圆满落幕!
这一年 他们用责任@未来
《爱国革命——纪念黄埔军校建校100周年主题展》开展仪式
绍兴中行优化供应链金融服务,依托动产融资助力小微企业
越山川·悦美妙|米兰柏羽20周年品牌升级发布会盛大启幕
加强政企交流合作,“向新而行 向上生长——2024企业家江夏行”活动启动
实力不凡!全省第七!河南这家建企季度中标36个!
金茗教育高考“专业选择有方向,志愿名师来指导”访谈活动成功举行
市场成熟、合规加速:印尼金融科技新机会在哪?-2024年印尼金融科技报告解读
"个性化治疗时代下的医疗科技革新:大医集团TAICHI RT 荣膺动脉网’VBEF医疗健康创新力产品榜’桂冠"
北京佑康中医药文化传承基金会携中医药文化走进北京市昌平区第五学校
北京正中堂中医医院特聘专家周亚男做客《记忆·国医》:警惕呼吸道疾病引发的健康隐患
附独家榜单 | 2024机器人行业应用创新发展蓝皮书发布
《这是我的岛》惊!海岛“清纯男大”爆改“沧桑男”
Qeelin春日献新作 “麒”幻珠宝点亮人生重要时刻
品峰医疗荣登“2024未来医疗100强”双榜单
5米高空抛落都不怕!Lexar雷克沙发布新三防超强存储卡