ChatGPT在超过一半的软件工程问题上回答错误

AI智能对话 10个月前

119 0 0

ChatGPT作为一个能够随时提供对话式回答的聊天机器人，对于您的信息需求来说是一个方便的资源。尽管很方便，但一项新的研究发现，您可能不希望在软件工程提示方面使用ChatGPT。

在AI聊天机器人出现之前，Stack Overflow是程序员们寻求项目建议的首选资源，其问答模式与ChatGPT类似。

然而，在Stack Overflow上，您必须等待有人回答您的问题，而使用ChatGPT则不需要。

因此，许多软件工程师和程序员已经转向ChatGPT寻求帮助。由于没有数据显示ChatGPT在回答这些类型的提示时的效果如何，一项新的研究调查了这个困境。

为了弄清楚ChatGPT在回答软件工程提示时的效率如何，研究人员给ChatGPT提供了517个Stack Overflow问题，并检查了这些答案的准确性和质量。

结果显示，在512个问题中，ChatGPT的答案中有259个（52%）是错误的，只有248个（48%）是正确的。此外，惊人的是，77%的答案冗长而啰嗦。

尽管答案的准确性显著不高，但结果显示，这些答案在65%的时间里是全面的，并涵盖了问题的所有方面。

为了进一步分析ChatGPT回答的质量，研究人员请12位具有不同编程专业水平的参与者提供他们对答案的见解。

尽管参与者们在各个类别上更喜欢Stack Overflow的回答，但他们在39.34%的时间里无法正确识别ChatGPT生成的错误答案。

根据这项研究，ChatGPT输出的表达清晰的回答导致用户忽视了答案中的错误信息。

作者写道：“由于ChatGPT答案中的全面、清晰和人性化见解，用户在ChatGPT答案中忽视了错误信息（39.34%的时间）。”

虽然这种生成听起来合理但错误的答案是所有聊天机器人中的一个重要问题，因为它会导致错误信息的传播。除了这个风险，低准确性得分应该足以让您重新考虑使用ChatGPT来回答这些类型的提示。

©版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

暂无评论

热门工具更多>>

OpenAI旗下的AI对话工具，基于GPT（生成式预训练模型）技术的聊天对话机器人。

开源的、支持中英双语的1300亿参数的对话语言模型

豆包是一款由字节跳动公司训练的人工智能，它具有强大的自然语言处理能力和广泛的知识储备。

搜索AI伙伴是百度研发的下一代智能搜索，它结合了人工智能和搜索引擎技术，为用户提供更加智能、便捷的搜索和决策服务。

百度推出的基于文心大模型的AI对话互动工具

AI工具箱是一款优质的AI在线工具集合，提供各种实用工具，帮助您在工作和生活中更高效、便捷地处理任务。AI工具箱提供了AI工具排行榜，收录了众多免费的AI工具，为您提供一个方便的AI工具导航平台。无论您是需要文本分析、图像处理还是数据挖掘等领域工具，AI工具箱都能满足您的需求，快来体验吧！

AI工具箱热门资讯 AI工具榜单联系我们关于我们免责声明

Copyright © 2023 AI工具箱蜀ICP备13028337号-1
注意：本站仅收录网站，不对其网站内容或交易负责。若收录的站点侵害到您的利益，请联系我们删除收录。