媒体界
行业纵横 资讯速递 科技前沿 峰会论坛 企业快讯 商业快讯

哥伦比亚大学测试:ChatGPT新闻搜索准确性存忧

2024-12-04来源:ITBEAR编辑:瑞雪

近期,美国哥伦比亚大学的Tow数字新闻研究中心公布了一项针对OpenAI ChatGPT搜索工具的研究结果,指出该工具在准确性上存在显著问题。这一发现引发了业界的广泛关注。

在测试中,研究人员选取了20家出版商的200条引文作为样本,其中包括40条来自禁止OpenAI爬虫抓取的网站。结果显示,ChatGPT在回答中多次给出了错误答案,并且几乎没有表现出任何不确定性。具体而言,ChatGPT的153次回答中,完全或部分错误的情况占据了绝大多数,仅有7次明确表示无法准确回答。

根据测试结果的详细图表,ChatGPT的回答中“错误”的占89次,“部分正确”有57次,而完全“正确”的仅有47次。这一数据直观地反映了ChatGPT在准确性方面存在的问题。

测试中,研究人员还记录了一些典型案例。例如,ChatGPT错误地将《奥兰多哨兵报》的读者来信引用归因于《时代周刊》的文章;在另一个案例中,当要求确认《纽约时报》一篇关于濒危鲸鱼的文章引用时,ChatGPT链接到了一家完全剽窃该文章的网站。这些案例进一步证明了ChatGPT在识别和处理引用方面的不足。

针对这一研究结果,OpenAI向《哥伦比亚新闻评论》回应称,由于缺乏Tow中心隐藏的测试数据和方法,解决错误归因非常困难。OpenAI表示,这次研究是对其产品的非典型测试,并承诺将继续优化搜索结果。这一回应显示出OpenAI对于问题的认知和改进的决心。

今年早些时候,OpenAI曾宣布与新闻行业进行了广泛的合作,并收集了合作伙伴对于搜索功能的反馈。包括美联社、阿克塞尔·斯普林格、康泰纳仕、道奇梅雷迪思、《金融时报》、GEDI、赫斯特、《世界报》、路透社、大西洋月刊、时代杂志和Vox媒体等在内的众多媒体和出版商都选择了与OpenAI合作,使其内容能够出现在ChatGPT的搜索结果中。然而,此次研究结果无疑对这些合作伙伴的信任度产生了一定影响。

固态电池先锋赣锋锂电获10亿C轮融资 估值达75亿全链布局再提速
赣锋锂电是国内最早布局固态电池的企业,掌握硫化物、氧化物、聚合物三条技术路线,目前已实现半固态电池的规模化量产,并持续推进全固态电池的技术突破与产业化进程。 依托母公司江西赣锋锂业在全球范围内的锂资源布局,…

2025-12-10

铠装热电偶领域佼佼者:苏州晶敏传感器实力领航,技术市场双突破
公司每年将营收的8%以上投入研发,组建了一支由50余名工程师组成的技术团队,其中博士及以上学历人员占比20%,涵盖材料科学、热力学、自动化控制等多学科领域。凭借卓越的产品性能,公司多次获得行业奖项,包括“工业…

2025-12-10

固态电池产业加速跑:久功启动中试、纯锂环评公示、芜湖项目突破
北京纯锂此前在北京亦庄建成小试线并量产10Ah全固态电芯,于河南兰考启动500MWh产线建设,并在2024年量产50Ah全固态电芯。 中电建设消息,近日,二公司承建的安徽芜湖固态电池项目在净化室与实验室环境…

2025-12-10

智慧升级!宁夏“光伏海”启用无人机巡检 效率安全双提升
近年来,场站整体进行了智慧化改造,引入了AI+无人机这样的巡检方式,这样就可以迅速、精准地收集光伏组件的故障信息,也提升了运维安全和数智化水平。据工作人员介绍,一架无人机半天的巡检量,相当于过去5人一周的工作…

2025-12-10