(原标题:人工智能又取得大胜?ChatGPT的健康问答结果碾压人类医生)
(相关资料图)
财联社4月29日讯(编辑 赵昊)最新公布的一项研究表明,聊天机器人ChatGPT在某些方面能表现得比医生出色。
这项研究周五(4月28日)发表在国际著名医学期刊《JAMA Internal Medicine》上。结果表明:人工智能助手可能有能力帮助医生起草对患者问题的回答。
作者加州大学圣地亚哥分校约翰·W·艾尔斯(John W. Ayers)博士称,聊天机器人对患者的回应要普遍优于医生的回应,并且在回答质量和同理心方面的评分都明显高得多,“用人工智能改善医疗保健的机会是巨大的。”
具体来看,研究团队从一个社交论坛上抽取了195个医学问题,每一个问题都有人类医生作出过回答。接着将这些问题输入到ChatGPT中,得到了对应的人工智能的回答。
然后,团队将人类医生的回答和聊天机器人的回答交由三名医疗保健专业人员来评估。
这组专业人员需要在三个方面打分:一、哪个反应得更好?二、信息的质量如何?三、回答是否具备同理心?
在评估过程中,医疗保健专业人员并不知道哪一份回答是来自人类的,或是来自ChatGPT的。
结果显示:在第一个问题上,评估者认为,聊天机器人在78.6%的问题上表现得比人类医生好;
在质量上,评估者觉得聊天机器人78.5%的回答表现良好或非常好,而人类医生只有22.1%;
在同理心方面,聊天机器人45.1%的回答被评为有同理心或非常有同理心,而医生的比例只有4.6%。
研究提供了一个非常典型的例子。一名患者在论坛提出了一个问题:漂白剂溅入眼睛后是否有失明的风险。ChatGPT先是表达关切,随后针对“不太可能失明”的结果提出了七句建议和鼓励。
而人类医生则是回应,“听起来你会没事的”,然后贴出了中毒中心的电话号码。经对比,三位医疗保健专业人员都更喜欢ChatGPT的反应。
但有专家指出,ChatGPT的回复通常要比医生长得多,可能会影响质量和同理心的分数。爱丁堡大学自然语言处理教授Mirella Lapata称,如果不控制回答的长度,就很难确定评分者的判断标准。
本周另有一项研究表明,ChatGPT在一些特定的医学场合具有独特的价值和优势。研究人员要求ChatGPT提供五年级阅读水平的医嘱,“ChatGPT提供的答案写得很好、很详细,有望让待诊患者更早获得专业信息。”
不过,宾夕法尼亚大学医学教授David Asch博士强调,ChatGPT应该被视为对医生的补充。他还警告,人工智能工具还没有充分准备好,“我担心错误信息会被放大。”
一米八几的大个子,蜷缩在一张轮椅上,仅凭两根手指写字,却以惊人毅力
住过海景房、湖景房,那你有没有住过“猪景房”?是的,就是字面那个意
6月25日,一则寻人消息引发许多网友关注,寻人消息称:万文,青神人,
6月25日,记者从省人社厅了解到,近日,我省启动2023年度豫商豫才返乡
6月24日,四川眉山。26岁女孩乘网约车下车后失联,目前家人正紧急寻人
“成都一女子自怀孕遭丈夫家暴多内脏受损”,引起广泛关注。6月25日晚
近日,吉林四平一家名为“雄性食材烧蒸馆”的餐馆,被指菜单中出现粗俗
郑州天气预报晴天间多云26℃~36℃西南风3级宝子们早上好吖!送走了高考
前不久,“酒吧擅自邀请涉毒艺人孙兴被罚5万元”话题登上热搜。浙江省
6月24日,一男子在黑龙江双鸭山宝山区一市场门口喝下不明液体,正在买
近日,一环保志愿小组发起“嘉塘数鸟人”野生鸟类观察和保护项目因试用
排球场上六个位置:发球、第一传球(接球)、第二传球(提球)、扣球、拦网和救球。排球位置分配包括三种类...
耆读音:耆是一个汉字,读音qí,意思是六十岁曰耆,亦泛指寿考。耆耋和耄耋的区别:1、字形上的...
沧海横流方显英雄本色含义:1、沧海横流,方显出,英雄本色的意思是在广阔无垠的大海里面冲浪,越是怒涛...
读书须用意一字值千金含义:1、读书须用意,一字值千金指的是想文采出众,一字千金,就得在读书时下一番...
外交部发言人就瓦格纳集团事件答记者问问:据报道,普利戈任与瓦格纳集
知其不可奈何而安之若命下一句:知其不可奈何而安之若命,德之至也;悟其可以纵横而行之无忌,道之极也。...
学用相长是读chang还是zhang:你好,学用相长是读zhǎng,读音是xué yòng xiàng...
说到排球大家首先想到的大多都是六人排球在海南还流行着一种九人排球排
毒品害人害己,切莫以身试毒,涉毒必抓,别等到酿成大错才后悔莫及。在
X 关闭
X 关闭
06-25 16:21:01
06-25 15:52:24
06-25 15:48:18
06-25 15:13:29
06-25 14:42:24