首页
AI在阅读理解上首次击败人类
返回

AI在阅读理解上首次击败人类

2022-12-19 科技信息 By:佚名
最佳答案数十年来,研究人员一直追求对计算机系统进行语言理解培训。现在,科技巨头阿里巴巴和微软声称已朝着这一崇高目标迈出了第一步。两种系统均使用斯坦福大学的问答数据集进行了测试,该数据集基于500篇维基百科文章,共收集了100,000个问题,这已成为不同AI研究小组争夺第一个超越标准人类性能的战场...

数十年来,研究人员一直追求对计算机系统进行语言理解培训。现在,科技巨头阿里巴巴和微软声称已朝着这一崇高目标迈出了第一步。两种系统均使用斯坦福大学的问答数据集进行了测试,该数据集基于500篇维基百科文章,共收集了100,000个问题,这已成为不同AI研究小组争夺第一个超越标准人类性能的战场。

向系统提供了有关各种主题的文章中的多个段落,然后根据可用信息提示他们回答许多问题。

目前的人类得分为82.3,而由阿里巴巴和微软构建的系统分别获得82.44和82.65分,以其头发的广度击败了他们的生物竞争对手。

“我们很荣幸能见证机器在阅读理解方面超越人类的里程碑。这意味着诸如“下雨的原因”这样的客观问题现在可以通过机器高精度地回答。”阿里巴巴自然语言处理首席科学家罗斯说。

一些新闻媒体已经掌握了新闻,声称人工智能现在可以比人类更好地阅读,甚至可以以前所未有的方式减少对人类输入的需求。

但是,正如许多其他评论员以及公司本身所指出的那样,这不是“真正的”理解。换句话说,这些算法不知道它们在“读”什么。

明显的理解源于系统识别文章中包含的模式和匹配术语的能力。

此外,系统仅被提供了来自维基百科的干净格式的材料,该材料被保证包含答案。用胡言乱语“污染”文本,或要求系统从几个句子中推断出含义,这会破坏流程,这意味着真正的理解仍然离我们很远。

不过,在此之前,研究人员希望尽快在博物馆,客户服务机构中实施类似设计的系统,这是一种旨在为医疗查询提供答案的在线系统。

此外,世界各地的研究团队目前正在训练AI系统,以解决SAT风格的数学问题和基础科学问题。

猜你喜欢
苏州蠡口家具城(苏州蠡口)

苏州蠡口家具城(苏州蠡口)

12-18 0 阅读
Fitbit的可穿戴新传闻被称为Versa

Fitbit的可穿戴新传闻被称为Versa

12-18 0 阅读
西甲录像全场回放(西甲国家德比录像回放)

西甲录像全场回放(西甲国家德比录像回放)

10-25 0 阅读
食品安全法实施时间(关于食品安全法实施时间的介绍)

食品安全法实施时间(关于食品安全法实施时间的介绍)

12-19 0 阅读
北京市牡丹卡有什么用(北京牡丹交通卡初始密码是多少)

北京市牡丹卡有什么用(北京牡丹交通卡初始密码是多少)

12-19 0 阅读
拼多多什么情况会降权(拼多多降权会通知吗)

拼多多什么情况会降权(拼多多降权会通知吗)

12-19 0 阅读
热门推荐
苏州蠡口家具城(苏州蠡口)

苏州蠡口家具城(苏州蠡口)

12-18 0 阅读
Fitbit的可穿戴新传闻被称为Versa

Fitbit的可穿戴新传闻被称为Versa

12-18 0 阅读
西甲录像全场回放(西甲国家德比录像回放)

西甲录像全场回放(西甲国家德比录像回放)

10-25 0 阅读
食品安全法实施时间(关于食品安全法实施时间的介绍)

食品安全法实施时间(关于食品安全法实施时间的介绍)

12-19 0 阅读
北京市牡丹卡有什么用(北京牡丹交通卡初始密码是多少)

北京市牡丹卡有什么用(北京牡丹交通卡初始密码是多少)

12-19 0 阅读
拼多多什么情况会降权(拼多多降权会通知吗)

拼多多什么情况会降权(拼多多降权会通知吗)

12-19 0 阅读
愿景光(关于愿景光的介绍)

愿景光(关于愿景光的介绍)

08-13 0 阅读
12岁的女孩子早恋怎么办(12岁学生早恋怎么办)

12岁的女孩子早恋怎么办(12岁学生早恋怎么办)

12-18 0 阅读
mywill(mywi)

mywill(mywi)

12-18 0 阅读
限牌令是什么(限牌)

限牌令是什么(限牌)

12-06 0 阅读