设为首页 加入收藏 English

当前位置: 首页 前沿资讯 正文

MIT Technology Review发布2021年“十大突破性技术”榜单,生成式预训练模型、多技能型人工智能等入选

作者:时间:2021-08-19点击数:

2021224日,MIT Technology Review一年一度的十大突破性技术榜单正式发布。自2001年起,该杂志每年都会评选出当年的十大突破性技术,这份在全球科技领域举足轻重的榜单曾精准预测了脑机接口、量子密码、灵巧机器人、智慧传感城市、深度学习等诸多热门技术的崛起。本年度MIT Technology Review “十大突破性技术分别为:mRNA疫苗、生成式预训练模型、数据信托、锂金属电池、数字接触追踪、超高精度定位、远程技术、多技能型人工智能、TikTok推荐算法和绿色氢能。

关于生成式预训练模型(GPT-3),文章指出具有写作和对话功能的大规模自然语言模型使人工智能朝着更好地理解人类的自然语言与人机交互这一目标迈出了坚实的一步。在众多语言模型中,OpenAI公司开发的GPT-3是目前为止参数最多、规模最大、能力最强的模型。通过利用大量的互联网文本数据和成千上万的书籍进行模型训练,GPT-3模型对人类自然语言的模仿到了一个不可思议的地步,极具真实性,也因此成为迄今为止令人印象最深刻的语言模型。

虽然GPT-3模型建模能力、描述能力非常强,但是也存在众多问题和局限性。首当其冲的就是GPT-3模型不能理解什么是真正意义上的写作(自然语言生成),因此有时会生成一些不可控的内容。其次,训练GPT-3模型需要大量的算力、数据和资金投入,并会产生大量的碳排放,只有资源充足的实验室才有能力开发类似的模型。此外,由于GPT-3模型在充斥错误消息和偏见的互联网文本数据上进行训练,往往会产生与训练数据类似,即带有偏见的篇章段落。

1C7CC

   

关于多技能AI(Multi-skilled AI),文章指出2012年底,人工智能科学家首次弄清了如何让神经网络“拥有视觉”,随后,他们还掌握了如何让神经网络模仿人类推理、听觉、语言和写作的方式。虽然人工智能在完成特定任务方面已经变得非常像人类,甚至是超越人类,但它仍然没有人类大脑的“灵活性”,即人脑可以在一种情境中学习技能,并将其应用到另一种情境中。

受儿童成长过程的启发,如果将感官和语言结合起来,并让人工智能拥有更接近于人类的方式来收集和处理信息,那么它能否发展出对世界的理解?答案是肯定的。这些可同时获得人类智能的感官和语言的多模态系统,应该会生成一种更强大的人工智能,也更容易适应新情况、以及解决新问题。如此一来,我们便可以使用这样的算法来解决更复杂的问题,或者将其移植到机器人中去,使得机器人能够在日常生活中与我们交流协作。2020 9 月,艾伦人工智能研究所 AI2 的研究人员创建了一个可以从文本标题生成图像的模型,展示了算法将单词与视觉信息关联的能力;11 月,北卡罗来纳大学教堂山分校的研究人员开发了一种将图像纳入现有语言模型的方法,此举提高了模型的阅读理解能力;2021 年初,OpenAI GPT-3 进行了扩展,发布了两个视觉语言模型,其中一个将图像中的对象与标题中描述它们的单词联系起来,另一个则根据它所学的概念组合生成图像。从长远来看,多模态系统取得的重大进展可以帮助突破人工智能的极限,不仅会解锁新的人工智能应用,也会让它们的应用变得更加安全可靠,更加精密的多模态系统也将使更先进的机器人助手成为可能。总而言之,多模态系统可能会成为第一批我们可以真正信任的人工智能。



文章内容来源《中国科学基金》2021年第35卷第3期


版权所有 2014 北京航空航天大学  京ICP备05004617-3  文保网安备案号1101080018  地址:北京市海淀区学院路37号  邮编:100191  电话:82339909