站内搜索

ChatGPT 是什么?能做什么?发展趋势是什么?

  近日,ChatGPT 火遍全网。网上真真假假的各种测试、各种评论分析让人眼花缭乱。ChatGPT到底是什么?又能给人们带来什么?2 月 11 日,记者采访了西安电子科技大学人工智能学院副院长、博士生导师、教授董伟生。董伟生教授主要从事图像视频处理、深度学习、模式识别与计算机视觉方面的研究工作。

一、问:什么是 ChatGPT?

答:ChatGPT 是美国 OpenAI 公司于 2022 年 11 月发布的一款基于超大规模人工智能模型的人机对话应用程序,能够学习和理解人类输入的文字信息,并根据上下文生成文字内容,回答人类提出的问题。它的功能类似于现有的企业客服机器人、小米公司的小爱同学、苹果手机上的 Siri等聊天机器人,能与人进行自然语言的交流。但在用户体验、回答问题的质量上,ChatGPT 远超上述聊天机器人。

二、问:ChatGPT 目前能做什么工作或者有什么功能?

答:ChatGPT 使用了高达 4TB 的互联网数据和书籍文档资料来训练大规模自然语言模型,并引入了基于人类反馈的强化学习策略从人类的反馈中学习知识,因此具有强大的内容生成能力,可以像人类一样进行聊天交流,甚至能根据用户要求实现邮件、文案、程序代码、论文、翻译等撰写任务,特别擅长规范的文字内容生成,能够大幅促进内容创作,提升内容生产效率与丰富度。当然,ChatGPT 也有局限。它只能基于其学习过的数据来生成内容,对于未知、未在训练库中的问题,会生成一些错误的内容。

三、问:ChatGPT 突然火爆说明什么问题?

答:ChatGPT 绝对是近年来人工智能领域的一个重大突破,是人工智能大模型从量变到质变的一个转变。

ChatGPT是继图像内容生成人工智能模型StableDiffusion之后,文字内容生成的一个重要里程碑。从技术上来说,ChatGPT模型与之前的图像内容生成模型并没有本质的区别,都是基于人工智能生成式模型的应用,底层技术采用的是近几年流行的Transformer网络结构,通过堆叠更多层,构建千亿级别的神经网络大模型,使用超大规模数据来训练该大模型。如此规模的人工智能模型,其所需的计算力也是惊人的。其使用了超过10000块英伟达V100GPU进行了15天的训练,单次训练花费就超过140万美元,通过训练造就了如今功能超强的ChatGPT。

ChatGPT 的成功,说明了采用大模型、大算力、大训练数据可以大幅提升人工智能模型性能,成为研究通用人工智能模型的一种可能的范式。

四、问:ChatGPT 的发展趋势是什么?

答:ChatGPT 主要是根据输入文字的上下文来生成符合要求的内容,本质上是利用其训练数据来拟合语义上符合要求的内容。虽然能够生成看似逻辑完美、表达自然的内容,但对于其未知的内容,ChatGPT 也会生成一些虚构的内容,却未给出生成内容的出处,难以判定其生成内容的正确性。

针对这些问题,ChatGPT 的未来发展趋势应当是结合人类知识、常识来生成更准确、可解释的内容。此外,ChatGPT 模型规模非常庞大,单次推理应用成本比较高。因此,如何降低 ChatGPT 模型的计算复杂性,从而降低单次推理成本肯定是一个重要的发展方向。

五、问:ChatGPT 在现实生活中会有哪些应用场景?是否会对一些行业或工作产生影响?

答:ChatGPT 能大幅提升内容生成的效率,将对新闻生成、文案写作、翻译、程序编写等行业产生影响,有望大幅减少这些行业的人力成本。

当然,ChatGPT 刚诞生不久,对于如何充分发挥其作用,大家还正在尝试中,预计将对众多领域产生巨大的影响。

据董伟生教授介绍,ChatGPT 的横空出世引起了全球相关科技公司的极大关注。ChatGPT 已被微软迅速整合进了其搜索引擎,推出了 New Bing,对 Google 的搜索业务造成很大压力。同时,微软也正在将 ChatGPT 整合进 Office 套件。Google 作为 AI 方面领先的企业,也正在全力推出其大模型驱动的聊天机器人。

国内的 AI 和互联网企业,如百度、阿里巴巴、腾讯也计划尽快推出国产版 ChatGPT。我国在这方面具有较好的基础,国内的大科技公司具备训练大规模 AI 模型的硬件和算法基础。国内的一些大的研究机构,例如鹏城实验室具有鹏城云脑等 AI 计算平台,这是进行这方面研究的必要硬件基础。

董伟生教授表示,训练类似 ChatGPT 的大模型,需要大规模的语料数据集,这些互联网大公司应该也有较好的数据资源。“在模型调优上,可能需要进行一些探索,毕竟 OpenAI 在这方面前期也进行了较长时间的深入研究和积累。国内 AI 人才很丰富,假以时日,相信我国也能研制出媲美 ChatGPT 的聊天机器人。”

Copyright © XiakeShu.com 版权所有 | 备案号:浙ICP备11004787号-12