AI助理:用ChatGPT轻松搞定工作
上QQ阅读APP看书,第一时间看更新

第1章 AIGC将重塑职场

自 2022 年年底诞生以来,“ChatGPT”这个词就频频出现在媒体、互联网、公众号和各种专家、大佬的公开及私下演讲中,一跃成为市场上最为耀眼的明星产品,也掀起了一波 AIGC 的新浪潮。

纵观科技发展史,如果以 1 亿用户作为科技发展速度的衡量标杆,那么电话的推广用了 75 年,手机用了 16 年,网站用了 7 年,TikTok 用了 9 个月,而 ChatGPT仅仅用了 2 个月时间,着实令人惊叹。1

1 资料来源:https://mbd.baidu.com/newspage/data/dtlandingsuper?nid=dt_4386899306684463127

截至 2023 年 5 月,ChatGPT月活用户数量已达到 8.47 亿,和微信视频号的月活用户数量大致相当,是全球用户量最大的互联网应用之一。

作为一个新型的聊天机器人,ChatGPT之所以能有如此飞速的用户增长能力,核心在于它不仅是一个可供聊天休闲的对象,而且真真切切可以协助人们工作,将人类的工作效率提升 10 倍以上,是现代人的超级助理。澎湃新闻就曾报道过关于工作辅助的一个典型案例。在《收获》杂志 65 周年庆典上,莫言为余华颁奖时曾幽默地表示,自己给余华的颁奖词好几天也写不出来,后来找了 ChatGPT帮忙,瞬间生成了莎士比亚风的千字赞语供其参考。2

2 资料来源:thepaper.cn/newsDetail_forward_23117401

越来越多的人用 ChatGPT处理各种类型的日常文本类工作,这也体现了 ChatGPT在自然语言处理(NLP)任务方面的出色表现。虽然这并不能替代人类的创造性思维和表达能力,但它可以帮助人们自省并激发灵感,进而更好地传达想表达的思想。本书将会介绍如何将 ChatGPT运用在日常工作和生活之中,以便大家更好地了解这个AI助理的具体用途。

ChatGPT是由 OpenAI公司开发的人工智能产品,OpenAI也因为ChatGPT的诞生成了世界的焦点。然而,OpenAI的成功并非偶然,而是经过了漫长的技术积累和发展过程。

OpenAI成立于 2015 年 12 月,它的联合创建者包括硅谷知名科技加速器 Y Combinator 的前董事长山姆 · 阿尔特曼(Sam Altman),以及大家熟知的特斯拉和 SpaceX 的创始人伊隆 · 马斯克(Elon Musk)。两位联合创始人在人工智能等科技及相关商业领域都具有丰富的经验。

OpenAI从创建之初起,其目标就是“为造福全人类而创建安全的通用人工智能”,而 GPT(Generative Pre-trained Transformer,生成式预训练变换器)大型语言模型就是实现这一目标道路上的重要里程碑。截至 2023 年 6 月,GPT 模型已经经过了 4 个大的版本迭代,以下是整个 GPT 模型的发展历程。

01.GPT-1

GPT-1 是 OpenAI发布的第一个 GPT 模型,于 2018 年推出。它采用 Transformer 架构并引入了预训练和微调的策略。GPT-1 具有 1.17 亿参数量,相较于当时的其他模型,它在自然语言理解和生成任务上展现了显著的优势。GPT-1 开创了大型预训练语言模型的发展趋势。

 

02.GPT-2

GPT-2 在 GPT-1 的基础上进行了扩展,于 2019 年推出,将参数量增加到了 15 亿,成为当时最大的预训练语言模型之一。GPT-2 在多项自然语言处理任务上取得了领先的性能,尤其在文本生成方面展现了惊人的生成能力和多样性。鉴于其强大的能力,OpenAI最初只发布了 GPT-2 的部分版本,因为担心滥用可能会带来风险。后来,随着社会对AI风险的认识逐渐成熟,OpenAI逐步发布了 GPT-2 的完整版本。

 

03.GPT-3

GPT-3 进一步扩展了参数规模,于 2020 年推出,其参数量达到了 1750 亿,是 GPT-2 的 100 多倍。GPT-3 在多项自然语言处理任务上取得了革命性的进展,甚至在某些任务上可以直接通过预训练生成准确的结果,而无须进行微调。GPT-3 的出色性能引发了人工智能领域的广泛关注,推动了大型预训练模型的发展和应用。鉴于 GPT-3 的优秀表现,OpenAI对其进行了基于人类反馈的强化训练,形成了 GPT-3.5 版本。这使得模型生成结果与人类意图更加符合,之后 GPT-3.5 被推向了市场,就是目前大家看到的 ChatGPT。

 

04.GPT-4

GPT-4 侧重发展模型在逻辑推理上的能力和多模态能力,并进一步强化了整体性能,于 2023 年 3 月推出。目前,GPT-4 在逻辑推理和数学计算方面与 GPT-3 相比有了非常大的进步,能够有效地帮助我们撰写文档、计算复杂的数学难题、对问题进行分析和概括,并且能够理解图像内的语义信息,对于人们的工作具有更强大的支持辅助作用。

2023 年 11 月,更强大、更便宜的 GPT-4 Turbo 被推出,其更强大的方面包括上下文长度的升级、更新的知识和多模态能力、更高的可控制性,等等。在 GPT-4 Turbo 的引领下,我们正迈向一个更加个性化、高效和负责任的AI应用的新时代。

目前,虽然 ChatGPT底层已支持接入 GPT-4 版本,但因为 GPT-3.5 版本是免费的,所以 GPT-3.5 仍是当前大众使用的主流。

在上文提及的 GPT 模型中,G、P、T 这 3 个字母分别是生成式(Generative)、预训练(Pre-trained)、变换器(Transformer)的英文缩写。

所谓“生成式”,是指根据模型已知的部分文本来生成或预测文本的下一部分。这是通过一个自回归的过程完成的,即模型一次生成一个词,并使用之前生成的所有词作为上下文依据继续生成后面的词。

“预训练”是指模型在完成具体任务之前,先在大规模的无标签文本数据上进行训练。在预训练阶段,模型自主学习如何预测下一个词,从而了解词、短语和句子的结构,以及它们如何组合成有意义的语言。

Transformer 是 GPT 采用的主要网络架构,特点是使用了自注意力机制。这种机制允许模型在生成一个新词时对输入的所有词进行关注,并理解它们之间的关系,这有助于更好地处理长距离依赖关系。另外,GPT 模型还严格遵守了缩放法则,即通过增加模型的大小(包括层数、参数量等)以及使用更多的训练数据,可以显著提高模型的性能。

以上模型架构让 GPT 大语言模型拥有了自然语言交互、上下文理解和零样本学习这三大特点。

01.自然语言交互

由于 GPT 模型良好的语言理解能力,因此用户可以使用自然语言流畅地与模型进行交互,对模型下达命令并获得很好的反馈。这就使得普通人只需经过简单的学习即可熟练使用大模型处理日常事务。

 

02.上下文理解

由于 GPT 模型的自注意力机制可以使模型记住距离更远的上下文,因此模型的每一次输出都能够以上下文语境作为背景。这样产生的对话,就会更加接近人类之间的对话,使得使用模型生成内容的过程更加自然。

 

03.零样本学习

随着 GPT 系列模型规模的增长,特别是在 GPT-3 之后,模型展现出了强大的零样本学习能力,即不需要事先训练,模型就可通过自己的推理完成某些任务。这意味着 GPT 的应用范围更加广泛了。

总而言之,GPT 系列模型从 GPT-1 到 GPT-4 的发展,展现了它在自然语言处理领域的巨大潜力。随着模型规模和性能的不断提升,未来 GPT 模型可能会在更广泛的应用场景中发挥重要作用,为人工智能领域的创新和发展做出贡献。

在正式介绍 ChatGPT之前,先来看一下ChatGPT的操作界面长什么样子。图 1-1 展示了ChatGPT的基本样子,它就像是一个聊天工具,你只需要用日常生活中的语言向它下命令、提问题,它就会用通顺流畅的语言回应你,这种简单的方式大大降低了普通人使用人工智能的门槛。

图 1-1 ChatGPT的操作界面

ChatGPT不仅可以回答你的问题,而且只要给它下达正确的指令,它就能帮你做非常多的事情,比如写故事、写文案、列提纲、编程序等。本书就是作者与 ChatGPT合作完成的。

不仅是 ChatGPT,还有非常多的AI工具可以帮我们生成图片、视频、音乐等,通过与AI合作来创作内容,我们都称之为 AIGC(AIGenerated Content)。

而这些工具的统一特点是,你只需要输入简单的自然语言,描述希望生成内容的样子,它们就可以自动帮你生成文字、图片、视频和音乐,大大降低了普通人创造高质量内容的门槛。未来,只要掌握AI工具,人人都可以变成作家、画家、导演和音乐家。

因为大多数 AIGC 工具可以通过文本驱动内容的生成,所以在使用其他 AIGC 工具的过程中,可以运用 ChatGPT进行辅助,让它帮助你构思需要输入的指令文本,进一步提升使用效率。

当然不只是这些 AIGC 工具,即便是一些传统的诸如 Office 之类的办公软件套装,也可以在ChatGPT的帮助下大大提升办公效率。有了这些强大的工具,人们通过简单的操作就能创造出许多优秀的作品,而这些作品所象征的人工智能创作文化将有可能演变为一种改变世界格局的文化现象。

虽然人工智能的能力和应用尚存在一些限制和挑战,但是相信在可以预见的未来,技术的不断进步和创新能让更多人享受到AI带来的创作快感,创造出更多、更好的内容。我们期待着未来,无论你是不是创作者,都能够尝试利用AI工具,创造出令人惊艳的作品。