ChatGPT是 OpenAI 创建的大型语言模型,旨在理解和响应自然语言。它接受了各种文本的训练,包括书籍、文章和网站,这使得它能够理解和回答各种主题的问题。在本文中,我们将探讨 ChatGPT 的一些关键功能,包括回答问题、协助编写任务以及执行自动化任务。

      GPT 模型基于 Transformer 架构,该架构是 Google 研究人员在 2017 年的一篇论文中介绍的。Transformer 架构使用自注意力机制,允许模型在进行预测时权衡输入不同部分的重要性。这使得模型能够更好地理解输入文本的上下文和含义。

一、ChatGPT是什么?
      ChatGPT,全称聊天生成预训练转换器,是OpenAI开发的人工智能聊天机器人程序,于2022年11月推出。该程序使用基于GPT-3.5、GPT-4架构的大型语言模型并以强化学习训练。

      ChatGPT是由OpenAI公司推出的火爆全球的聊天对话机器人,该AI聊天对话工具建立在OpenAI开发的GPT-4语言模型上,它可以执行各种自然语言处理(NLP)任务,如总结、分类、提问和回答,以及类似人类反应的错误纠正。ChatGPT是一项革命性的技术,通过将人们的工作效率提高到一个新的水平,使人们的生活更加轻松。

      ChatGPT人工智能聊天机器人是由OpenAI开发和拥有的,Elon Musk和Sam Altman在2015年将其作为一家非营利性公司创立。2018年,马斯克从OpenAI中撤出,不再拥有OpenAI的股份。起初,该公司从硅谷风险资本家那里获得了10亿美元,以启动构建神经网络。

      2019年,OpenAI从微软那里筹集了10亿美元的第二轮资金。他们开始使用Azure超级计算机来构建这些大型语言模型。快进到2023年,微软向OpenAI投资了100亿美元,使其总股份达到49%。其他投资者,包括Khosla Ventures,又占了49%,而OpenAI只保留了2%的股权。

二、ChatGPT的官网地址:
https://chat.openai.com/

三、ChatGPT是如何工作的?
      在ChatGPT之前,人工智能聊天机器人就已经出现了,但由于它们不是对话式的,所以并未引起人们的普遍关注。而在2017年,谷歌在他们的论文《Attention is All You Need》中介绍了一个名为The Transformer的神经网络架构,这创造了一个训练大型语言模型(LLM)的范式转变。

      与其他神经网络相比,循环神经网络(RNN)和长短期记忆网络(LSTM)都比不上Transformer网络。RNN在长期依赖性方面存在问题,而LSTM无法专注于长句中的正确单词以获得正确的输出。

      而Transformer网络改变了语言模型的训练方式,Transformer不像RNN那样一次处理一个词,而是可以一次注入整个输入。此外,Transformer允许平行运行多个输入,减少计算成本,训练速度更快。

      意识到Transformer的潜力后,OpenAI决定利用Transformer网络,并按照其架构进行数据训练。这些模型的训练过程主要包括三个步骤:生成式预训练(Generative pre-training)、监督微调(Supervised fine-tuning)、基于人类反馈的强化学习(RLHF)。

四、如何使用ChatGPT?
      ChatGPT有一个基础版本,可以免费使用,要使用ChatGPT,你只需要访问他们的官方网站(https://chat.openai.com/chat),需科学上网,无需下载,去ChatGPT页面登录即可,你可以选择邮箱注册或用你的谷歌或微软账户登录。

      ChatGPT的网页界面对所有用户来说都很容易使用,显示界面包括一个供用户输入查询的文本框和一个显示结果的区域。输入你的文字提示后,然后你就会收到ChatGPT返回的回应信息。

点赞(0) 打赏

微信公众账号

微信扫一扫加关注

返回
顶部