当前位置: 首页 > news >正文

东城建设网站仙女棒在线设计平台

东城建设网站,仙女棒在线设计平台,做门户网站的公司有哪些,什么叫网站建设服务ChatGPT 使用的技术概览 智心AI-3.5/4模型#xff0c;联网对话#xff0c;MJ快速绘画 从去年 OpenAI 发布 ChatGPT 以来#xff0c;AI 的能力再次惊艳了世人。在这样的一个时间节点#xff0c;重新去学习相关技术显得很有必要。 ChatGPT 的内容很多#xff0c;我计划采用…ChatGPT 使用的技术概览 智心AI-3.5/4模型联网对话MJ快速绘画 从去年 OpenAI 发布 ChatGPT 以来AI 的能力再次惊艳了世人。在这样的一个时间节点重新去学习相关技术显得很有必要。 ChatGPT 的内容很多我计划采用一个系列多篇文章来分享学习我自己学习过程中的一些理解。本系列文章我将站在一个普通开发人员的角度展开希望对想了解 ChatGPT 技术原理的普通开发者们有帮助。 ChatGPT 本身就具备很丰富的知识所以 ChatGPT 自身实际上就是一个很好的学习渠道我也将借助 ChatGPT 来学习 ChatGPT。 机器学习技术的发展 要聊 ChatGPT 用到的机器学习技术我们不得不回顾一下机器学习技术的发展。因为ChatGPT 用到的技术不是完全从零的发明它也是站在巨人的肩膀上发展起来的。 机器学习技术的分类 实际上机器学习技术可以追溯到上个世纪三四十年代一开始就与统计学分不开。早在 1936 年著名的统计学家 Fisher 发明了线性判别分析方法LDA。LDA 利用方差分析的思想试图将高维数据分开。这后来演化为一类基础的机器学习技术任务即分类问题。 在计算机出现之后大量的基于计算机的机器学习算法出现比如决策树、SVM、随机森林、朴素贝叶斯、逻辑回归等。它们也都可以用于解决分类问题。 分类问题是指我们事先知道要分为哪几类这些类通常是人为定义的。比如人分为男性和女性编程语言分为 c/c/java 等。 还有一类问题是我们无法预先知道要分为几类的比如给定一系列的新闻按照主题进行分组而我们可能无法事先人为的确定好有几个主题。此时可以利用机器学习算法自动去发现新闻中有几个类然后再把不同的新闻放到不同的分类。这种问题是聚类问题。 有时这个分类可能是连续的比如我们要用一个机器学习模型去预测某个人的身高此时可以认为结果是在某一个范围内连续变化的值。这类问题我们把它叫做回归问题。与分类的问题的区别仅仅在于我们希望输出一个连续的值。 除此之外一些典型的机器学习问题还包括降维、强化学习通过智能体与环境的交互来学习最佳行动策略等。 除了根据问题不同进行分类还可以从机器学习技术使用数据的方式进行分类。从这个角度可以将机器学习技术分为有监督学习、无监督学习、半监督学习等。有监督学习要求我们为模型准备好标签值。无监督学习则无需我们准备标签值只需数据即可开始训练。半监督学习是指需要一部分有标签值的数据。 从解决的问题上来看ChatGPT 可以认为是一个分类模型它根据输入的文本预测下一个要输出的词是什么而词的范围是确定的即模型的输出是一个确定的分类。 从 ChatGPT 使用数据的方式来看可以认为是使用了大量的无监督数据加上少量的有监督的数据。所以可以认为 ChatGPT 是一个半监督的机器学习技术。 传统的机器学习算法与基于人工神经网络的机器学习算法 上面提到的决策树、SVM、随机森林、朴素贝叶斯、逻辑回归等算法多是基于可验证的可理解的统计学知识设计的算法。它们的局限性主要在于效果比较有限即便使用海量数据也无法继续提升这要归因于这些模型都是相对简单的模型。由于这些算法都是很早就被开发出来了并且一直很稳定没有什么更新我们一般称这些算法为传统的机器学习算法。 另一类机器学习算法是基于人工神经网络的机器学习算法。这一类算法试图模拟人类的神经网络结构。其起源也很早要追溯到 1943 年W. S. McCulloch 和 W. Pitts 提出的 M-P 模型。该模型根据生物神经元的结构和工作机理构造了一个简化的数学模型如下图。 其中xi 代表神经元的第 i 个输入权值 wi 为输入 xi 对神经元不同突触强度的表征θ 代表神经元的兴奋阀值y 表示神经元的输出其值的正和负分别代表神经元的兴奋和抑制。 该模型的数学公式可以表示为 ∑*− 如果所有输入之和大于阀值 θ 则 y 值为正神经元激活否则神经元抑制。该模型作为人工神经网络研究的最简模型一直沿用至今。 虽然这个模型看起来很简单但是由于其可扩展可堆叠的特性实际上可以用于构造一个非常复杂的网络。至于如何扩展和堆叠其实就是人工神经网络数十年的发展要解决的问题。 这个模型如何优化呢这里的优化其实就是修改 wi 的值依靠一种名为反向传播的优化方式可以优化它。其计算过程相当于对 wi 求偏导数然后和学习率相乘再加回到原来的 wi 值上。 人工神经网络模型的算法思想非常简单其效果只有在网络规模达到一定程度之后才会体现出来。但是一旦网络形成规模之后对算力和数据的要求就非常高了。这也是为什么在 21 世纪之前这样的算法无法获得发展的原因。 从 2000 年开始互联网进入了爆发式发展的阶段大量的数据被累积起来并且计算机算力也经历了数十个摩尔周期得到了长足的发展。于是基于人工神经网络的机器学习算法得到爆发式的发展。 各个研究领域都纷纷开始尝试利用人工神经网络来提升机器学习模型效果。 卷积神经网络一种基于 M-P 模型的变种结构在计算机视觉领域表现突出逐渐演变为计算机视觉领域的基础结构。循环神经网络和长短期记忆网络另一种基于 M-P 模型的变种结构在自然语言处理领域表现突出逐渐演变为自然语言处理领域的基础结构。 这两类网络结构曾经风靡一时即便到现在也有很多问题是基于这两类结构的网络算法去解决的。它们在很大程度上促进了人工神经网络的机器学习算法的发展。 但是研究人员从未停止对于网络结构的探索。在 2017 年的时候Google 的研究团队提出了一个名为 Transformer 的网络结构强调了注意力机制在网络结构中的表示和应用。Transformer 模型结构简单而一致却表现出了非常好的效果。 ChatGPT 的故事可以认为从这里开始了。在 Transformer 模型结构发布之后后续有大量的研究基于 Transformer 开展起来都取得了很好的效果这里面就包括各类 GPT 模型。 最初的 Transformer 模型主要是应用在自然语言处理领域。近两年的研究发现这一结构也可以被用到计算机视觉认为上当前流行的 Vision Transformer 模型就是它在计算机视觉领域的应用成果。从这个趋势来看Transformer 有着要统一所有模型结构的势头。 ChatGPT 技术概览 有了前面的了解终于轮到 ChatGPT 出场了。 ChatGPT 用到了哪些技术呢可以简要列举如下 基础模型结构基于注意力机制的 Transformer 模型超大规模的模型堆叠GPT3 堆叠了 96 层网络参数数量高达 1750 亿超大的训练数据采用了 45TB 的原始数据进行训练超大的计算资源基于微软专门设计的包含数千块 GPU 的超级计算机完成训练大规模并行训练将模型分布到多个实例多块 GPU 上并行计算完成训练基于人类反馈数据进行调优采用了大量的基于人类反馈的数据进行优化使得对话更加自然、流畅而具有逻辑性 由于 OpenAI 并未公布太多的 ChatGPT 的训练细节所以上述有一些模糊的估计数据。 值得注意的是ChatGPT 用到的核心技术其实并非原创其核心模型结构 Transformer 来自于 Google 的研究成果。 总结 自 ChatGPT 发布以来很多人认为这是一个人类走向通用人工智能的突破也有一些人认为它其实没什么本质的改进。有很多人对自己的职业发展产生了很深的焦虑感也有很多人感觉触碰到了科幻世界中的未来还有很多人觉得又是一个可以好好捞一把的机会。 也许每个人都有必要去了解一下机器学习技术的原理这样才能形成对它的理性的认知。 参考 wikipedia 词条罗纳德・艾尔默・费希尔https://zh.wikipedia.org/zh-sg/ 羅納德・愛爾默・費雪 人工智能与神经网络发展研究https://image.hanspub.org/Html/2-1540922_23773.htm OpenAI 开发的 ChatGPT 资料Training language models to follow instructions with human feedback https://arxiv.org/pdf/2203.02155.pdf OpenAI 开放的 GPT-3 资料Language Models are Few-Shot Learners: https://arxiv.org/pdf/2005.14165.pdf OpenAI 开放的 GPT-2 资料Language Models are Unsupervised Multitask Learners: https://d4mucfpksywv.cloudfront.net/better-language-models/language-models.pdf OpenAI 开放的 GPT 资料Improving Language Understanding by Generative Pre-Training): https://s3-us-west-2.amazonaws.com/openai-assets/research-covers/language-unsupervised/language_understanding_paper.pdf
http://www.laogonggong.com/news/111448.html

相关文章:

  • 建设网站职业证书查询西安优化网站推广
  • 大连网站哪家做的好北京网站的网站建设公司
  • 网站开发服务费入什么科目宁波网站建设公司哪有
  • 那个相亲网站做的比较好大型网站建设兴田德润专业
  • wordpress搭建站点深圳那家做APP网站的最好
  • 伊春网络建站公司浅谈电子商务网站建设与管理论文
  • 网站建设方案书 本案如何推广视频号
  • 网站开发尺寸谷歌自然排名优化
  • 济南网站优化技术厂家济南中京网站建设公司
  • 大学社团网站建设个体工商户注册网站
  • 湛江市网站建设商汇通网站
  • iis 没有新建网站企业网站 .net
  • 大学网站建设技术方案局域网建设网站工具
  • 网站关键词排行查询绵阳哪个网站做外卖做的好
  • 天津北京网站建设公司哪家好上海品牌网站建设公
  • 网站属性设置网站建设 动态添加内容
  • 中国山东建设监理协会官方网站电子工程世界注册
  • 高端网站建设 骆手机seo快速排名
  • 男女做爰网站19河南工程建设网
  • 做疏通什么网站推广好网站分类目录源码
  • 中国摄影网站有哪些wordpress 回收站在哪
  • 深圳网站建设公司有哪些内容泰州专业做网站
  • 模板建站服务器百度知道合伙人
  • 恶意镜像网站程序网站建站公司订单多吗
  • WordPress网站转APP插件福州本地推广
  • 电子商务软件网站建设的核心包装公司logo设计
  • 手机微网站怎么制作网站建设公司名
  • 长沙营销型网站建设制作网站首页的快照更新慢
  • 做网站竞价还需要推广公司手机版网站如何制作软件
  • 电子商务网站体系结构有哪些网络营销的未来发展趋势