来自:谭天论道
元宇宙热度稍减,ChatGPT就出来搞事,它是新一轮AI革命还是科技泡沫?本文从ChatGPT的诞生、原理、作用及在中国发展四个方面进行梳理,试图回答这一问题。
一、ChatGPT诞生记
2022年11月30日,人工智能对话聊天机器人ChatGPT上线,迅速在社交媒体上走红,短短5天,注册用户数就超过100万,而在两个月后,这一数据已经突破1亿。用“一夜蹿红”来形容ChatGPT并不为过。微软联合创始人比尔•盖茨甚至表示,这项技术诞生的意义不亚于互联网或个人电脑的诞生。因此,不少人把ChatGPT称为AI革命。
那么,ChatGPT到底是一个什么东西呢?ChatGPT是由人工智能实验室OpenAI研发的通用聊天机器人,ChatGPT的网页应用允许用户免费使用,不限量向公众开放。能回答连续性的问题、承认自己的错误、质疑不正确的假设,甚至拒绝不合理的需求。用户与ChatGPT之间的对话互动包括了普通聊天、信息咨询、撰写诗词作文、修改代码等。有消息称微软将在未来几周内把最新GPT-4版本的ChatGPT整合进必应搜索,直接对谷歌搜索地位发起挑战。
根据Similarweb的数据,今年1月,平均每天约有1300万独立访客使用 ChatGPT,是去年12月份的两倍多,累计用户超1亿,创下了互联网最快破亿应用的纪录,超过了之前TikTok 9个月破亿的速度。美国宾夕法尼亚大学发现,ChatGPT能够通过该校工商管理硕士MBA课程的期末考试。据传,ChatGPT还成功通过了谷歌的编程面试,拿到了年薪18.3万美元的L3工程师offer。
过去几十年里,搜索引擎成功打造出了一套共生系统,网站生产内容,搜索分配流量,大家再一起吃广告预算,就像牙签鸟和鳄鱼的关系,绝对的公平谈不上,但共同利益是稳固的。App时代的互联网画地为牢,对搜索引擎有着釜底抽薪的影响,信息被圈在一座座孤岛里,不再对搜索爬虫予取予求,做站的ROI也远远比不上做号。
Google内部曾有一个饱经挫折的部门「AI道德委员会」,最新的动态停留在2019年,内容为宣布解散。Google提供了充分的理由解释为何要如此藏着掖着——担心遭到恶意滥用⋯⋯避免社会刻板印象⋯⋯以及压迫性观点⋯⋯语言理解有局限性——简而言之,怕出事儿。就在Google反复进行内心斗争的时候,OpenAI把它该揽的活儿全给包了。更重要的是,ChatGPT这种服务能力,是足以重新定义搜索引擎的。ChatGPT再只限于检索信息,而且还能计算信息。
《财富》的报道首次披露了ChatGPT的诞生故事、背后操盘手,以及交易细节,并讨论了它对科技、商业和人类生活的影响。
ChatGPT作为科技产品 :《财富》认为,ChatGPT在AI领域的地位就如同当年的Natscape和iPhone。
ChatGPT作为创业公司 :发布仅仅五天,ChatGPT的用户就超过了100万人。当年的Facebook用了10个月才达到这个里程碑。
与微软的交易:微软的优先任务可能对OpenAI自己的优先任务产生排挤效应,使OpenAI更宏大的使命面临风险,公司最重要的资产——科学家——的归属感也会受到不小的打击。
关于OpenAI的争议 :OpenAI脱离非盈利状态之后,产生了不少争议。安全性是OpenAI被批评的一个焦点。还有不少批评者和教育工作者说,学生很容易使用ChatGPT作弊。
OpenAI的竞争对手:谷歌拥有一款强大的聊天机器人LaMDA,但由于担心一旦该产品被滥用可能影响公司信誉,因此一直未对外发布。现在,谷歌计划以ChatGPT为标杆“重新评估”其风险承受能力。
二、ChatGPT的原理
ChatGPT能达到如今"上知天文、下知地理"的效果,离不开基于海量数据而生的大模型——是大模型。海量数据是大模型的基础。顾名思义,大模型是一种通过亿级的语料或者图像进行知识抽取、学习,进而产生的亿级参数模型。而ChatGPT,是OpenAI GPT-3模型的升级。在参数量上,GPT-3模型拥有1750亿参数。这带来超乎想象的突破——基于大量文本数据(包括网页、书籍、新闻等等),ChatGPT获得了对不同类型的话题进行回答的能力。再加上学习方法的差异性,ChatGPT能够发散式地解答问题。
作为人工智能最重要的组成部分之一,机器学习的落地长期依赖数据模型。它需要大量的数据来训练模型,以便让计算机系统得以从数据中进行学习。简言之,当数据量越大,机器学习得以学习的基础越多,让效果更精准、更智能的可能性就越高。但是,仅有数据还不够,伴随着数据使用而来的,还有递增的成本——机器学习环节中使用的数据量越大,所需的数据标注、数据清洗、人工调参等成本也就越高。为了解决这个问题,机器学习的落地方式也发生变化。可以说,大模型的落地是机器学习的一个里程碑,也是打开ChatGPT魔盒的关键钥匙。
回顾ChatGPT的迭代,可以看到一部大模型自我升级的历史。在这个过程里,OpenAI至少进行了三次技术路线的"自我革命"。OpenAI在2022年发布的这两个模型,从技术路线上又开始看重人工标注数据和强化学习——也就是从人类反馈(RLHF) 中强化学习。ChatGPT的性能卓越的主要原因可以概括为三点:
★使用的机器学习模型表达能力强。
★训练所使用的数据量巨大。
★训练方法的先进性。
ChatGPT 模型上基本上和之前 GPT-3 都没有太大变化,主要变化的是训练策略变了,用上了强化学习。强化学习非常像生物进化,模型在给定的环境中,不断地根据环境的惩罚和奖励(reward),拟合到一个最适应环境的状态。ChatGPT 是 OpenAI 发布的最新语言模型,比其前身 GPT-3 有显著提升。OpenAI 使用监督学习和强化学习的组合来调优 ChatGPT,其中的强化学习组件使 ChatGPT 独一无二。OpenAI 使用了「人类反馈强化学习」(RLHF)的训练方法,该方法在训练中使用人类反馈,以最小化无益、失真或偏见的输出。
“从目前普遍的对话感受来看,ChatGPT的最大亮点就在于其优秀的意图识别与语言理解能力,这令人意识到人工智能的交互能力已经实现了跨越式进展。”易观智慧院高级分析师陈晨评价。“ChatGPT在底层数据、核心技术、用户体验等各方面都可以说是里程碑式的人工智能产品。”旷视研究院基础科研负责人张祥雨表示,ChatGPT的核心技术是人工智能语言大模型,其关键是如何让人工智能模型具备逻辑推理能力,以及如何让人工智能学习全互联网的知识。
ChatGPT像一条鲇鱼,搅浑了池水,它超乎寻常的快,迫使巨头和创业公司今后必须拿出看家本领,加速创新。ChatGPT或许是未来十年科技领域最大变革的起点,当然,同时代的元宇宙和Web3也很酷,但是没有AI加速,他们可能要五年、十年后才能落地。而OpenAI对 ChatGPT所采用的名为“从人类反馈中强化学习”(Reinforcement Learning from Human Feedback,RLHF)全新训练方法,其实GPT的训练过程相当漫长,但最终诠释了“慢既是快”。
三、ChatGPT带来什么?
当代人打工不息,为手中的饭碗焦虑不止。前几天还在抱怨自己的职场保质期追不上退休年龄延后的速度,如今又开始忧虑于会被AI取代。预言警示一个比一个吓人:
“机器人即将取代这10个工种,快看看你的行业在不在其中”
“未来底层岗位将消失,几百亿人流离失所!”
如果你这两天经常在逛社交平台,大概率会觉得ChatGPT的出现已经成为了人类的末日。这个去年11月诞生的聊天机器人,现在俨然成了AI消灭人类暴政的急先锋。
其实,你想多了。如果把ChatGPT理解成一个具象的机器人,那么这次它的进步其实并不在于“突然变聪明”,而是学会了一种能跟人类直接沟通的语言。但是由于它并不真正理解自己说的内容,呈现的其实是种“表面智慧”。我们还是要说:别煽动焦虑了,ChatGPT还抢不动打工人的饭碗。
但是,正如钱颖一教授所说:人工智能将使中国教育优势荡然无存。强智能的ChatGPT,如今又提供了一面镜子,如果我们把教育优势建立在死记硬背和“超限刷题”上,如果我们到了大学和考研仍把“背诵知识点”当成学习方法,如果我们把“善于记忆”当成最强大脑的话,那么,ChatGPT足以让人恐惧。ChatGPT的学习能力非常强大,但再强,并没有摆脱人工智能“大数据、小任务”的大样本被动学习模式,也就是,当你向ChatGPT输入一个问题(写一个宣传某新产品的文案),这是一个“小任务”,它完成这个任务是凭借巨大的数据库而生成的。
ChatGPT并没有任何主动的思考,没有反思和判断,只是根据事先输入的程序规则在数据库飞速运转下完成这种“任务”。这有什么好怕的?它会因为窗外突然飞舞的雪花而爆发灵感,从而写出某段让人兴奋的佳句吗?不会。库克说:我不担心机器会像人一样思考,而更担忧人会像机器一样思考。ChatGPT写出的文案,不是机器的人化,反照出的恰恰是“人的机器化”!ChatGPT的强大智能对人是一种反向测试,如果你缺乏智识和智慧的追求,心智停留于智能崇拜,心理上只会被那种比自己强大无数倍的智能所支配和碾压。
诚然,ChatGPT也会带来一系列伦理问题,伪造和造假将出现,我们老师要学会识别出学生用ChatGPT写的作业;学术期刊也要学会甄别用ChatGPT写的论文。目前已有多个顶级期刊声明:禁止发表ChatGPT生成的论文!
实际上,ChatGPT 的真正价值,并不在于能够写出什么样的内容 —— 毋宁说这只是它的一个副产品而已。它真正的价值,在于改变了我们跟信息交互的方式。它的真正意义所在:它解决的是「信息太多」和「注意力太少」之间的矛盾。未来的解决方式或许会以「外脑」+「内脑」的方式加以实现。过度依赖 AI 告诉我们答案是危险的,我们应当把它作为拓展信息触及的渠道,辅助我们做出判断,而不是依赖它帮我们思考和决策。
四、ChatGPT中国版
据最新消息,中国版ChatGPT将于下个月与公众见面。在我国,ChatGPT概念股持续火爆,国内包括搜索、游戏以及投资等多个领域公司均对这一技术保持了高度关注。但相对于微软、谷歌给出具体技术落地方向的动作,国内相关上市公司仅发布了相关人工智能技术积累,具体商业化落地案例并不是很多。有业内人士指出,ChatGPT相关产业技术壁垒较高,如公司核心技术难以突破,进程将低于预期。此外,高昂的算力成本或也将拖累商业化进程。
方正证券研究所认为,目前,国际前沿AI技术发展迅速,AI的商业化图景也越来越清晰。我国在自然语言理解及相关AI技术领域处于全球领先水平,国内AI大厂都在加大AIGC领域的投入,人工智能技术提供商特别是NLP(Neuro Linguistic Program,神经语言程序学)头部厂商将率先受益,其中既包括独立技术提供商,也包括互联网厂商。开源证券研究所认为,高度拟人化的对话问答模式具有更好的交互体验,将进一步加强NLP技术的应用,如人机交互、智能客服、机器翻译、智能写作等。国内方面,政策环境持续优化,虚拟人、人机交互等场景需求旺盛,有望推动AI 技术在金融、政府、医疗等领域加速落地。
总的来说,ChatGPT是AIGC(AI- Generated Content,人工智能生成内容)技术进展的里程碑。该模型使得利用人工智能进行内容创作的技术成熟度大幅提升,有望成为新的全行业生产力工具,提升内容生产效率与丰富度。目前,一些上市公司已表态在该领域加大发展力度,也有部分上市公司获得了专业机构投资者的关注。不过,财通证券研究所也指出,ChatGPT 目前使用有局限性,模型仍有优化空间。此外,ChatGPT盈利模式尚处于探索阶段,后续商业化落地进展有待观察。
由于“无所不知”和高度智能化让ChatGPT在推出后受到用户追捧。作为AI行业的分支,当下正火热的ChatGPT与AIGC能否给国内AI行业企业带来弯道超车的机会?宜远智能吴志力博士对第一财经记者表示,中国在AI领域个别细分领域有全球优势,但整体而言还是扮演跟随者角色。既然AIGC与ChatGPT成为全球技术创新突破口,在中国也会成为下一波AI发展热潮掀开序幕的角色。
除了感叹于ChatGPT的惊艳体验外,国内业界也在迅速反思和行动:我们的差距在哪里?我们将如何正视和改进不足?哪些是中国从业者的机会?从事数字人研发的特看科技CEO乐乘认为,目前全球还没有能跟ChatGPT抗衡的大模型,业界共识是差距在两年以上。国内先不谈弯道超车,趁早追赶反而是更重要的。至少目前还没看到一家比较好的公司,把数据和模型的飞轮完整转起来。所以,我觉得这是我们赶超ChatGPT的难点。”一位业内人士坦言。
几乎所有受访人士都提到了OpenAI这家人工智能组织,所体现的纯粹创新精神和长期主义。但大多数中国业内人士认为,目前ChatGPT还是一个对AI技术范式的探索,它并不能代替搜索。“短期内可能大家会高估这个东西,但长期可能有很多人会低估这个东西。”这名游戏AI资深开发评价。但愿我国业界不要陷于这一矛盾中停滞不前。
参考文章:
ChatGPT掀起硅谷新一轮“AI革命” 中国科技公司跟还是不跟?
最快月活过亿,但ChatGPT或终将被开源打败|焦点分析
ChatGPT横空出世,有很多你不知道的细节
ChatGPT的强大智能是对人的反向测试
多只概念股涨停!全球爆火的ChatGPT到底是啥
补充一点关于 ChatGPT 的思考
我们仍未知道那天所见的ChatGPT有多可怕
作者:广州华商学院特聘教授、未来媒体研究院院长
转自:“新传学苑”微信公众号
如有侵权,请联系本站删除!