龙头三天两板!ChatGPT是如何获得理解力的?前景又如何?
从广义上看,ChatGPT是文字模态的AIGC应用,负责生成自然语言,能够和使用者进行问答式对话。
能够“理解”输入信息的含义并输出内容,这类AI模型,在一定程度上拥有和人脑同样的能力——创造力。
近期大火的AIGC(AI-generated content)和ChatGPT都属于这类模型,即生成式AI。从广义上看,ChatGPT是文字模态的AIGC应用,负责生成自然语言,能够和使用者进行问答式对话。
其他形式还包括AI写诗、AI作曲、AI绘画、AI换脸……甚至有人认为,游戏中导入图片生成模型的“捏脸系统”都是AIGC。相关热门应用也层出不穷,包括Stable Diffusion、QQ小世界AI画匠/异次元的我、盗梦师、玩句等。
其中,ChatGPT被称为AI里程碑式应用,它是明星公司Open AI在2020年推出的自然语言生成式模型——GPT 3的衍生产品。此前也不是没有这类应用,AI客服、聊天机器人、语音工作助手、小说衍生器等都属于此类。
但ChatGPT的智能化远远超出了这些“前辈”。与此前的模型相比,ChatGPT亮点主要包括:
(1)新增代码理解和生成能力,对输入的理解能力和包容度高,能在绝大部分知识领域给出专业回答。
(2)加入道德原则。即ChatGPT能够识别恶意信息,识别后拒绝给出有效回答。
(3)支持连续对话。ChatGPT具有记忆能力,提高了模型的交互体验。
上线5天,ChatGPT的用户突破100万。连特斯拉创始人马斯克也称:“许多人陷入了该死的疯狂ChatGPT循环中。”
那么,作为生成式AI的代表,ChatGPT是如何获得理解力的呢?
这一过程离不开大模型、大数据、大算力。整体技术路线上,ChatGPT在效果强大的GPT 3.5大规模语言模型(LLM,Large Language Model)基础上,引入“人工标注数据+强化学习”来不断训练语言模型,主要目的是让GPT模型学会理解人类的命令指令的含义。
简单来说,就是基于优秀的机器学习算法和强劲的算力,通过海量的数据训练,让AI学会“思考”。Open AI在2020年从微软取得GPT 3的独家授权后,一直在Azure AI超算基础设施(由V100GPU组成的高带宽集群)上训练该模型,主要使用的公共爬虫数据集有着超过万亿单词的人类语言数据集。
国盛证券进一步认为,生成算法、NLP(自然语言处理)与算力决定AIGC能否运行,而高质量的数据集决定了AIGC质量与商业模式。相关公司包括:
另外,AI需要利用大量的标注语料进行训练和学习,标注数据的数量和质量对于模型的输出结果至关重要,数据标注/ AI训练数据因此也被视作增量需求。
汉王科技的自由书写文稿识别技术即依托于海量数据训练,本周一至今,该股三天内收获两个涨停板(分别为12月5日、12月7日)。
汉王科技K线图
A股公司中,从事数据训练业务的还有海天瑞声、四维图新等。在A股公司互动易上,已有投资者向AI 训练数据提供商海天瑞声提问:ChatGPT方面应用方向?是否为人工智能+训练数据业务?
不过,海天瑞声的回复并没有提及ChatGPT,仅表示将持续关注大模型领域新趋势,并根据客户的需求变化,适时推进公司产品创新、技术创新,满足更多客户、更新领域的AI训练数据需求。
▌下一目标:大规模商业化
对于这些AI工具的创造者们来说,下一步要考虑的是大规模商业化。
从GPT进化到GPT 3的过程相当烧钱——参数量从1.17亿增加到1750亿,预训练数据量从5GB增加到45TB,其中GPT 3训练一次的费用是460万美元,总训练成本达1200万美。高额投入使得B端变现更具可行性。
如今很多C端应用均为免费版,国泰君安表示,当前AI绘画的用户付费意愿不强,60%的用户从未在AI绘画相关方面付费,在C端付费形式刺激度较低的情况下,未来B端或将成为AI绘画软件的核心客户。
并非没有愿意掏钱的消费者。ChatGPT不限于普通聊天,还可解决具体难题,比如协助写代码等,部分用户在社交媒体上表达了对ChatGPT的付费意愿,AI绘画小程序“盗梦师”从10月1号开始商业化后,已经有很多用户付费,该产品负责人表示,目前次日留存率大概40%,七日留存率接近30%。
另外,版权问题是生成式AI绕不开的一道坎,绝大多数原创作品的版权拥有者会介意AI提取自身作品的部分元素。
-
山东华鹏:中导新材将受让江苏石岛玻璃100%股权及相关债权
山东华鹏11月14日晚间公告称,此前公告披露,公司以公开挂牌方式转让其持有的江苏石岛玻璃2022-12-07 21:00 -
信创个股异动 安硕信息、齐心集团、吉大正元等触及涨停板
11月15日,信创个股个股异动,安硕信息、齐心集团、吉大正元等触及涨停板。 安硕信息(300382022-12-07 21:00 -
亿嘉和、中京电子、黄山胶囊触及涨停板 后市或有继续冲高动
11月15日,亿嘉和(603666)今日触及涨停板,该股近一年涨停4次。 异动原因揭秘: 1、公司主营业2022-12-07 21:00 -
国美通讯触及涨停板 该股近一年涨停21次
11月15日国美通讯(600898)今日触及涨停板,该股近一年涨停21次。 异动原因揭秘: 1、公司主2022-12-07 21:00 -
12月6日收盘:热门中概股涨跌不一 途牛涨19.67%
当地时间12月6日,热门中概股涨跌不一。据数据显示,截至收盘,途牛涨19.67%,小牛电动涨14.772022-12-07 21:00 -
今日新股申购一览表(2022年12月7日)
今日新股申购一览表(2022年12月7日):燕东微、春光药装可申购。 燕东微(688172) 信息一览2022-12-07 21:00 -
12月7日早盘:A股三大指数低开 石油石化、美容护理板块领跌
12月7日,A股三大指数低开。据数据显示,上证指数低开0.24%,报3204.94点;深证成指跌0.29%,报12022-12-07 21:00 -
海威华芯增资后纠纷频现 涉案资金近13亿元 海特高新部分资产
有律师表示,“本案正威金控才投资公司不久,即爆发投资方与被投资企业之间的投资纠纷,说明2022-12-07 20:30 -
黑石遭疯狂挤兑:又一颗金融大雷
黑石集团,新世纪华尔街之王,坐拥近万亿美元资产,全球最大的私募股权基金和资产管理公司。2022-12-07 19:58 -
中国奥园拟转让奥园健康29.9%股份 意向买家锁定国资背景
奥园健康生活集团有限公司第二次被摆上了货架。 12月6日,中国奥园发布了一份名为《2022-12-07 19:56
TOPS
- 一周排行榜
- 一周排行榜