差距一两年?接近国际水平?我们和专业人士聊了聊中国大模型的真实实力
文白马商评
“都快成红海了。”当我和一个创业者聊起大模型的时候,他直接甩了这句话给我。
(相关资料图)
去年11月,OpenAI发布基于GPT-3.5的ChatGPT,瞬间引爆大模型的热潮。半年多的时间,中国出现了“百模大战”的局面,BAT等头部互联网公司和人工智能公司基本都对外宣布了自己的大模型。
5月初,360掌门人周鸿祎对外称,“如果不经过两年的模仿和抄袭,上来就说自己能超越,那才叫吹牛呢。”仅仅一个月后,周鸿祎就表示,“我原来说国内大模型跟国外差距两年,我收回这句话,今天已经接近国际水平。”
有人感慨,半年就追上ChatGPT了,大模型似乎也不难。
那么,大模型的核心壁垒是什么?中国大模型到底什么水平?大模型为人类社会带来哪些风险?
为此,我们和多年从事机器学习研究、某知名985高校教授沈为(化名)聊了聊,揭开大模型的迷雾。
01 GPT路径跑通了,所以有了“百模大战”
白马商评:能不能用最通俗简单的语言解释一下大模型,大模型是什么?和以往的AI模型有什么区别?
沈为:所谓大模型就是指模型的参数量大,但学术界并没有一个清晰明确的定义界定到底多大参数叫“大”,还在快速研究发展阶段,一般来讲大模型的参数量达到1亿以上。
其实,深度学习的发展大致经历了三个阶段。第一个阶段是2012-2017年,以图像分割yolo、图像分类ResNet这种特定领域的小模型为代表,所以参数量占内存最多也就几百MB。
2017年,Transformer的问世让深度学习可以并行化计算,效率更高,意味着可以做大模型的运算,随后产生了OpenAI GPT和谷歌Bert这类自然语言大模型。这一阶段诞生的是特定任务的大模型,模型参数突破了1亿。
到了2020年前后,深度学习进入通用模型阶段,它的输入就是一句带空格的话,模型的作用就是“填空”,以前是模型适配下游应用,现在是下游应用适配模型。这一阶段的模型代表包括自然语言领域的GPT 3.5、GPT 4以及图像领域的Clip、DALLE、Stable Diffusion、Midjourney等等。这一阶段模型参数可以达到百亿、千亿级别。
白马商评:你了解到最早研究大模型是哪家企业或机构?有哪些成果?
沈为:最早是高校和科研机构做相关的研究,我了解比较早的是北京智源人工智能研究院的悟道、鹏程实验室的脑海,现在产业界的研究也很同步了。学术界的研究有一些成果,但性能没有ChatGPT那么惊艳。
白马商评:短短几个月的时间,国内出现了“百模大战”的局面,推出大模型的公司已经数不过来了,你怎么看待这种现象?
沈为:大模型肯定是趋势,也一直有人在研究。之前很多公司可能会小范围投入,做一些浅尝辄止的研究;现在突然出现了ChatGPT这样一个好产品,大家看到了明确的商业方向,于是都开始加大投入。
另一方面,很多公司面临商业竞争的压力,不做大模型可能就掉队了,所以必须上马大模型项目。
白马商评:周鸿祎最近说他收回“国内大模型跟国外差距两年”这句话,他认为今天已经接近国际水平。这才过去几个月的时间,大模型好像也不难嘛。你觉得差距有多少?
沈为:差距看跟谁对标吧,我目前没有体验过360智脑的产品,不太好评价。但是国内有些生成式AI产品,我体验以后感觉跟ChatGPT还是有差距的,国内的大模型还需要努力。
02重资本投入下,只有头部公司有机会?
白马商评:研发大模型的核心壁垒是什么?
沈为:大模型的核心壁垒包括数据、算力、算法。
从算力上看,训练ChatGPT这样的生成式AI需要至少1万张英伟达A100显卡,单张显卡的价格目前是六七万,性能更优的V100单价8万元人民币,也就是说光算力投入至少就要达到六七个亿以上,只有少数头部公司和机构能承担得起。对于商业机构而言,花几个亿买一堆显卡,还不一定能产出成果,这是必须要思考的问题。
接下来是数据和算法,算法比较好理解,比如开发框架、优化算法。数据方面,中国不缺数据,甚至互联网数据比美国还要多,但是选择哪些数据去训练、采用什么样的方式处理,这些都是核心的壁垒。
白马商评:你平时会跟企业交流吗?非营利性的研究机构和企业在研究上有什么区别?
沈为:我们会跟企业的研究部门有一些交流。跟企业交流我们会更加了解实际的业务需求,有时候我们做的学术研究会更关注技术前瞻性,对落地性要求不那么高;但企业一般更强调落地性。
白马商评:你有没有研究过国内的大模型?最看好哪家?
沈为:可能还是头部公司能跑出来吧。一是重资本的投入,只有头部公司有实力;二是几家头部公司手里的数据更丰富;三是在人工智能领域已经有了一段时间的技术积累。
白马商评:你最看好的大模型应用是什么?
沈为:从技术角度看,最先应用的应该是自然语言处理和图像领域,语音识别可能要晚一些。
大家看到比较多的用ChatGPT来写文案,这类内容创作的应用越来越多,其他我觉得像智能客服这种应用应该也会比较快。现在的一些智能客服很多时候理解不了用户的需求,解决不了实际问题,如果让用户区分不出到底是人还是机器人,体验就会改善很多;包括游戏中的NPC,以前的对话是写死的,现在渐渐可以互动了,玩家体验也会更好。
白马商评:你原来做过头部券商的首席分析师,从投资角度看,你觉得大模型有哪些机会?
沈为:资金炒作的逻辑是从应用到算法、模型,再到算力;产业的逻辑反而是相反的,算力是有明确的增长预期的,所以英伟达最近上涨很快、很多。投资者现在也明白了,谁家的大模型能跑出来、能变现还需要验证,但是增加的资本投入大部分都投到了算力。经过反复炒作,普涨行情应该已经告一段落,后面需要逻辑验证和业绩兑现。
我原来主要看传媒互联网行业,比如前段时间比较强势的游戏板块,资本的逻辑一是应用大模型提升研发效率、降低成本;二是大模型带来更好的体验,NPC角色更智能,最后用户的粘性提升、UP值提升。当然,最终可能还需要业绩验证。
03人类无法左右AI,甚至无法左右自己的命运
白马商评:我们看到包括奥特曼、马斯克都对人工智能的安全性问题提出过担忧,现在我们只知道通过大模型训练出现了智能化的结果,但训练过程像一个黑箱,其实挺可怕的。你怎么看待安全问题?
沈为:在安全方面,首先我观察到几个反常的现象。第一个是今年3月包括马斯克、苹果公司联合创始人史蒂夫沃兹尼亚克在内的1000多人签署了一份公开信,呼吁暂停训练比GPT-4更强大的AI系统。
第二个是,今年5月谷歌首席科学家、已经75岁的“AI教父”杰弗里辛顿辞职,他离开谷歌的直接原因是担忧人工智能的危险,甚至对自己一生从事的工作感到后悔。
第三个是近两年学术领域训练大模型新增了伦理讨论。
目前来看,我觉得大模型还是可控的,没有大的问题;但是技术发展太快了,出圈以来短短几个月的时间,GPT就又经历了几次迭代,发展速度太快,越来越智能,会不会产生自主意识,不再听人类的“使唤”,走向失控?这个问题是大家担心的。
白马商评:你觉得AI会不会造成大量失业?在AI面前,普通人怎么保住工作?
沈为:从宏观上看我不觉得AI会造成大量的失业,人类总会有工作的,只是说人的工作内容会发生转变。当然,从个体角度看肯定会出现结构性的失业,我们只能不断学习。
白马商评:之前很多人说机器没有感情、缺乏想象力,取代不了人类;现在既然人类大脑可以通过AI模拟出来,那人类的情欲、性欲是不是未来也可以模拟,荷尔蒙、多巴胺这些不过是一种生物学的奖励机制嘛。
沈为:机器没有感情是当前的假设,人工智能越来越接近人的思考模式,那是不是就会产生类似于人类的“感情”?只是他们和人类生活在不同的空间维度,就像《流浪地球》里图恒宇的女儿。人工智能可能会产生自己世界类似于人类的生物学意义上奖励机制。
白马商评:如果一切都可以计算、规划、设置,是不是有点无趣?
沈为:AI的行为并不是人类预测和规划的,而是他自我强化、自我训练的结果,《流浪地球》里MOSS的决策是自己做的,而不是服从人类给的指令。
白马商评:硅基文明取代碳基文明是不是确定性的方向?
沈为:这个问题超纲了。按照目前的发展趋势可能是这样的,就像《流浪地球》里真正主宰人类命运的是MOSS,而不是人类;但现实中也有可能技术会停滞在某个阶段,跨不过去,毕竟技术发展不是线性的。
标签:
-
2022-05-23 16:13:32
上海奉贤等区开展常态化防疫压力测试 有序开放公交、公园、公共服务场所、公共街区商区<
本报上海5月21日电 (记者刘士安、曹玲娟)上海正在奉贤等区开展常态化防疫压力测试。在21日召开的上海市疫情防控工作新闻发布会上,奉
-
2022-05-23 16:13:32
“抗疫 宅家云课堂”,吸引沪上老同志观看50万人次<
由上海市委老干部局主办,上海市老干部大学、市科技助老服务中心承办的“抗疫 宅家云课堂”系列直播讲座自4月12日启动以来,深受老同
-
2022-05-23 16:13:32
“代跑腿”买药、开通绿色通道 丰台为管控区居民提供便捷医疗服务<
“真是太感谢了,解决了我的燃眉之急!”家住假日万恒社区的杨女士对前来送药的居委会工作人员说。 自5月17日6时起,丰台区对青塔街...
-
2022-05-23 16:13:32
上海嘉定:儿童计划免疫接种全部恢复,实行预约制<
在5月22日召开的上海市新冠肺炎疫情防控新闻发布会上,嘉定区副区长王浩介绍,从4月28日开始,嘉定在防范区逐步有序恢复老年人疫苗接种
-
2022-05-23 16:13:32
乡村振兴看新疆 | 种下红樱桃 结出“致富果”<
央广网阿图什5月22日消息(记者 罗成 通讯员 杨林)乡村振兴靠产业,产业发展靠特色。新疆阿图什市阿扎克镇麦依村积极引导农民因地制
-
2023-07-05 22:04:20
差距一两年?接近国际水平?我们和专业人士聊了聊中国大模型的真实实力
文白马商评“都快成红海了。”当我和一个创业者聊起大模型的时候,他直
-
2023-07-05 20:52:56
全球百事通!日产同比下降28%,韩系6月总销量74.17万辆
7月5日,本田中国发布2023年6月终端汽车销量,6月本田在中国的终端汽车
-
2023-07-05 19:37:04
栖兰小筑论坛刀(栖兰小筑论坛)
来为大家解答以下的问题,兰小筑论坛刀,栖兰小筑论坛这个很多人还不知
-
2023-07-05 18:05:06
融合体育与消费,畅游徐汇城市定向户外挑战赛举行|即时焦点
这个夏天,每周都有“新花样”的2023年畅游徐汇城市定向户外挑战赛,成
-
2023-07-05 16:48:58
卫宁健康:公司实控人、董事长因涉嫌行贿罪被立案调查及实施留置
上证报中国证券网讯(记者骆民)卫宁健康公告,公司于2023年7月5日收到
-
2023-07-05 15:59:01
19岁小伙儿“斗鸡眼”视物重影 视功能训练助其眼珠成功回正 世界观天下
19岁小伙儿“斗鸡眼”视物重影视功能训练助其眼珠成功回正---检查发现
-
2023-07-05 14:46:07
桂林师专开展“赓续红色血脉 弘扬正气清风”主题活动
活动中,学校党委书记介绍桂师红色历史,向各党总支发出开展“赓续红色
-
2023-07-05 13:43:13
今日精选:新款“丰田霸道”定妆照曝光!外观神似FJ酷路泽,内饰总算开窍了
最近网上曝光了一组疑似全新一代“丰田霸道”的定妆照,这组照片与此前
-
2023-07-05 13:04:11
当前热文:2023全球数字经济大会即将开幕
由北京市人民政府联合工业和信息化部、国家网信办、商务部、中国科协共
-
2023-07-05 11:27:34
国寿寿险:让农牧民医保报销“多快省” 每日热讯
党的十八大以来,青海境内沿黄流域居民的生活发生了巨大变化。中国人寿
-
2023-07-05 10:40:12
我使馆要求:所有在乌中国公民新一轮备案登记|全球今亮点
据中国驻乌克兰使馆网站,今天,我驻乌克兰大使馆发布通知:当前,乌安
-
2023-07-05 09:31:56
智能驾驶板块开盘大涨 浙江世宝4连板|当前视点
7月5日上午,早间开盘智能驾驶板块继续大涨,浙江世宝4连板,德尔股份
-
2023-07-05 09:09:36
给母校的一封信
亲爱的母校:时光荏苒,白驹过隙,转眼已是离别的盛夏。窗外蝉鸣依旧、
-
2023-07-05 08:59:17
国产汽水出路何在?|汽水泡沫
经过湖北前首富兰世立一手操盘,二厂汽水俨然国产汽水里的“显眼包
-
2023-07-05 07:55:43
努比亚新机将搭载定制光学 7月亮相
努比亚技术有限公司总裁倪飞近日在微博上透露了一款影像新旗舰的消息。
-
2023-07-05 07:41:29
今日看点:天味食品:融资净偿还7646元,融资余额8992.86万元(07-04)
2023年7月4日天味食品融资净偿还7646元,融资余额8992 86万元
-
2023-07-05 06:38:06
公众号发布的文章也能进搜一搜了?做微信搜索流量看过来!|焦点滚动
作者:白杨SEO本文大纲:1、公众号发布是什么?与群发有什么区别?2、
-
2023-07-05 04:53:28
世界最资讯丨幼吾幼以及人之幼(幼吾幼以及人之幼)
您好,现在农农来为大家解答以上的问题。幼吾幼以及人之幼,幼吾幼以及
-
2023-07-05 02:47:23
环球看点!方晓罡_关于方晓罡简介
1、方晓罡(Derrick 罡)是中国电影家协会会员,摄影师出身的新锐导演
-
2023-07-05 00:56:58
关于各个手机的总结 说说我的那些智能手机们 环球快播报
hello,我是数字华夏网小杨来为大家解答以上问题,关于各个手机的总结
-
2023-07-04 21:38:33
“牵手门”男子仍为高管?官方回应了!处理结果近期公布
今天21:06,“中国石油北京项目管理公司”微信公众号发布《情况通报》
-
2023-07-04 20:37:35
头条焦点:守护者雕像瑞兹多少钱(守护者雕像)
来为大家解答以下的问题,护者雕像瑞兹多少钱,守护者雕像这个很多人还
-
2023-07-04 20:08:18
环球今亮点!手机苹果壁纸(手机苹果6外观)
您好,现在农农来为大家解答以上的问题。手机苹果壁纸,手机苹果6外观相
-
2023-07-04 18:07:51
每日头条!拓日新能: 2022年度分红派息实施公告
拓日新能:2022年度分红派息实施公告
-
2023-07-04 17:40:47
新筑股份:公司的子公司晟天新能源主要从事光伏发电站的投资、建设及运营 生产电力
每经AI快讯,有投资者在投资者互动平台提问:请问公司及子公司生产电力
-
2023-07-04 16:35:28
长沙教育局官网志愿填报(时间+入口)-全球速看料
2023年长沙市中考网上志愿填报已开始,考生可以在长沙市教育局进行志愿
-
2023-07-04 15:47:57
每日讯息!你知道西湖荷花都是怎么种下去的吗?很多橙友拍到荷花补种场景,网友:原来它们是种在缸里的!
赏荷,是夏天到西湖边的规定动作。不论是南来北往的游客,还是杭州本地
-
2023-07-04 15:07:29
【世界报资讯】法国骚乱进一步平缓 被捕人数继续减少
法国骚乱进一步平缓被捕人数继续减少
-
2023-07-04 14:49:32
头条焦点:雅虎有意寻求重新上市 总网络流量位居全球前五名
雅虎行政总裁JimLanzone表示,公司正计划重新上市,认为目前雅虎在财务
-
2023-07-04 13:56:46
天天微动态丨李连杰没有肌肉?李连杰肌肉照!
1、今天,我想介绍一下国际巨星李连杰。因为李连杰比较低调,所以边肖
-
差距一两年?接近国际水平?我们和专业人士聊了聊中国大模型的真实实力
2023-07-05 22:04:20 -
全球百事通!日产同比下降28%,韩系6月总销量74.17万辆
2023-07-05 20:52:56 -
栖兰小筑论坛刀(栖兰小筑论坛)
2023-07-05 19:37:04 -
融合体育与消费,畅游徐汇城市定向户外挑战赛举行|即时焦点
2023-07-05 18:05:06 -
卫宁健康:公司实控人、董事长因涉嫌行贿罪被立案调查及实施留置
2023-07-05 16:48:58 -
19岁小伙儿“斗鸡眼”视物重影 视功能训练助其眼珠成功回正 世界观天下
2023-07-05 15:59:01 -
桂林师专开展“赓续红色血脉 弘扬正气清风”主题活动
2023-07-05 14:46:07