今日讯!在如今的百模大战中 笑到最后的可能并非大厂
2023年显然是无可争议的AI大年,如果对ChatGPT、OpenAI、生成式AI、LLM(大语言模型)等概念一头雾水,那你可能就OUT了。甚至自1956年达特茅斯会议上人工智能(AI)这一概念诞生以来,AI从未距离大众如此之近。所以自然而然的,围绕AI的一切也引发了大量的关注,特别是对于站在浪潮之巅的巨头们关于AI的只言片语,也总能引发诸多的热议。
(相关资料图)
被称为“AI教父”的杰弗里·辛顿继不久前从谷歌离职后,随即就加入了“AI批评者”的行列,并大谈AI未来可能会带来的风险,甚至还表示,“我对毕生所研究的东西感到后悔”。
就在他态度180°大转弯激起、由“不明真相吃瓜群众”对AI危险性的讨论尚未落幕之时,一个据称是谷歌高级软件工程师Luke Sernau所写的内部信又激起波澜。而这份被泄露的文件中其实只有一个核心主旨,那就是谷歌、OpenAI都没有护城河,开源AI将会摘取这个赛道最后的胜利果实。
在这一场生成式AI的“大战”中,谷歌显然只是不折不扣的追赶者。虽然作为阿尔法狗的创造者,多年来谷歌一直扮演着“AI布道者”的角色,但在生成式AI领域,ChatGPT无疑才是领路人。紧随其后的Google Bard公开演示翻车、导致谷歌市值一度蒸发千亿美元后,好不容易推出将生成式AI整合到工作场景的Workspace后,微软融合了GPT-4的Microsoft 365 Copilot又很快把风头抢走了。
所以在外界看来,如今焦虑一词或许才是谷歌在面对生成式AI、LLM时,最为真实的写照。
与此同时,领导谷歌前进的CEO皮查伊持有保守倾向、并且也受到了不少的掣肘,以至于谷歌的AI路线图目前并不清晰。在这样的情况下,公司内部的“有识之士”当然也就会心急如焚。
那么问题就来了,作为在生成式AI赛道落后的谷歌有危机感、内部传出悲观论调再正常不过,但为什么会扯上OpenAI呢,或者说为什么开源AI才是最终的胜利者?
鲜花着锦烈火烹油,无疑是当下OpenAI的境况。别看这家公司现在几乎是最炙手可热的投资标的,但据相关海外科技媒体在近期曝光的新一轮融资文件显示,OpenAI的估值来到了290亿美元。可要知道的是,目前在A股,仅仅寒武纪和昆仑万维这两家AI概念的市值,就已经接近这个数字。换而言之,一手点燃了生成式AI这把火的OpenAI,其实并没有被投资者给出一个惊人的估值。
在许多业内人士看来,OpenAI目前的问题在于缺乏一个清晰的商业模式,他们现阶段唯二可以确定的收入,是一个月20美元的ChatGPT Plus订阅服务,以及1k tokens/0.002美元的ChatGPT API,但这两者显然还不足以让OpenAI盈利。甚至有观点认为,OpenAI现在像极了世纪之交的QQ,尽管同样都是站在相关领域的最前沿,但也同样缺乏一个明朗的商业化前景。但后来QQ等来了QQ秀,目前OpenAI却暂时还看不到解决商业化难题的契机。
事实上,让谷歌公司的内部人士对谷歌、OpenAI悲观的核心,是生成式AI、或者说LLM本身其实并没有太深的护城河。没错,别看ChatGPT、文心一言这类产品表现得如此智能,但实际上打造一个生成式AI并没有大家想象的那么难。
LLM的理论其实非常简单,即通过分析大量文本数据进行训练,从而学习语言的结构和模式,其所使用的架构也是是长短时记忆网络(Long Short-Term Memory,LSTM)或门控循环单元(Gated Recurrent Unit,GRU)等传统的循环神经网络结构。
LLM更像是“力大砖飞”的结果,然而在ChatGPT一鸣惊人前,业界更青睐的其实是谷歌的Transformer模型。而后者追求的却是如何设计出更小、更快,但更准确的神经网络,甚至于彼时OpenAI的GPT-3是被业界作为负面典型进行评价的。当时就有业内人士表示,“GPT-3在小样本学习中表现出卓越的能力,但它需要使用数千个GPU进行数周的训练,因此很难重新训练或改进。”
ChatGPT的成功就成功在它提出了一个新的思路,毕竟加大参数、加高算力的大模型也是一个方向,并且真的让大模型涌现出了智能。但显而易见的是,这一模式并没有护城河。君不见,即使OpenAI对自己基于人类反馈的强化学习(RLHF)技术秘而不宣,也阻拦不了百度文心一言、阿里通义千问、谷歌Bard等等一众同类大模型的出现。
此前李彦宏就曾在百度的内部讲话中提到,“算力不能保证我们能够在通用人工智能技术上领先,因为算力是可以买来的,但创新的能力是买不来的,是需要自建的”,也就是说算力和参数都可以买、技术壁垒不高。所以也难怪短时间内国内市场的“百模大战”就已开打,因此先发优势在这里几乎不值一提。
当然,如果没有Meta的LLaMA模型“意外”在4chan上泄露,LLM的技术壁垒不高也只是相对大厂而言。但LLaMA模型的被迫开源,也让开源社区主导了最近一段时间针对ChatGPT的“平替”热潮。
比如说来自斯坦福的Alpaca,借助Llama的预训练模型为基础,仅使用来自GPT模型的一个小尺寸调优数据集(52000个样本),就建立了一个具有对话功能的LLM。而基于LLaMA模型,以及LoRA (Low-Rank Adaptation of LLM,即插件式的微调)训练,开源社区在不到两个月的时间里已接连发布了ChatLLaMa、Alpaca、Vicuna、Koala等模型,并且“羊驼家族”们的实际效果还直追GPT-3.5、甚至不输GPT-4。
借助社区的力量群策群力,并最终实现极低成本下的高速迭代,这无疑就是开源AI的优势。就像谷歌这位员工所说的那样,“如果存在一个没有使用限制的免费高质量替代品,谁还会为带有使用限制的谷歌产品买单呢?”
因此从某种意义上来说,谷歌在Android上的做法可能才是最佳范例,也就是让开源社区不自觉地为自己的商业利益服务。
所以不得不说,LLaMA模型泄露更像是一个神来之笔,一下子就让原本掉队的Meta实现了超谷歌、赶OpenAI,毕竟“羊驼家族”就是在Meta的架构之上诞生的产物。
关键词:
相关阅读
-
05-09
-
05-09
推荐阅读
-
银鹏控股公司:业务交流促提升互学互鉴共进步|世
3月2日,银鹏控股公司董事长刘懿婷带队前往中粮集团期货公司进行业务学习和交流。中粮期货公司从业多年、具有丰富实战经验的风险管理专家现场更多
2023-03-07 17:52:41
-
我国首个万吨级钠离子电池材料项目在山西综改区开
山西晚报讯(记者温丽芳通讯员张晓茹)日前,总投资约11亿元的山西华钠铜能(碳能)科技有限责任公司万吨级钠离子电池正(负)极材料项目在山更多
2023-03-07 11:51:14
-
建行阳江市分行:践行金融惠民理念-全球关注
2月24日,随着客户办妥抵押登记手续并成功放款,标志着阳江市建行“带押过户”业务取得历史性突破。根据中国人民银行发布《关于鼓励推广二手房更多
2023-03-07 11:53:21
-
焦点简讯:证监会同意三超新材向特定对象发行股票
中证网讯(记者昝秀丽)证监会网站3月6日消息,证监会发布关于同意南京三超新材料股份有限公司向特定对象发行股票注册的批复。【来源:中国证更多
2023-03-07 09:57:39
-
美股航空股6日全线走低
中证网讯(记者赵中昊)当地时间周一(3月6日),美股航空股全线走低。据wind数据,截至收盘,波音跌1 49%,美国航空跌1 47%,达美航空跌1%,更多
2023-03-07 09:43:44
-
世界热资讯!晋钢控股集团荣登2022山西省品牌十强
近日,“品牌强国(龙城)论坛”在太原举行,发布“2022中国上市公司品牌500强”以及“2022山西省品牌100强”。晋钢控股集团以218 9亿元的品牌更多
2023-03-06 17:38:52
-
手绘报告:2023预期目标
【来源:中国政府网】声明:转载此文是出于传递更多信息之目的,若有来源标注错误或侵犯了您的合法权益,请作者持权属证明发至邮箱newmedia@xx更多
2023-03-06 16:46:31
-
惠州首笔数字人民币缴纳税费业务成功落地
3月1日,TCL科技集团财务有限公司拿到了全市第一张使用数字人民币账户缴纳税款和非税收入的完税凭证,标志着惠州市首笔数字人民币缴纳税费业务更多
2023-03-06 11:50:50
-
理财