例如AI人工智能围棋,可训练大量棋谱数据,对应找出最优路径,最终击败了李世石等人的人脑围棋。
Bert派该模型适合一种模糊推理,类似进行完形填空:
大模型做完形填空问题也需要庞大算力,但通过推理前后关系,大模型会将结果确定在B、C两项上。气温很低和气温很高没有指向特定的15度还是38度,穿厚点穿薄点也没有指向穿1件衣服还是2件衣服或是3、4、5件衣服,重在解释逻辑关系。
此种逻辑在文字输入形成图片过程中广泛涉及,例如要求AI画一个有角的动物,Bert派逻辑会推理为一只牛或羊,而不是一只大象和狗。
图1:三派别发展中的重要模型
可以看到,早期发展bert派较优,中期三派互有胜负。但2023年以来AI大爆发,主要是基于OPENAI公司的重磅ChatGPT大语言模型推出,仅解码器模型GPT派经历了显著繁荣。
2023年早期,仅从文字角度解释为大语言AI模型,后续添加图像、视频、音频、光感等多模态信息,联合起来进行训练称为多模态AI模型,但底层架构均隶属于Transformer架构-LLM大语言模型-GPT派。
国内量化巨头幻方梁文峰,主导的DEEPSEEK大模型横空出世,以较低的算力显卡和较少的训练时间,实现了综合能力上不输ChatGPT大模型。从社会各界的使用感受看,deepseek的逻辑思考链路能力明显比其他模型具有优势。
由于deepseek模型为纯国产且并且开源,使得无论是云端部署还是本地化部署,费用得以大幅下降,一些高校已经陆续接入实验室,互联网巨头、运营商、银行政务等行业也进行端口接入,后续AI应用可能将快速演进至大众生活,由此引出的资本市场行业性机会值得充分挖掘。
智能手机时代以来,通信网络经历了以文字-图片-视频为代表的2G-3G-4G时代,充分替代了一些简单人工智力和简单机械劳动,AI大模型基本也遵循这一规律。
以画图为例,相较于设计师和画图员,AI进步已经将绘画这一能力进行平权:每一个普通人都有了绘画能力,通过文字描述就可以AI画出一个不错的作品,例如海报、logo、漫画、表情包等。
对一些设计公司、游戏公司、漫画公司大量进行替代,相关对绘图师劳动力的裁员负担加重。