新技术前沿-2024-国内主流AI大模型架构及应用场景深度分析

2024-07-02 1149阅读

参考国内主流AI 大模型架构及应用场景深度分析 2024

1 厂商总览

新技术前沿-2024-国内主流AI大模型架构及应用场景深度分析

1.1 国外

(1)Open AI:GPT-4【美国旧金山的人工智能研究公司】
GPT-4于2023年3月14日发布,是千亿级参数的多模态预训练模型,能够支持图像和文本的输入。
(2)Anthropic(人类的):Claude【美国人工智能初创公司】
Claude于2023年3月14日发布,是Anthropic开发的类似ChatGPT的聊天机器人,使用的是constitutional(宪法的)AI的偏好模型。
(3)Google:PaLM-E【美国的跨国科技企业】
PaLM-E于2023年3月10日发布,是一种多模态视觉语言模型(VLM),具有5620亿个参数,集成了可控制机器人的视觉和语言能力。
(4)Naver:HyperCLOVA【韩国最大门户网站】
与三星电子合作,于2021年5月发布,超过2000亿个参数的超大规模模型;97%使用的是韩文语料,计划23H1基于大模型推出Search GPT。
(5)Kakao:KoGPT【韩国互联网巨头】
于2021年发布,专注于开发基于AI的图像创建技术和医疗保健技术。
(6)LG:Exaone【韩国第四大财团LG集团】
于2022年12月发布,拥有3000亿参数,使用图像和文本数据的多模态模型,是目前韩国参数规模最大的模型,用于生物医药和智能制造行业。
(7)Meta:SAM、LLaMA【美国加利福尼亚州原名Facebook】
视觉模型SAM:于2023年4月发布,通过精细标注,识别分割画面上的指定物体。
大语言模型LLaMA:于2023年2月发布,包括4种参数规模。

1.2 国内

新技术前沿-2024-国内主流AI大模型架构及应用场景深度分析

2 评价门槛

本次评估模型设立“中国市场落地”“全栈能力”“商业基础”、“产品市场”、四项基线,同时满足这四项基线要求的大模型厂商,将入围竞争力评估。
新技术前沿-2024-国内主流AI大模型架构及应用场景深度分析

(1)中国市场落地:截止目前,海外大模型厂商尚未在中国落地,其产品服务和生态圈打造等关键能力在中国市场均有缺失,而非官方渠道使用相关服务的企业将面临高风险。例如,OpenAI尚未向中国用户开放ChatGPT及GPT-4服务,类似的情况同样出现在谷歌、Meta等大模型厂商提供的相应服务上。相较而言,接入国产及自主研发的大模型更加现实、稳定且具有可控性。

(2)全栈能力:大模型服务考核厂商从算力基础设施、深度学习框架到算法设计优化的全栈大模型解决方案能力,以及相应的工程化和运营经验与水平。因此,入围的厂商应具备相关全栈能力,如应有自建且自运营的算力基础设施、领先的算法设计等能力。

(3)商业基础:大模型厂商在技术层保持投入的同时,还应拥有大模型商业输出能力的积累,将

VPS购买请点击我

免责声明:我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理! 图片声明:本站部分配图来自人工智能系统AI生成,觅知网授权图片,PxHere摄影无版权图库和百度,360,搜狗等多加搜索引擎自动关键词搜索配图,如有侵权的图片,请第一时间联系我们,邮箱:ciyunidc@ciyunshuju.com。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!

目录[+]