新技术前沿-2024-国内主流AI大模型架构及应用场景深度分析

2024-07-02 1149阅读

参考国内主流AI 大模型架构及应用场景深度分析 2024

1 厂商总览

1.1 国外

(1)Open AI：GPT-4【美国旧金山的人工智能研究公司】
GPT-4于2023年3月14日发布，是千亿级参数的多模态预训练模型，能够支持图像和文本的输入。
(2)Anthropic(人类的)：Claude【美国人工智能初创公司】
Claude于2023年3月14日发布，是Anthropic开发的类似ChatGPT的聊天机器人，使用的是constitutional(宪法的)AI的偏好模型。
(3)Google：PaLM-E【美国的跨国科技企业】
PaLM-E于2023年3月10日发布，是一种多模态视觉语言模型(VLM)，具有5620亿个参数，集成了可控制机器人的视觉和语言能力。
(4)Naver：HyperCLOVA【韩国最大门户网站】
与三星电子合作，于2021年5月发布，超过2000亿个参数的超大规模模型；97%使用的是韩文语料，计划23H1基于大模型推出Search GPT。
(5)Kakao：KoGPT【韩国互联网巨头】
于2021年发布，专注于开发基于AI的图像创建技术和医疗保健技术。
(6)LG：Exaone【韩国第四大财团LG集团】
于2022年12月发布，拥有3000亿参数，使用图像和文本数据的多模态模型，是目前韩国参数规模最大的模型，用于生物医药和智能制造行业。
(7)Meta：SAM、LLaMA【美国加利福尼亚州原名Facebook】
视觉模型SAM：于2023年4月发布，通过精细标注，识别分割画面上的指定物体。
大语言模型LLaMA：于2023年2月发布，包括4种参数规模。

1.2 国内

2 评价门槛

本次评估模型设立“中国市场落地”“全栈能力”“商业基础”、“产品市场”、四项基线，同时满足这四项基线要求的大模型厂商，将入围竞争力评估。

(1)中国市场落地：截止目前，海外大模型厂商尚未在中国落地，其产品服务和生态圈打造等关键能力在中国市场均有缺失，而非官方渠道使用相关服务的企业将面临高风险。例如，OpenAI尚未向中国用户开放ChatGPT及GPT-4服务，类似的情况同样出现在谷歌、Meta等大模型厂商提供的相应服务上。相较而言，接入国产及自主研发的大模型更加现实、稳定且具有可控性。

(2)全栈能力：大模型服务考核厂商从算力基础设施、深度学习框架到算法设计优化的全栈大模型解决方案能力，以及相应的工程化和运营经验与水平。因此，入围的厂商应具备相关全栈能力，如应有自建且自运营的算力基础设施、领先的算法设计等能力。

(3)商业基础：大模型厂商在技术层保持投入的同时，还应拥有大模型商业输出能力的积累，将

VPS购买请点击我

免责声明：我们致力于保护作者版权，注重分享，被刊用文章因无法核实真实出处，未能及时与作者取得联系，或有版权异议的，请联系管理员，我们会立即处理! 部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理! 图片声明：本站部分配图来自人工智能系统AI生成,觅知网授权图片,PxHere摄影无版权图库和百度，360，搜狗等多加搜索引擎自动关键词搜索配图，如有侵权的图片，请第一时间联系我们，邮箱：ciyunidc@ciyunshuju.com。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!

新技术前沿-2024-国内主流AI大模型架构及应用场景深度分析

1 厂商总览

1.1 国外

1.2 国内

2 评价门槛

相关阅读

怎么把织梦的模板替换?

dedecms怎么调用特定的栏目文档?

怎么抓包一个网页?

wap怎么封装app?

目录[+]