2022年12月《数据二十条》构建我国数据要素顶层设计以来,数据要素主线政策及驱动力加速落地。此外,AI产业发展将为数据要素市场提供明确的供需场景,大模型需要大算法、大算力、大数据,已有数据交易所明确表示要做AI的“数据养料”。民生证券认为,因为开源基础以及大公司本身的算力储备与资金实力,单纯发布一个大模型门槛没有市场想象那么高,但是能够拥有高质量数据场景助力持续迭代,使得逐步性能逼近ChatGPT的大模型仍是“凤毛麟角”,最终仍然会收敛在少数几个巨头之中。数据成为大模型差异化竞争的关键。

数据角度,据不完全统计,在已公开发布的信息中,财联社星矿数据梳理出这些公司拥有的数据资源以及数量情况。详情见下表: