ChatGPT行业报告(80页)

 公司新闻     |      2023-05-12 16:59

整个人工智能的产业链包括算力、w66数据、算法乃至下游应用。 算力与网络:英伟达的研究表示,GPT-3 模型需要使用 512 颗 V100 显卡训练 7 个 月时间,或者使用 1024 颗 A100 芯片训练长达一个月的时间。随着各大科技厂商投入对 大模型的研发,势必增加芯片、服务器等算力需求。同时,庞大的 AI 算力集群,又需要 高带宽支撑数据传输。 数据:数据采集、数据标注和数据质检是较为重要的三个环节。从自然数据源简单 收集取得的原料数据并不能直接用于有效监督的深度学习算法训练,经过专业化采集、 加工形成的训练数据集才能供深度学习算法等训练使用,由此带来数据服务需求。 算法:相比传统 AI 模型,大模型的优势体现在:1)解决 AI 过于碎片化和多样化 的问题;2) 具备自监督学习功能,降低训练研发成本;3)摆脱结构变革桎梏,打开 模型精度上限。对于大模型算法的研发、优化,亦是投入的重点。 下游应用:产业界一直以来都在寻求人工智能的应用领域、商业模式突破。随着大 模型使用、人工智能算法精度提升,下游应用的扩展可期。数字经济快速发展,数据要素成为重要战略资源。《“十四五”数字经济发展规划》 中指出,数字经济是继农业经济、工业经济之后的主要经济形态。

《规划》设定了到 2025 年实现数字经济核心产业增加值占 GDP 比重达到 10%的目标,涵盖数据要素市场、产 业数字化、数字产业化、数字化公共服务、数字经济治理体系五个方面。从 2015 年至 今,数字经济平均增速持续高于 GDP 增速,2021 年数字经济占 GDP 比重已经由 2015 年的 27%提升至 40%。联网设备高增之下,流量增长不可避免。根据思科的《年度互联网报告》,到 2023 年,地球上的连网设备数量将是全球人口的大约三倍,从 2017 年的人均 2.4 台提升至 3.6 台。由于 IP 地址即网络地址+主机地址,网络站点所连接的 IP 数量也处于爆发的阶 段。根据 IDC 的《中国物联网连接规模预测,2020-2025》,仅我国物联网 IP 连接量已 在 2020 年达 45.3 亿,有望在 2025 年达到 102.7 亿,CAGR 为 17.8%。由于 IP 地址 联网后即产生数据流量, IP 地址的数量增长即代表全网数据也将继续大增,对于现有 的网络企业的承载能力提出了考验。根据思科的《年度互联网报告》,2022 年全球网络 数据流量将达 799EB(1EB=十亿 GB),同比增长 21%。我们认为,数据流量的增长, 有望直接带动大数据产业的发展,而其中稳定优质响应快的数据库性价比更高。

ChatGPT行业报告(80页)