在美国阻止中国获得先进芯片后,中国企业在开发大语言模型方面开始遭遇诸多困难。因为训练它们需要大量参数。例如,众所周知,OpenAI GPT-4的模型接受了1万亿个参数的训练。而中国公司DeepSeek被迫将其DeepSeek-V2模型的训练限制为210亿个参数。
严格个人数据保护领域的立法也是一定的限制因素。中国在2021年通过的《个人信息保护法》在文本和精神两方面与欧洲 的《通用数据保护条例》(GDPR) 大同小异。个人和法人的数据均受到法律保护。正因为如此,中国人工智能公司在获取可训练大语言模型的数据方面遇到许多限制。
有鉴于此,中国企业不再追求数量,而是集中精力创建基于少量数据的人工智能服务。这些产品也许不再那么通用,但制造它们并使其商业化更容易、更便宜。因为产品是针对特定需求而创建的,所以给它找到用武之地要容易得多。当然,中国在基础研究和所谓强人工智能发展领域仍会落后于美国。但问题是,这对于现阶段的中国人工智能生态来说是否必需?
根据世界知识产权组织的数据,2014年至2023年中国获得了超过3.8万项与生成人工智能相关的发明和技术专利。而同期美国在该领域的专利数量仅为 6276 件。而且大量的中国专利很可能转化为更多的商业产品。例如,有必要密切关注电动汽车行业的发展。中国用了26年才生产出首批1000万辆电动汽车,接着仅用了17个月却生产出了同样数量的汽车。实际上,今年中国销售的所有汽车中几乎有一半是带轮子的平板电脑。例如,百度已经在积极开发自动驾驶技术。该公司最近在武汉推出了约500辆自动驾驶出租车。世界其他地方从未进行过如此规模的人工智能实验。中国可能造不出超级人工智能,但它有望成为世界上第一个普及成熟的人工智能技术的国家。这种技术如此之好,以致完全可以进入全人类的日常生活之中。