从技术角度来看,国内的AI研发领域在基础理论、算法研究、语料库及技术人才等方面相对滞后,所以,要在短期内达到ChatGPT的水准存在很大的难度。不久的将来,市场上肯定会出现一批GPT的复制品,但要达到真正实用应该需要2—3年,但是那个时候OpenAI更进步了。因此,本书认同法国里昂商学院人工智能管理学院(AIM)院长、全球商业智能中心(BIC)主任龚业明的观点,这里引述如下:
大模型的训练和推理成本一直以来是AI产业发展的瓶颈,因此具有大模型构建能力的企业往往是世界科技巨头。这会形成强大的护城河,造成强者恒强的局面。
第一,就语料库而言,语料库的构建和获取也许不是特别费劲,但是语料的标注与理解工作比较繁复。目前,有很多人工智能专家还认为中文语料质量会影响国产大模型的发展。语言学的长期研究告诉我们,语料库的构建最好不能只局限于简体中文语料库,要能理解多种语言,才能构建一流的中文语料库。所以,不要认为靠人海战术和低人力成本建一个简中语料库就能解决语言学问题。
第二是算法。GPT对算法的要求特别高。算法要能容纳和分析大数据,个别国产大语言模型出现了过载问题,就是算法处理不了更大的数据,或增加了数据后服务质量没提高。
第三是运算量。GPT需要高端显卡和高端芯片。在目前的国际环境中,并不是所有我国企业都能获取足量的高端显卡和高端芯片。同时,运算量也要求较高的投资。诚然,很多国内厂商对ChatGPT有兴趣,但是他们的兴趣点也很多,跟风投机性强,无法像OpenAI那样全力以赴,意志坚定。
第四,短期内很不容易找到GPT的领军人才。
另外,从商业模式角度分析,国内缺乏明确的前瞻性生态与商业布局。现在出现了ChatGPT这样的产品,国内也会出现很多的公司、机构,但在技术路径的复制上,由于缺乏基础模型积累和大量的训练数据来源,所以复制难度较大。OpenAI在很多年前就理解了GPT的价值,到现在别人已经做出来,我们才知道该这样发展,才理解其中的商业价值,就慢了点。