ChatGPT的火热让投资人群体今年开年后密集出差。通过观察,创新工场执行董事兼前沿科技基金总经理任博冰发现现状“挺有意思的”。各个领域的创业者都在进入这个领域,有时有些人会讲一些自己都不一定能够实现的故事,而冷静的创业者们已经根据新能力的体现,在尝试和摸索过程中得到更好的结论和路径。
对于国内人工智能公司而言,恐惧者有之,焦虑者有之,看到机遇准备打场翻身仗的亦有众多。多位接受第一财经记者采访的从业者表示,OpenAI为人工智能的火热创造出新的机遇,但中国公司需结合自身特点与国情,走出不一样的“活路”。
AI 2.0拐点来临
虽然GPT-4训练运行呈现出更强的稳定性,产生的错误答案更少,但有时也会产生不准确或不相关的回答。OpenAI表示,与之前的GPT版本相比,GPT-4存在类似局限,目前仍然不完全可靠,它容易产生“幻觉”,产生推理错误。以及,“GPT-4通常缺乏对大部分数据被切断后(2021年9月)发生事件的了解,也没有从经验中吸取教训。”“它有时会犯一些简单的推理错误,接受用户的明显虚假陈述。有时它也会像人类一样在棘手的问题上失败,比如在它生成的代码中引入安全漏洞。”OpenAI方面表示。
对于此次GPT-4发布所带来的行业震动,Forrester分析师卢冠男对第一财经表示,技术方面,由于 OpenAI目前披露的技术信息有限,这无疑增加了其他技术厂商与其竞争的难度;工程实现方面,得益于OpenAI与微软的合作而获得的超算资源,使得 OpenAI能和其他不具备算力优势的企业拉开差距;商业化方面,微软与 OpenAI的紧密合作能够更好地帮助 OpenAI构建生态。
上述多方面的优势叠加先发优势,使得OpenAI的进展速度超越其他所有同类公司。卢冠男称,讨论技术层面差距时,一方面是关注中美差距,另一方面是关注在这一领域的科技公司与 OpenAI的差距。不仅是中国公司,美国的科技公司也没法做到同时在技术和商业层面追赶上 OpenAI。虽然这不是短期能改善的,但长期来看,特别是结合具体应用场景后,中国企业仍然具备追赶的空间。
任博冰对第一财经记者表示,此次GPT-4在多模态上虽然没有超出预期的颠覆,但在能力质量上大幅提升,且在工程上给出了新的启发,能够支撑大批高质量的AI 2.0产品的爆发。
在创新工场董事长兼首席执行官李开复看来,深度学习取得重大突破后,AI已经来到从1.0迈入2.0的拐点。多模态、巨型数据集的飞速发展,AI优化目标函数及训练模型的技术方法将大幅精进,能更好地模拟人类的认知智能。此外,AI2.0将会带来平台式的变革,改写用户的入口和界面,诞生全新平台催生新一代 AI 2.0应用的研发和商业化。
李开复所定义的AI 1.0是以CNN卷积神经网络模型为核心的计算机视觉技术,拉开AI 感知智能时代的序幕,AI1.0 也遇到了瓶颈,大多数行业想利用AI需要花费巨大的成本来收集和标注数据,而这些数据集和诸多模型各成“孤岛”缺乏纵效。这也是为什么大部分AI 1.0 企业投入大笔研发经费但仍然长年亏损。除此之外,AI 1.0 缺少像互联网时代Windows与Android一样的规模化能力,来降低应用开发的门槛,打造完善生态链。几年下来,AI 1.0 尚未真正实现商业上的成功。
而AI 2.0 的巨大跃迁在于克服了前者单领域、多模型的限制,可以用无需人工标注的超级海量数据去训练一个具有跨领域知识的基础大模型(Foundation Model),通过微调等方式适配和执行五花八门的任务,真正有望实现平台化的效应,进而探索商业化的应用创新机会。
AI 2.0 的机会在哪里?
李开复认为,AI 2.0 时代的第一个现象级应用是生成式 AI(Generative AI),也就是国内流行的AIGC。生成式 AI 能够实现无需标注的自监督学习,让AI从“辅助”人到逐步“替代”人,如AI与搜索引擎、电商/广告、金融、医疗、元宇宙/游戏、影视/娱乐等行业的结合等。
目前,国内外包括微软、谷歌、腾讯、百度等巨头厂商先后公布在生成式AI领域的布局。如据记者了解,此前腾讯已在AI大模型(预训练大模型)方面备有腾讯混元AI大模型,覆盖NLP(自然语言处理)、CV(计算机视觉)、多模态等基础模型和众多行业/领域模型。
腾讯云副总裁、腾讯云智能平台负责人李学朝表示,目前AI行业已经进入深水区,过去客户群体可能有一些单点应用就足够,但现在他们会更强调AI在自身业务场景下是否真的解决问题了。也有一部分客户开始通过购买企业技术能力,来搭建自身AI平台与应用,培养自身研发实力。再往下走的话,李学朝认为行业会深挖垂类应用——如智能客服、语音助手,或数智人等。
无论如何,焦虑感已经在中国产业界蔓延。旷视科技联合创始人兼CEO印奇表示,整体来说,中国AI行业已经算挺争气了。其次,美国在中国最为人所熟知的除了大厂之外,就是DeepMind和OpenAI,美国在纯技术创新方面确实有更大的资金量,且长期投入,而中国AI公司仍面临相对短周期商业化的压力。
从务实角度来看,印奇称,中国AI公司不可能具备类似OpenAI和DeepMind的研发条件。因此,中国企业一方面要用最艰苦朴素与节约的方法做技术科研。其次,别有幻想,在中国AI公司想活得长必须要商业化。印奇表示,“这是个既要也要的事情,大家对中国AI公司不用太苛责,他们已经挺努力了。”
作为从科研侧转型至业务侧的创业者,澜舟科技创始人兼CEO周明认为创业公司的长板是能够快速迭代,落地容易,短板便是GPU资源与人力成本需要考虑,不适合追风大模型,过早将钱烧没了,“千亿万亿的成本别说小公司,BAT也烧不起这么多钱。”
其次,周明表示,需审时度势,先花几千万元人民币的价格训练出百亿或千亿参数的模型,这是初创公司可承受的,再为客户点对点地提供服务,进行业务落地,“不要想着将所有能力都做到极致后再去挣钱,不需要全面超越OpenAI,找到自己的发展空间再滚雪球到其他领域,甚至研发更多AGI(通用人工智能)能力也是可期待的,但路要一步步地走。”周明称。
印奇认为,国内行业还是需要有极强的危机感,GPT4到5还有更多技术迭代。GPT3.5是更重要的节点,至少可以让行业建立共同的基准线,未来无论是应用还是技术创新也都有感觉。如果是GPT4到5的程度,行业投入至少是一个跨越10亿美元起跳的差距,门槛较高。
中美之间有差距但可追赶
经过多方考察,任博冰也认为真正优秀的项目在这个阶段非常少,但任博冰相信在一段时间的发酵以及创业者之间碰撞、试错之后,有些行业新的需求会诞生,“只不过现在的时间点早了些”。
另外,任博冰称,国内整体在应用层与模型层的公司越来越多了,虽然相对来说美国创业公司冒出头的速度更快一些——近乎每天都有十个,国内稍微少一点。但中国创业者在产品创新层面的能力完全不亚于美国创业者,在面临不同路径选择方面——如可控性这件事上,美国公司也并没有给出更好的解决方案。
作为人工智能三大基石——算法、算力、数据,算力问题一直被行业认为在制约中国企业追赶的核心因素,行业已尝试通过多种方式进行缓解。
在算法领域,腾讯将混元等大模型的相关能力用在产业场景中,通过腾讯云TI平台对外输出能力,方便客户自己做数据训练,目前已有八个行业超过五十家用户使用了这个能力。在工业领域,富驰高科算了一笔账,通过TI平台,工作效率是原来人工的20倍,在机器持续满载生产的情况下,一年可为公司节省数千万元成本。在算力领域,腾讯云异构计算产品负责人宋丹丹表示,紫霄是腾讯面向AI推理场景的自研芯片,沧海是腾讯自研的视频编解码芯片,目前先在自研业务上部署。
宋丹丹表示,每家AI公司都有核心的算法与模型,云厂商可提供的方案如通过模型分层或降低时延,减少重复调用,做到训练成本与推演成本的降低,将算力更多地释放到应用层。比如云原生的架构非但不会制约AI工程化进程,反而会助推,让AI落地应用越来越快。
下游领域,任博冰认为中美差距很大,完全照搬美国利用API接口的方式在中国并不完全适用,中国消费者的基数、使用习惯,近些年在企业市场发展出不同的走向。
以To B行业为例,周明表示,很多中国企业不接受SaaS的形式,而选择本地化部署,因为他们存在不将数据拿出来的自身理由。而一旦本地化部署,便意味着要花更多成本——包括了解客户需求,承担项目交付与维护的成本等。一旦公司模型本身就很脆弱,便意味着做一个项目赔一个项目。所以中国公司必须先将底座做好,对用户进行统一了解,且具备快速迭代的能力,这都是中国企业做大模型必须面对的现实,“快速复制一个ChatGPT然后快速赚钱的想法,我个人认为非常幼稚。”周明表示。
如果要从AI去颠覆之前的产品,任博冰认为创业者需谨慎思考之前哪些领域的产品做得好,哪些要素是不能解决的。如果要做一个新的产品,无论是To C还是To B,要小步快跑地去验证和试错,这里面需要的还是大胆想象。目前行业内还没有创业者真的利用AI技术去尝试没人走过的方向,美国也没有,未来几年可能会有重新定义新的内容生态、新的工艺形态出现。
周明表示,ChatGPT得到了很好的“包装”,体现出大模型与通用能力,以及AGI的产业力。但中国企业会走出中国特色,如每个功能做到更加可控、To B落地方面走在ChatGPT前面等,甚至形成所谓武林派别中的“中国派”,将中国特色发挥到极致。这是行业目前需要思考的问题。