大模型冲浪者的故事 -ks8凯发官方网站

大模型冲浪者的故事
2024-06-20 14:39:40 来源:法人杂志 作者:李辽

◎文 《法人》杂志全媒体记者 李辽

当下,作为大模型企业的从业者,北京瑞泊控股(集团)有限公司(下称“瑞泊”)董事长乙壤月正忙于接待各方来客及出席各种高端论坛和行业峰会,随时分享自己最新的观点和见解,应对日益增长的公众期待。短短一年多时间,伴随着大模型的突然走红,瑞泊从无人关注到成为媒体追逐的焦点,承受着与之前截然不同的压力和挑战。

图片

▲乙壤月 宋逗/摄

同样忙碌的,还有北京网智天元科技股份有限公司(下称“网智天元”)创始人莫倩。尽管网智天元已经是国家级专精特新“小巨人”企业,但随着技术的飞速演进,他和公司正在进行着从大数据分析到大模型的全面转型。如今,他的压力似乎比之前更大,因为大模型背后的潜力与可能性无穷无尽。

图片

▲莫倩 宋逗/摄

等待拐点

莫倩的北京网智天元科技股份有限公司(下称“网智天元”)2007年便已成立,一直在垂直行业提供大数据分析处理的产品和服务。

2017年6月12日,谷歌大脑团队发布了一篇论文,宣告transformer架构的横空出世。这是人工智能圈子里的爆炸性新闻,也是计算机专业出身的莫倩认为最振奋人心的时刻。

彼时,“一带一路”国际合作高峰论坛首次举办后不久,国家急需构建一个具备多元处理能力的大数据平台,对国际舆论进行深入梳理与分析。面对全球26种不同语言的挑战,这个大数据平台必须具备卓越的翻译能力。“当时,传统机器翻译还依赖于统计学方法,但transformer的出现,让我们得以构建一个接近人类认知能力的翻译大模型。”莫倩回忆。

时间紧迫,任务艰巨,莫倩团队开始了紧锣密鼓的项目筹备。竞标时,国内几乎所有从事机器翻译和大数据处理的头部公司都参与其中。网智天元凭借对transformer技术的深刻理解和掌握,实现了弯道超车,击败了包括知名互联网大厂和专业机器翻译企业在内的强劲对手。

这一契机,让网智天元与大模型结下了深厚的缘分,并连续成为“一带一路”国际合作高峰论坛第二届、第三届的服务提供商。回忆起来,莫倩不禁感慨:只有抓住技术拐点,才能在竞争中保持领先。

同样在2017年,乙壤月离开了互联网大厂,创立了瑞泊。凭借对金融资产配置经验的积累,他带领团队选择切入金融行业,专攻金融智能系统研发。由于涉及大量文本和非文本数据,需要运用自然语言处理模型。“于是,我们顺理成章地进入了大模型领域。”乙壤月说,“当时大模型的概念还不为大家关注,所以我们在介绍时自称金融行业的智能决策公司。”

在gpt-3.5发布前,大模型仍然是一条孤独的赛道。“没有多少同行者,甚至没有什么竞争对手。”乙壤月回忆,当时大模型在全球范围内尚未迎来拐点,你不知道这条技术路线何时能获得突破。“毕竟,很多技术即使等一辈子也没能看到突破瓶颈。”

特别是新冠疫情三年,瑞泊陷入了前所未有的困境。“投入全部的精力和资源去打造一家前景莫测的技术公司,周围人都说我们轴,亲朋好友几乎都劝我放弃。”

在摸索期,乙壤月经常扪心自问:“如此巨大的投入,倘若不能成功,是否意味着之前所有的努力与付出都付诸东流?是否应当采用一些更成熟的技术路线去解决问题?毕竟,那些路看起来更平坦、更稳妥。”

2022年11月,open ai发布了gpt-3.5,业内为之沸腾。当乙壤月看到新闻时,甚至有些喜极而泣:“这么多技术门派都在解决同一个问题,但现在只有大模型走出来了,我心里十分自豪。”他由衷觉得,做一家技术公司是需要信仰的,而信仰就是,相信团队、相信内心的判断。

深耕垂类

通过深入分析,乙壤月认为,在通用大模型的赛道上,中国在算力芯片供应等多方面受到制约,算力与美国相比存在差距,但在垂类大模型的发展上,主要国家几乎都在2023年上半年开始密集布局。“从时间维度看,中国并没有落后,同时,中国产业多样、配套完善,拥有极为丰富的应用场景,这些都是发展垂类大模型的显著优势。只要我们能够洞察并充分利用这些优势,就不会弱于美国。”

此外,虽然通用大模型吸引了众多目光,但它更多面向普通民众,并不能解决企业和行业面临的具体问题。“如果我们深耕垂类大模型,不仅能为国家和社会创造更大价值,同时自身的机会也会更多。”

乙壤月举例,如果让通用大模型撰写一篇医疗或金融领域的专业文章,它所依赖的往往是书本或互联网上的公开资料,而这些资料在实际工作中缺乏足够的专业性。在行业和企业中应用的大模型,需要经过特定的训练和优化。“通用大模型好比是通才,而垂类大模型则相当于专业领域的专家。”他说。

莫倩也做了同样的选择。在选择长期深耕的方向时,他认为通用大模型的竞争非常激烈,算力投入巨大,虽然自己的公司已具备一定规模,但长期承受如此巨大的资金压力很不现实。“大模型发展一日千里。”他说,“往往投入巨资,耗时数月甚至数年研发出一个满意的模型,但可能不出一个月,别人就训练出了一个更好的模型。”

因此,他选择与行业巨头合作,专注于开发细分场景的垂类大模型。凭借过去10年在金融大数据服务领域积累的丰富数据,网智天元成为了华为、阿里、移动和电信等企业开发金融风险大模型的唯一凯发app官网登录的合作伙伴。

瑞泊同样在金融领域发力。“譬如,为高净值人群进行资产配置时,需要考虑股票、私募、公募、债券等多种投资工具。通用大模型和垂类大模型的差别,在这种情况下就非常明显。后者可以根据每个人的具体需求,量身定制资产配置方案。”

如今,瑞泊还切入了航运行业,就拿很简单的翻译来讲:“如果使用互联网大厂的通用大模型翻译一篇普通文章,效果尚可以保证,而一旦涉及航运这样的专业领域,通用大模型在处理许多专有名词和术语时就显得力不从心。”

未来畅想

大模型火了,乙壤月的重负有所减轻,但压力仍如影随形。“我们不断见证重大的技术突破和发现,同时迎来了各种重大的商业合作机遇。我们现在要承受的是任务交付的压力和面对外界对我们的高期待。”业内仍在不断涌现新兴技术路线,是否应该跟进?他坦言,这些决策的压力并不比以前轻松。

大模型迭代迅速的同时,瑞泊也处于快速的发展之中。今年,瑞泊对自己的定位进行了升级。“去年,大家都说我们是大模型企业,现在我们把自己定位为关键行业的超脑构建者。”

乙壤月进一步阐释,所谓的超脑,即超级大脑。“虽然大模型功能强大,但仍有其局限性。例如,在数值计算上可能出错,也会有模型幻觉问题。大模型只是超脑的一个组成部分,我们的建设目标是如何规避大模型的短板,同时最大化其优势。”

他用一个更加形象的比喻来说明:“就像出去打仗,你需要的是一支完整的部队,而不是一位将军。大模型就像这位将军,虽然能力出众,但无法代替整个部队。超脑就像部队,用多种技术、多个核心部件的组合打造行业ks8凯发官方网站的解决方案,能够满足企业多方面、多角度的需求。”

莫倩则提出了全域智能的概念。他认为,人工智能发展到终极阶段必将成为全域智能。“人工智能的第一层是信息智能,但其受限于网络这个虚拟世界;第二层是认知智能,它能够与人互动,改变人的认知和情感。如同网智天元正在研发一款能够与儿童互动的玩具,能模拟父母的声音,长时间陪伴儿童,正是认知智能的体现。”他说,第三层则是具身智能,即机器能够与物理世界进行交互,就像电影《非诚勿扰3》中所描绘的场景。

他认为,全域智能将为人工智能打开无限可能性,将重新洗牌所有赛道,消融你熟悉的一切,对现有的格局进行彻底的颠覆,“那一天很快就会到来”。

编审|渠 洋

责编|白 馗

校对|张波 张雪慧

编辑:刘晓莹
网站地图